混乱している主張

統計学の大家である三重大学の奥村晴彦教授のサイトで、血液型の統計解析があることを見つけました。

 

 話題: B型の彼氏 / 血液型と性格の無関連性 / またまた血液型と性格

奥村教授が作成した次のグラフ(Persistence=継続)を見るとわかりますが、血液型の傾向どおり「A型が最も忍耐強い」「B型が最も飽きっぽい」「O型もその次に飽きっぽい」という結果になっています。

 

※点がその血液型の値で、誤差の推定範囲は点から上下に伸びる実線で示されています。

奥村教授は、これは「偶然である」として、こう書いています。

論文では年齢・性別でコントロールしたMANCOVAが使われているが,年齢・性別がわからないので,ここでは単なるMANOVAを使ってみる: 

いずれも有意ではない(Pillai 以外の方法については manova() のマニュアル参照)。

確かに、最初と2番目の赤の下線にあるように、遺伝子型(Blood types)も表現型(ABO)もp>0.05ですので有意ではありません。

 

しかし、この数字は間違っているのです。なぜなら、一番下の赤の下線にあるように、なぜか「Pillai 以外の方法」の値の記述がなく、元の(土嶺さんの)論文では有意になったRoy's Largest Rootの値を採用していないからです。

 

※元の論文にはRoy's Largest Root がp=0.001で有意とあります。

 

下に、私が教授と同じ方法でフリーソフトのjamoviを使って計算した結果を示します(欠損値を除いた1435サンプルで計算)。

確かに、Pillai's Traceこそ奥村教授と同じp=0.282となっていますが、Roy's Largest Root は、p=0.002ですから有意水準0.05よりはるかに小さく、文句なく有意となります。

 

よって、奥村教授の「偶然である」という判断は否定されることになります。

ということで、奥村教授の次の文章、

慣習的な統計的検定を使う際には,多重比較に陥らないように注意すべきである。この論文のように変数が7個もある場合は,全部をまとめた検定(上の例ではMANCOVAやMANOVA)をまず行い,それが有意にならなかったら,個々の変数についての検定は参考程度にとどめる。

は間違っていて、MANOVAがp=0.002で有意なのですから、Persistenceに有意な差があることは確定と考えていいことになるでしょう。

結局、奥村教授の言う、差が出たのは「偶然」だという主張は、現実のデータで否定されてしまうのです。

 

※Roy's Largest Rootだけが他の3つの値と大きく違う理由は、最後の補足説明を読んでください。

 

致命的な間違い🆖

実は、奥村教授のこのサイトには、もう一つ致命的な間違いがあります。

それは、この部分です。

特に日本や韓国など血液型性格判断を信じる人が多い国では,性格テストに現れる性格は,血液型に影響されてしかるべきである。「□型の性格は○○である」と聞いて育った□型の人は「自分の性格は○○だ」という先入観を持ち,性格テストでもそのように答える傾向があってもおかしくない。

しかし、「性格テストに現れる性格は、血液型に影響されてしかるべきである」なら、仮に性格指標で差が出ていないとしても、それは「見かけ」だけで、本当は差が出ているはずです。よって、有意差に関係なく帰無仮説は棄却されることになります。

 

統計の専門家だから、かえって「血液型と性格」を誤解するのかもしれませんね。帰無仮説が無意味なんて、普通は考えないですからね(笑)。

 

このように、血液型は「統計の常識」をことごとく否定してしまうのです。

遺伝子が性格に与える影響を直接的に研究しているケースはほとんどないはずなので、こんな奇妙なことが起きても特に不思議ではないのかもしれません。

 

現時点では、真相は神のみぞ知る…というところ、ですかね?

 

誰かが一刀両断に謎を解き明かしてくれないでしょうか…。

2019.10.5更新

 

補足説明

ところで、なぜRoy's Largest Rootだけ極端にp値が小さいのでしょうか。

 

MANOVAでは、p値を計算するのに、擬似的なF分布を使います。

細かい解説は省略しますが(判らないとも言います…💦)、従属変数ごとに固有値λを計算し、このλの値が大きいほど(逆数の場合は小さいほど)p値が小さくなります。

 

 

出典:心理統計法-多変量分散分析(1)

 

では、具体的にMANOVAの4つの値

  • Pillai's Trace
  • Wilks' Lambda
  • Hotelling's Trace
  • Roy's Largest Trace

はどうやって計算するのでしょうか。

 

私が一番わかりやすかったのは、次の英語版Wikipediaでした。

これなら素人でもわかりますね😁。

  • Pillai's Trace
  • Wilks' Lambda
  • Hotelling's Trace

の3つは、すべての従属変数のλの平均値です。

平均値の計算方法には、単純平均、加重平均、幾何平均などのいろいろな方法があります。

 

ところが、Roy's Largest Rootだけはすべての従属変数のλの最大値なのです!

 

土嶺章子氏の論文を読めば明らかなように、TCIの7つの性格因子は、Persistenceだけがかなり小さなp値で有意なものの、残りの6つにはほとんど有意差はありません。

 

これはどういうことかというと、Persistenceだけが有意な場合は、Roy's Largest RootだけがMANOVAの結果で有意になるということです。Pillai's Traceなどの残りの3つは、7つの性格因子の平均値なので、有意差は小さくなるか、消滅するということになるのです。

2019.10.5更新