血液型と性格の無関連性

はじめに

B型の彼氏にも付記したが,縄田健悟:血液型と性格の無関連性――日本と米国の大規模社会調査を用いた実証的論拠――という論文がTwitterで話題になっていた。

ここでは,このデータを抜き出して,再解析してみる(つもり)。

データの抜き出しは,pdftotext -raw コマンドでテキストにした後,次のような即席Rubyコードを使った:

#! /usr/bin/ruby
# -*- coding: utf-8 -*-

while line = gets()
  if line =~ /([.\d]+)\s+([.\d]+)\s+([.\d]+)\s+([.\d]+)\s+(.+)\s+(.0\d+)/
    print "#{$1},#{$2},#{$3},#{$4},#{$5},#{$6}"
    if (line = gets()) =~ /(([.\d]+)) (([.\d]+)) (([.\d]+)) (([.\d]+))/
      print ",#{$1},#{$2},#{$3},#{$4}"
    end
    puts
  end
end

解析

まず,この論文で計算されている効果量 $\eta^2$ について説明する。例として下の表1の下から3行目の $p = 0.049$ の行を再計算してみる。

まず人数がはっきりしないが,上限と下限の中間をとることにして,人数の表(3行)をコピーして,

n = round(colMeans(read.csv(pipe("pbpaste")))) # Mac
n = round(colMeans(read.csv("clipboard")))     # Win

とすれば n に血液型ごとの人数が求められる。

あとは分散分析の問題。級内の平方和 SS_within と級間の平方和 SS_between を求め,$F$検定する。

SS_within = 1.23^2*(n[1]-1) + 1.22^2*(n[2]-1) + 1.20^2*(n[3]-1) + 1.21^2*(n[4]-1)
y = c(rep(3.45,n[1]), rep(3.45,n[2]), rep(3.67,n[3]), rep(3.47,n[4]))
SS_between = sum((y - mean(y))^2)
1 - pf((SS_between/3) / (SS_within/(sum(n)-4)), 3, sum(n)-4)

これで $p = 0.04572073$ が求められる。論文にある .049 と似た値が出た。

$\eta^2$ は定義により

SS_between / (SS_between + SS_within)

で 0.002758726 が出る。論文にある .0027 と似た値が出た。

この調子で全部やってみると,$p \leq 0.05$ のものが4個あった。実際は3個しかない。やはり人数の不定さがあるので,正確な再現は無理のようである。

ただ,68個中3個にしても4個にしても,期待値 68 × 0.05 = 3.4 と合致するので,血液型の効果はないと考えてよい。

付:データ

表1:2004年日本

人数

人数には幅がある。例えばA型は $1092 \leq N \leq 1104$ といった具合である。下限・上限を並べた。

A,B,AB,O
1092,623,282,881
1104,641,289,897

データ

回答は各項目5件法で「1: 全く当てはまらない」〜「5: ぴったり当てはまる」から選ぶ。血液型ごとの平均,$p$ 値,効果量($\eta^2$),血液型ごとの標準偏差を並べた。

A,B,AB,O,p,eta2,SD_A,SD_B,SD_AB,SD_O
3.37,3.35,3.34,3.32,ns,.0007,0.88,0.87,0.86,0.88
2.65,2.64,2.78,2.73,ns,.0025,0.99,1.05,1.05,0.99
2.83,2.91,2.87,2.90,ns,.0013,0.90,0.84,0.95,0.86
3.50,3.53,3.42,3.53,ns,.0011,1.03,0.99,1.02,1.01
3.33,3.26,3.35,3.31,ns,.0007,1.06,1.06,1.09,1.09
2.78,2.76,2.80,2.81,ns,.0004,0.93,0.94,0.92,0.93
3.03,3.02,2.99,3.00,ns,.0002,0.96,0.92,0.97,0.99
2.28,2.25,2.24,2.31,ns,.0007,0.91,0.92,0.91,0.90
2.79,2.75,2.72,2.73,ns,.0005,1.28,1.24,1.30,1.22
2.55,2.60,2.58,2.65,ns,.0018,1.04,1.02,1.11,1.03
3.62,3.62,3.64,3.63,ns,.0000,1.23,1.22,1.25,1.22
3.26,3.25,3.34,3.22,ns,.0010,1.04,1.01,1.13,1.05
1.74,1.74,1.82,1.74,ns,.0005,1.11,1.09,1.14,1.10
2.68,2.77,2.71,2.69,ns,.0012,1.00,1.01,0.98,0.97
2.23,2.20,2.24,2.25,ns,.0004,0.94,0.92,0.87,0.92
3.28,3.29,3.45,3.30,ns,.0016,1.20,1.18,1.16,1.18
2.68,2.64,2.61,2.64,ns,.0004,1.04,1.05,0.99,1.02
3.63,3.69,3.71,3.62,ns,.0011,1.00,0.99,1.03,1.03
3.45,3.45,3.67,3.47,.049,.0027,1.23,1.22,1.20,1.21
2.12,2.18,2.18,2.11,ns,.0010,1.00,1.01,1.01,0.96
2.67,2.70,2.67,2.71,ns,.0003,0.98,0.96,1.03,0.92

表2:2005年日本

人数

A,B,AB,O
1411,821,344,1054
1433,831,353,1077

データ

A,B,AB,O,p,eta2,SD_A,SD_B,SD_AB,SD_O
3.38,3.39,3.37,3.34,ns,.0004,0.87,0.88,0.86,0.87
2.67,2.64,2.67,2.69,ns,.0003,1.03,1.03,1.01,1.04
3.40,3.38,3.39,3.46,ns,.0009,1.04,1.01,1.01,1.01
3.36,3.31,3.34,3.29,ns,.0007,1.07,1.09,1.04,1.10
2.80,2.78,2.79,2.79,ns,.0001,0.92,0.95,0.91,0.97
2.98,2.93,2.92,2.97,ns,.0008,0.95,0.92,0.95,0.96
2.26,2.22,2.23,2.25,ns,.0003,0.92,0.91,0.86,0.93
2.67,2.64,2.79,2.70,ns,.0011,1.25,1.23,1.32,1.24
2.63,2.55,2.66,2.64,ns,.0014,1.01,1.04,1.04,1.06
3.59,3.59,3.61,3.65,ns,.0006,1.22,1.19,1.24,1.20
3.25,3.23,3.27,3.26,ns,.0002,1.07,1.08,0.99,1.06
1.76,1.73,1.78,1.76,ns,.0001,1.10,1.10,1.07,1.10
2.68,2.71,2.74,2.70,ns,.0003,1.00,0.97,0.95,1.00
2.25,2.23,2.21,2.24,ns,.0002,0.92,0.93,0.90,0.92
3.31,3.22,3.33,3.29,ns,.0009,1.20,1.20,1.18,1.20
2.57,2.54,2.53,2.57,ns,.0003,1.02,1.02,1.00,1.06
3.61,3.58,3.59,3.62,ns,.0003,1.03,1.04,1.10,1.06
3.47,3.50,3.65,3.51,ns,.0018,1.20,1.21,1.16,1.23
2.12,2.08,2.13,2.11,ns,.0004,0.97,0.97,0.98,0.97
2.70,2.66,2.65,2.70,ns,.0005,0.97,0.94,0.90,0.98
3.16,3.15,3.21,3.18,ns,.0004,0.86,0.82,0.79,0.85
3.18,3.20,3.24,3.24,ns,.0012,0.80,0.80,0.77,0.76
3.58,3.49,3.54,3.51,ns,.0020,0.85,0.84,0.81,0.84
3.62,3.59,3.65,3.66,ns,.0008,0.94,0.91,0.92,0.92
3.63,3.56,3.67,3.58,ns,.0016,0.92,0.93,0.91,0.94
3.56,3.52,3.56,3.58,ns,.0006,0.89,0.91,0.92,0.89

表3:2004年アメリカ

人数

A,B,AB,O
1013,448,221,1345
1032,457,228,1370

データ

A,B,AB,O,p,eta2,SD_A,SD_B,SD_AB,SD_O
3.83,3.77,3.75,3.74,ns,.0015,0.88,0.87,0.86,0.88
3.70,3.73,3.87,3.66,.034,.0028,0.99,1.05,1.05,0.99
3.02,3.07,3.11,3.01,ns,.0007,0.90,0.84,0.95,0.86
3.15,3.15,3.24,3.13,ns,.0005,1.03,0.99,1.02,1.01
2.84,2.83,2.83,2.77,ns,.0008,1.06,1.06,1.09,1.09
2.58,2.61,2.59,2.60,ns,.0001,0.93,0.94,0.92,0.93
3.63,3.58,3.68,3.62,ns,.0004,0.96,0.92,0.97,0.99
2.89,2.98,2.99,2.95,ns,.0008,0.91,0.92,0.91,0.90
2.98,3.14,3.13,3.03,ns,.0017,1.28,1.24,1.30,1.22
3.36,3.41,3.26,3.35,ns,.0007,1.04,1.02,1.11,1.03
2.95,2.98,2.73,2.97,ns,.0020,1.23,1.22,1.25,1.22
2.87,2.99,2.81,2.89,ns,.0014,1.04,1.01,1.13,1.05
3.05,3.05,3.03,3.09,ns,.0002,1.11,1.09,1.14,1.10
2.16,2.19,2.19,2.17,ns,.0002,1.00,1.01,0.98,0.97
1.85,1.82,1.92,1.88,ns,.0007,0.94,0.92,0.87,0.92
2.94,2.91,3.05,2.97,ns,.0007,1.20,1.18,1.16,1.18
2.07,1.98,2.05,2.01,ns,.0008,1.04,1.05,0.99,1.02
2.78,2.83,2.78,2.70,ns,.0013,1.00,0.99,1.03,1.03
3.37,3.40,3.15,3.26,.027,.0030,1.23,1.22,1.20,1.21
2.65,2.62,2.68,2.65,ns,.0001,1.00,1.01,1.01,0.96
2.85,2.81,2.84,2.82,ns,.0002,0.98,0.96,1.03,0.92

追加分析

縄田健悟先生のサイトに追加分析として「血液型と職業の関連」などが掲載されていた。

表,分類,A型,B型,AB型,O型,p
血液型と職業の関連 (2004日本),事務職,128,87,28,120,0.25
血液型と職業の関連 (2004日本),販売職,75,40,16,60,0.9
血液型と職業の関連 (2004日本),管理職,106,58,17,75,0.31
血液型と職業の関連 (2004日本),専門的・技術的職業,122,78,36,100,0.81
血液型と職業の関連 (2004日本),サービス職,94,63,30,78,0.63
血液型と職業の関連 (2004日本),現業職,98,44,23,77,0.59
血液型と職業の関連 (2004日本),農林漁業,28,15,8,16,0.68
血液型と職業の関連 (2004日本),主婦・主夫(パートタイム従業者),122,64,37,96,0.69
血液型と職業の関連 (2004日本),主婦・主夫(無職の),221,124,52,175,0.95
血液型と職業の関連 (2004日本),学生,11,9,2,7,NA
血液型と職業の関連 (2004日本),引退(主婦・主夫を除く),52,16,13,41,0.15
血液型と職業の関連 (2004日本),失業(主婦・主夫を除く),18,12,7,14,0.77
血液型と職業の関連 (2004日本),その他,17,12,11,14,0.07
血液型と職業の関連 (2005日本),事務職,195,107,33,144,0.24
血液型と職業の関連 (2005日本),販売職,95,53,20,70,0.93
血液型と職業の関連 (2005日本),管理職,117,73,26,77,0.6
血液型と職業の関連 (2005日本),専門的・技術的職業,152,96,48,126,0.5
血液型と職業の関連 (2005日本),サービス職,130,74,37,101,0.87
血液型と職業の関連 (2005日本),現業職,129,67,35,94,0.81
血液型と職業の関連 (2005日本),農林漁業,40,19,14,25,0.37
血液型と職業の関連 (2005日本),主婦・主夫(パートタイム従業者),166,89,44,123,0.89
血液型と職業の関連 (2005日本),主婦・主夫(無職の),242,143,66,203,0.64
血液型と職業の関連 (2005日本),学生,14,16,3,11,NA
血液型と職業の関連 (2005日本),引退(主婦・主夫を除く),80,31,9,47,0.052
血液型と職業の関連 (2005日本),失業(主婦・主夫を除く),22,20,3,14,0.15
血液型と職業の関連 (2005日本),その他,28,23,9,18,0.36
血液型と職業の関連 (2004米国),Office worker,136,50,27,149,0.41
血液型と職業の関連 (2004米国),Shop worker,19,11,5,34,0.76
血液型と職業の関連 (2004米国),Managerial post,108,47,30,156,0.6
血液型と職業の関連 (2004米国),Specialists/Technical posts,242,106,49,316,0.98
血液型と職業の関連 (2004米国),Worker in the Service industry,43,32,14,79,0.12
血液型と職業の関連 (2004米国),Field worker,47,24,16,66,0.42
血液型と職業の関連 (2004米国),"Agriculture, forestry and fisheries industry",3,3,3,5,NA
血液型と職業の関連 (2004米国),Housewives/Househusbands (part-time workers),23,14,6,32,0.77
血液型と職業の関連 (2004米国),Housewives/Househusbands (unemployed),76,38,8,93,0.16
血液型と職業の関連 (2004米国),Student,44,13,14,55,0.22
血液型と職業の関連 (2004米国),Retired,167,54,25,221,0.08
血液型と職業の関連 (2004米国),Unemployed,30,19,6,47,0.59
血液型と職業の関連 (2004米国),Other,25,11,3,26,0.66
血液型と勤務形態の関連 (2004日本),会社員・団体職員,376,213,86,313,0.83
血液型と勤務形態の関連 (2004日本),公務員,51,35,17,50,0.67
血液型と勤務形態の関連 (2004日本),会社経営者・役員,38,32,10,38,0.53
血液型と勤務形態の関連 (2004日本),自営業主,94,66,25,76,0.7
血液型と勤務形態の関連 (2004日本),家族従業員(自営業の),63,25,14,33,0.12
血液型と勤務形態の関連 (2005日本),会社員・団体職員,506,266,105,376,0.26
血液型と勤務形態の関連 (2005日本),公務員,71,44,26,65,0.36
血液型と勤務形態の関連 (2005日本),会社経営者・役員,54,44,18,31,0.04
血液型と勤務形態の関連 (2005日本),自営業主,126,83,38,101,0.69
血液型と勤務形態の関連 (2005日本),家族従業員(自営業の),65,37,18,49,0.98
血液型と勤務形態の関連 (2004米国),Company employee/Organization staff,446,190,116,546,0.48
血液型と勤務形態の関連 (2004米国),Government employee,131,59,25,196,0.29
血液型と勤務形態の関連 (2004米国),Businessman/Director,29,10,5,41,0.71
血液型と勤務形態の関連 (2004米国),Self-employed,73,35,20,110,0.86
血液型と勤務形態の関連 (2004米国),Family business employee (in self-employed business),15,12,6,28,0.44
血液型と業種の関連 (2004日本),農林業,27,16,6,13,0.44
血液型と業種の関連 (2004日本),鉱業,1,1,0,3,NA
血液型と業種の関連 (2004日本),建設業,61,38,17,62,0.6
血液型と業種の関連 (2004日本),製造業,111,67,30,105,0.63
血液型と業種の関連 (2004日本),卸売業・小売業,85,52,18,65,0.94
血液型と業種の関連 (2004日本),金融・保険業,27,11,2,19,0.32
血液型と業種の関連 (2004日本),不動産業,9,2,1,5,NA
血液型と業種の関連 (2004日本),運輸・通信業,32,19,7,26,0.996
血液型と業種の関連 (2004日本),電気・ガス・水道・熱供給業,10,7,2,16,NA
血液型と業種の関連 (2004日本),サービス業,159,84,34,103,0.38
血液型と業種の関連 (2004日本),その他,110,79,34,91,0.41
血液型と業種の関連 (2005日本),農林業,36,18,12,24,0.67
血液型と業種の関連 (2005日本),鉱業,2,1,0,1,NA
血液型と業種の関連 (2005日本),建設業,92,49,22,56,0.69
血液型と業種の関連 (2005日本),製造業,139,74,41,123,0.32
血液型と業種の関連 (2005日本),卸売業・小売業,111,59,25,76,0.92
血液型と業種の関連 (2005日本),金融・保険業,28,20,2,24,0.18
血液型と業種の関連 (2005日本),不動産業,8,4,2,7,NA
血液型と業種の関連 (2005日本),運輸・通信業,40,24,12,33,0.95
血液型と業種の関連 (2005日本),電気・ガス・水道・熱供給業,17,11,2,21,0.19
血液型と業種の関連 (2005日本),サービス業,196,123,41,151,0.45
血液型と業種の関連 (2005日本),その他,163,88,49,105,0.29
血液型と業種の関連 (2005米国),Agriculture and forestry industry,9,2,3,14,NA
血液型と業種の関連 (2005米国),Mining industry,0,0,0,1,NA
血液型と業種の関連 (2005米国),Construction industry,30,15,8,33,0.73
血液型と業種の関連 (2005米国),Manufacturing industry,64,25,10,75,0.58
血液型と業種の関連 (2005米国),Wholesale/Retail business,72,22,21,73,0.15
血液型と業種の関連 (2005米国),Financial/Insurance business,48,15,19,63,0.13
血液型と業種の関連 (2005米国),Real estate business,11,3,5,3,NA
血液型と業種の関連 (2005米国),Transport/Correspondence industry,24,18,3,35,0.12
血液型と業種の関連 (2005米国),Electric/Gas/Water/Heat supply industry,8,4,5,19,NA
血液型と業種の関連 (2005米国),Service industry,163,69,31,212,0.58
血液型と業種の関連 (2005米国),Others,258,122,66,374,0.65

$p$ 値は縄田先生による。50人以下の分類は $p$ 値が NA になっている。この度数分布は次の通りで,$p < 0.05$ は1個しかない。偶然レベルといえる。


Last modified: