世論調査のウソを数学で見抜く

Slashdot の Math Indicates Pollster Is Forging Results からのリンク,特に Strategic Vision Polls Exhibit Unusual Patterns, Possibly Indicating Fraud を少し読んでみた。

世論調査会社 Strategic Vision の調査結果の末位の数字(0〜9)の度数分布は 562, 431, 472, 490, 526, 599, 533, 639, 676, 616 である。一様分布からのずれをχ2検定してみると p 値はほぼ 0 であり,でっちあげの数字である可能性がある。

ところが,2008年の上院や大統領選の世論調査の末位の数字の分布は 560, 563, 619, 620, 672, 673, 644, 642, 652, 609 であり,これも一様分布からかなりずれている(p = 0.0066)。

しかも,どちらの分布も,ベンフォードの法則とは逆の傾向を示している。

関連サイトにはたくさんのコメントが付いているようだが,読み切れていない。