『「情報」を学び直す』

県立図書館で石井健一郎『「情報」を学び直す』(NTT出版,2007年)を見つけて借りてきた。この本では情報を,事前確率を事後確率に変化させるものとして説明している。要はシャノンの定義通りであるが,モンティ・ホール問題などとからませて,確率の考え方から丁寧に説明している。その過程で,火星に生物がいる確率といった主観的確率も認めるのが合理的であることを示している。

例えば,当たりが1本ある100本のくじを最初に引いて当たる確率は1/100である。では,次に(最初の人の結果を見ないで)別の人がさらに1本引いて外れだったとすれば,最初の人が当たる確率はどうなるか。第2の人が外れであるという情報が第1の人の当たりの確率を変えるはずであるが,1/100と答えてしまう学生が多いという。モンティ・ホール問題はこれと違って第2の人が答えを知っていてわざと外れのドアを開けるだけであるから,その結果は情報を持たず,最初に決めたドアが当たる確率は変わらない,というのがおおざっぱな説明である(この本にはもっと丁寧に書いてある)。

鮭の頭と多重比較

死んだ鮭の頭のfMRI解析,以前に書いたブードゥー相関と似た話。多重比較はよほど注意しないと,何もないところから統計的に有意な結果が出てしまうことを皮肉った研究。

易しく解説すると,たとえば偶然では 1/20 の確率でしか起きないことが起これば単なる偶然ではなく何か原因があると考えるとする。これは性格テストのある項目と血液型との相関でもいいし,fMRI(脳の活動分布などを実時間で調べる装置)の一つのボクセル(体積素)の値でもいい。性格テストが n 項目あったり,ボクセルが n 個あったりすれば,確率 p の事象が起こる回数の期待値は np である。これは事象が独立であるかどうかによらない。全体として起こる回数の期待値 1/20 を維持するには,個々の確率は 1/(20n) でなければならない。言い方を換えれば,有意水準 p = 0.05 を維持するには,5個の値を調べるなら1個あたりの有意水準を p = 0.01 にしなければならない。このような考え方をボンフェローニ(Bonferroni)の方法という。多重比較の検定にはこれ以外にもいくつかの方法があるが,とりあえずこれを覚えておけば,「血液型と性格検査の何々の項目に有意な相関(p < 0.05)が見られた」といったことを言われたときに「何項目の性格検査を行ったのですか」と聞き返すことができるだろう。冒頭に挙げた鮭の頭の研究でも,この種の方法(FDR,FWER)を使えば誤検出が防げるとしている。

「帰無仮説を採択」?

「アメリカ心理学会では統計的有意度は廃止されたそうです」で紹介した Statistical methods in psychology journals: Guidelines and explanations の Hypothesis tests の項には Never use the unfortunate expression “Accept the null hypothesis.” とイタリック体で強調して書かれている。帰無仮説は棄却することはあっても「採択」してはいけないという注意は英語の文献ではしょっちゅう見かける。実際,Googleで "accept the null hypothesis" を検索すると,同様な注意がたくさん見つかる。

ところが,同じGoogleでも日本語で "帰無仮説を採択" を検索すると,著名な人でもこの表現を普通に使っていることがわかる。どうしてだろう。

手許にあるFisherの The Design of Experiments 第8版の 8. The Null Hypothesis を読み直してみた。

In relation to any experiment we may speak of this hypothesis as the “null hypothesis,” and it should be noted that the null hypothesis is never proved or established, but is possibly disproved, in the course of experimentation.

用語は今と少し違うけれども,棄却することはあっても採択はしないとはっきり書かれている。

このあたりのことを詳しく書くとたいへんなので,あとは良い教科書やGoogleで調べていただきたい。

オフトピ:英語の中に全角のダブルクォートを使っているように見える場合はアポストロフィの悩みを参照されたい。

ニコニコ動画「ネット出口調査」

ニコ動で 第45回衆議院総選挙 ネット出口調査 なるものが行われていたのか。知らなかった。

結果は実際とずいぶん違う。ネチズンの傾向を反映しているのか。

比例区小選挙区
自民33.1%36.1%
民主20.0%23.9%

Derren Brown のマジック

硬い話題が続いたので息抜き。このビデオ,ロッテリーの当選番号を魔術師Derren Brownが実時間で当てたところ。先週放映されてセンセーションを巻き起こした。

『数字に弱いあなたの驚くほど危険な生活』

『数学で犯罪を解決する』 で参照した 大川法律事務所ー主張・コリンズ裁判と訴追者の誤謬 のネタ本として挙げてあったゲルト・ギーゲレンツァー『数字に弱いあなたの驚くほど危険な生活』(吉田利子訳,早川書房,2003年)がたまたま県立図書館にあったので,借りてきた。

邦訳はちょっと品のない題名になってしまっているが,とてもまじめな内容の本で,innumeracy(邦訳では「数字オンチ」)が大きな社会的損失を生じていることへの危機感を持って書かれている。今まで読んだこの手の本の中では最高である。訳文はよくこなれているし,訳語も正確である。強いて言えば,false positive の訳は「偽陽性」で正しいのだが素人はツベルクリンの「擬陽性」と混乱しないかちょっと心配である(よく読めばちゃんと説明してあるが)。

著者の提案は以下のように要約できそうである。例えば「40歳の女性が乳がんである確率は1%,乳がん患者がマンモグラフィーで陽性になる確率は90%,乳がんでないのに陽性になる確率は9%である。陽性の女性が乳がんである確率は?」に答えられる医師は少ない。ところが,「40歳の女性100人のうち1人が乳がんで,乳がんならほぼ確実に陽性になる。しかし,乳がんでない99人のうち9人もやはり陽性になる。つまり陽性は10人で,そのうち乳がんは1人」と説明すれば一般人でもわかる。確率とベイズの定理を教えようとするよりも,このような自然頻度(natural frequencies)に言い換えれば誤解は起きにくいし,母集団もはっきりする。

この原理に基づいて,コリンズ裁判やDNAプロファイリングやモンティ・ホール問題についても明確に解説されている。ただ,原書にあった注と文献が邦訳ではなくなっているのでよくわからないが,DNA鑑定の偽陽性率がちょっと高すぎるように思う(昔の数値かもしれない)。原著も注文しておこう。

「アメリカ心理学会では統計的有意度は廃止されたそうです」

という驚くべき内容の書き込みが群馬大学の青木繁伸先生の掲示板にあるのを見つけた。1999年の書き込みで,ソースは「又聞き」だそうである。もちろん統計的検定が廃止されたという事実はない。以下に少し書くように,いろいろな議論があることは確かであるが,伝言ゲームで「廃止された」という極端な話になるのは,メディアリテラシー(?)の題材としておもしろい。

統計の誤用については,あちこちで議論があり,なかには統計的仮説検定を「廃止」しようというような極端な主張もあることは確かである。そこで,アメリカ心理学会の The APA Board of Scientific Affairs: Task Force on Statistical Inference では,このことを議論し,1996年の Initial report(PDF)に続いて,1999年に最終レポート Statistical methods in psychology journals: Guidelines and explanations を出している(American Psychologist, Vol.54, No.8, 594-604)。この委員会には Mosteller や Tukey もアドバイザとして参加している。

このレポートを読んでみたが,もちろんどこにも統計的検定を廃止するとは書かれていない。まずはグラフを描いてみようといったことから始まって,有意か否かだけよりは p 値を報告するほうがよく,さらには信頼区間を報告するほうがいいというような,良い統計学の教科書には必ず書かれていることがうまくまとめられている。

情報をデザインする

望月俊男先生ご担当の NHK高校講座 | 情報A | 第9回 情報をデザインする,情報デザインがテーマというので見た。高校生たちがWordで自由に文化祭のポスターを作って,それを先生が情報デザインの観点から講評する。あまり深い内容ではなかったが,30分でできることはこんなものだろう。私にとっては,印刷博物館での活版印刷の実演がおもしろかった。

『数学で犯罪を解決する』

『数学で犯罪を解決する』という本が県立図書館にあったので借りてきた。米国のTVドラマ NUMB3RS を解説する形での,数学(特に確率・統計)の啓蒙書である。巻末に訳者の山形浩生さんによる解説があり,それ自身たいへんおもしろい読み物になっているが,専門的な部分はあまり信じないほうがいい。

このブログの一つ前の 足利事件当時のDNA鑑定の精度は? にも関係するDNAプロファイリングの話もある。容疑者のDNA型が一致する場合と,DNAデータベースを探して同じ型が見つかる場合(コールド・ヒット)とでは,確率の捉え方を変えなければならないことも書かれている。なお,ここではヒットの確率を10兆分の1と評価している。

Chapter 12「裁判所の数学」もおもしろい。ここで扱っている People v. Collins の裁判は,訴追者の誤謬(Prosecutor's fallacy)の古典的な例として,他の多くの類書にも載っている(カプラン&カプラン『確率の科学史』にも詳しく書かれているが,訳の格調が高すぎるためか,読みにくい)。この事件では,検察側は大学の数学の先生まで呼んできて,目撃者による犯人の特徴と,被告人たちの特徴が偶然に一致する確率は,控え目に評価しても1200万分の1であると主張し,一審で有罪を得たが,州最高裁で無罪となった。

大川法律事務所ー主張・コリンズ裁判と訴追者の誤謬にもわかりやすく解説されている。

足利事件当時のDNA鑑定の精度は?

Googleで「足利事件 DNA鑑定 "一致する確率は100人あたり1.2人"」で検索すると115件,「足利事件 DNA鑑定 "一致する確率は1000人あたり1.2人"」で検索すると4件だ。ということは多数決で100人あたり1.2人が正しいか。いや,よりセンセーショナルな前者のほうが衆人にコピペされる可能性が高いので要注意。それどころか,このような検索結果の比較はコピペバイアスを含んでいるので無意味である。

というわけで,朝日新聞聞蔵IIビジュアルで調べてみると,足利事件の1991年鑑定で用いられたMCT118という方法で,血液型も含めて偶然に一致する確率は,やはり1000人に1.2人ということである(2009年6月24日朝刊など)。現在は4.7兆人に1人。さらに,2009年6月26日の週刊朝日には「この時期の鑑定方法は試料保存などもずさんなうえ判定方法にも問題があり、千人に1・2人とされた確率が判決後に千人に約5・4人に修正されている」ともあるが,この値は他で確認できなかったので,以下では p=0.0012 とする。

さて,私が当時のDNA型鑑定で偶然に犯人にされてしまう確率は 0.12% である。このとき,「私が犯人である確率は 99.88% である」と言えるだろうか。これは「水準5%で有意な結果は,確率95%で正しい」という統計的仮説検定の誤解とも重なる。物理学の例でいえば,ニュートリノの質量が0であるという帰無仮説のもとで,現在得られているようなニュートリノ振動の観測データが偶然に得られる確率が仮に0.01%だったとすると,マスコミ的には「ニュートリノが質量を持つ確率は99.99%」なのだが,これは正しいか。

[2009-10-19追記] 「DNA確度低く、自白必須」 足利事件の地検内部資料(朝日)によれば,確率は1000人に1.244人とのこと(有効数字多すぎだが)。

コンテンツの配信