『数字に弱いあなたの驚くほど危険な生活』

『数学で犯罪を解決する』 で参照した 大川法律事務所ー主張・コリンズ裁判と訴追者の誤謬 のネタ本として挙げてあったゲルト・ギーゲレンツァー『数字に弱いあなたの驚くほど危険な生活』(吉田利子訳,早川書房,2003年)がたまたま県立図書館にあったので,借りてきた。

邦訳はちょっと品のない題名になってしまっているが,とてもまじめな内容の本で,innumeracy(邦訳では「数字オンチ」)が大きな社会的損失を生じていることへの危機感を持って書かれている。今まで読んだこの手の本の中では最高である。訳文はよくこなれているし,訳語も正確である。強いて言えば,false positive の訳は「偽陽性」で正しいのだが素人はツベルクリンの「擬陽性」と混乱しないかちょっと心配である(よく読めばちゃんと説明してあるが)。

著者の提案は以下のように要約できそうである。例えば「40歳の女性が乳がんである確率は1%,乳がん患者がマンモグラフィーで陽性になる確率は90%,乳がんでないのに陽性になる確率は9%である。陽性の女性が乳がんである確率は?」に答えられる医師は少ない。ところが,「40歳の女性100人のうち1人が乳がんで,乳がんならほぼ確実に陽性になる。しかし,乳がんでない99人のうち9人もやはり陽性になる。つまり陽性は10人で,そのうち乳がんは1人」と説明すれば一般人でもわかる。確率とベイズの定理を教えようとするよりも,このような自然頻度(natural frequencies)に言い換えれば誤解は起きにくいし,母集団もはっきりする。

この原理に基づいて,コリンズ裁判やDNAプロファイリングやモンティ・ホール問題についても明確に解説されている。ただ,原書にあった注と文献が邦訳ではなくなっているのでよくわからないが,DNA鑑定の偽陽性率がちょっと高すぎるように思う(昔の数値かもしれない)。原著も注文しておこう。

本書による州最高裁の挙げたコリンズ裁判一審の問題点は非常に明解である:

  • 六つの確率の根拠がない
  • 独立でないと掛け算できない
  • 犯人が変装したり証人の証言が不正確である場合を無視している
  • 特徴が一致する確率は被告が無実である確率と等しくない(訴追者の誤謬)

[2009-09-27追記] 原著 Gerd Gigerenzer, Calculated Risks (Simon & Schuster, 2002) が昨日届いた。DNAプロファイリングの偽陽性率が1/100のオーダーという問題の個所の文献は Koehler, Chia, and Lindsey (1995), The Random Match Probability (RMP) in DNA Evidence: Irrelevant and Prejudicial?(PDF)であった。ここに載っている例の一つは1988年の文献によるもので,2検査機関のおのおのに65検体を渡して,もはや歴史的なRFLPという方法で4160通りのペアについて調べさせた結果,一致しないはずの4018ペアのうち2ペアが一致すると判断された。これだけなら偽陽性率は約1/2000だが,他の結果とあわせて数百〜数千分の1の偽陽性率としている。現在の偽陽性率は無視できる程度であろう。

[2009-10-22追記] 関連論文: Chapman and Liu, Numeracy, frequency, and Bayesian reasoning (2009).

[2010-04-27追記] New York TimesのブログでこのGigerenzerの本が紹介されている: Chances Are - Opinionator Blog - NYTimes.com

[2013-03-19追記] ギーレンツァーの本は2010年にリスク・リテラシーが身につく統計的思考法—初歩からベイズ推定までと改題されてハヤカワ文庫に入った(中澤港先生のご指摘感謝)。中身に見合うまともな書名になってよかった。