二封筒の問題:解決編?

二封筒の問題の続き)

問題を整理しよう。スワミは金額 $x$,$2x$ の封筒を用意した。$x$ はわからない。つまり,この問題の隠れたパラメータは $x$ である。あなたの封筒に入っていた金額 $y$ は,パラメータ $x$ に依存する測定値である。この問題の数理モデルは,$x$ が与えられればそれぞれ確率 1/2 で $y = x$ または $y = 2x$ を得ることである。そして,われわれの仕事は,データ $y$ からパラメータ $x$ を推定することである。

具体的に,あなたの封筒に $y = 1000$ 円入っていたとしよう。すると,$x = 500$(このとき,もう一方の封筒には500円入っている)または $x = 1000$(このとき,もう一方の封筒には2000円入っている)のどちらかである。$x = 500$,$x = 1000$ の事前確率をそれぞれ $p$,$q$ としよう。モデルから,$y$ について可能な値は3通りある:

$y=500$$y=1000$$y=2000$
$x=500$$p/2$$p/2$
$x=1000$$q/2$$q/2$

ここで封筒を開けて $y = 1000$ が観測されたとすると,$x = 500$ の確率と $x = 1000$ の確率の比は $p : q$ である。つまり,相手の封筒の中身が500円,2000円である確率の比は $p : q$ である。その期待値があなたの持っている1000円と等しくなるのは

\[ \frac{500p + 2000q}{p+q} = 1000 \]

のときである。これを解けば,$p : q = 2 : 1$ となる。つまり,パラドックスを起こさないパラメータ $x$ の事前分布は

\[ p(x) \propto \frac{1}{x} \]

のようにスケールすればよい。スワミが投資額を2倍にする確率は半分である。

この分布は,拙著『Rで楽しむベイズ統計入門』p.99でベンフォードの法則に関連して書いた $\log x$ について一様な事前分布である($d\log x = dx/x$ であるので $x$ についての事前分布 $p(x)$ は $1/x$ に比例する)。$x > 0$ という制約以外に何の条件もない場合には,この事前分布が最も自然であることが多い。この二封筒の問題は,このことの証拠の一つとなりうるという点で,たいへん興味深いものである。

もちろんこれ以外の考え方もありうるであろう。それに,スワミはこれ以外の事前分布で $x$ を決めようとするかもしれない。$p(x) \propto 1/x$ より平坦な分布であれば,交換するほうが期待値として得である。ただし,その場合は,無条件に交換するのではなく,封筒を開いて金額 $y$ を確認し,それがあまり高額であれば,もう一人にその倍の金額を渡している可能性は低い(スワミの財力に限度がある)と考えられるので,交換しないほうがよいかもしれない。