投票とアンケート

一つ前 を書いていて,リッカート尺度のアンケートと点数による投票が同じことであることに気づき,BalinskiとLarakiのサイト vote expérimental をもう一度見ようと思ったのだが,見つからない。幸い Internet Archiveのアーカイブ に入っていた。

彼らの方法は,基本的にはメジアンを使うが,メジアン値 i より高評価が多いか低評価が多いかによって i+ と i- に分ける。i+ でタイが生じれば,i より高評価の割合の大小で勝敗を決める。i- でタイが生じれば,i より低評価の割合の小大で勝敗を決める。ちょっと恣意的?

評価 i を与えた人の割合が pi であれば,リッカート尺度の平均 Σ ipi は,Range Voting の投票得点と同じである。単純で,ややこしいことが起きず,検出力も高いが,間隔尺度でないものの平均をとることを気持ち悪く思われるかもしれない。そこで,度数分布 piqi があったとき,両者からランダムに一つずつ選んだときにどちらが勝つ確率が大きいかを使えば,順序尺度しか仮定せずに勝ち負けが決められる。つまり,2重和 Σ sgn(i-j) pi qj の正負で勝ち負けを決めればよい。このほうがBalinskiとLarakiの方法よりすっきりしているではないか。

あ,駄目だ。こんな単純な決め方ではグーチョキパーのような三すくみ(ループ)が生じてしまう。^^;

どなたか良いアイデア・文献・サイトをお教えください。

[追記] 上で「恣意的」と書いたことを補足。例えば [低, 中, 高] 評価の割合が
Foo = [0.2, 0.5, 0.3]
Bar = [0.29, 0.4, 0.31]
とすると,BalinskiとLarakiの方法ではどちらも「中+」評価となり,タイを破るために高評価の割合を比較するとBarが大きいので,Barが勝つ。Range Voting(Σ ipi)ではFooが勝つ。上で提案した Σ sgn(i-j) pi qj でもFooが勝つ(3段階なら三すくみは生じない)。

[問] i,j = 1,2,3 のとき,
Σ sgn(i-j) pi qj > 0,
Σ sgn(i-j) qi rj > 0
ならば
Σ sgn(i-j) pi rj > 0
であることを示せ。

一方,3レベルの場合,もっと単純な間隔尺度 [-1,0,1] を用いれば,得点は単に 高 - 低 になる。メジアンを基準として,タイになるものを 高 - 低 の符号で + と - に2分するBalinskiとLarakiの方法は,まさにこれを使っているに過ぎない。ならば最後まで同じ基準を使えば一貫性があるのではないか。さきほどの例では Foo = 中+0.1,Bar = 中+0.02 となって,Fooが勝つ。

社会選択・順位相関

この問題は投票結果を統合するための分野「社会選択」と関連が深いかと思います.アローの不可能性定理などが著名なようです.

全ての対について順序関係を求めるKendall順位相関を使ったノンパラメトリック検定でよいのではないでしょうか?サンプル数が十分に多ければ先日のt検定でもよいかと思います.

パラメトリックな検定の方がおっしゃるように検出力が高いので,差がないことをいいたいときは,検出力の高い方法で否定的な結果が,差があることをいいたいときは,検出力の低い安全な方法で肯定的な結果がでれば,より安全に結論を導けるかと思います.

私も,1〜5のような採点法による尺度を使っていますが,人によって「真ん中」だと思う点がかなりばらつくようです.この要因は t検定 では,分布の分散が大きくなるので,正規分布とみなせるサンプル数が多く必要になる問題を引きおこさないでしょうか?

Re: 社会選択・順位相関

ありがとうございます。投票の文脈ではまさにアローの定理を回避するためにRange VotingやBalinskiとLarakiの方法などが考えられていると理解しています。他の点については明日時間があればまた考えてみます。

Re: Re: 社会選択・順位相関

一様分布のような分散の大きい分布の場合の中心極限定理については 一つ前のところ に書いてしまいました。その他についても書き始めたのですが,まとまらなくなったので,もうちょっと寝かせておかせてください。

中心極限定理の実験(訂正版)

コメントいただいたような例として,1〜5がどれも20%現れる12人×2群のランダムな回答を100万通り作り,各回答から等分散・非等分散のt検定をしてみて,帰無仮説が棄却される割合を調べました(Rubyでライブラリを作ったのでそのテストを兼ねて)。両側5%水準で有意となるサンプルの割合が6%5.1〜5.2%程度,1%では1.4%1.1%ほどありました。等分散を仮定してもしなくてもほとんど変わりはありませんでした(すいません,ライブラリがバグっていた(^^;)ので数値が大きくなりすぎていました)。

コメントの表示オプション

お好みの表示方法を選択し、「設定の保存」をクリックすると、表示方法を変更することができます。