テストの点数は正規分布すべき?

正規分布の何がいいの?でも書きましたが、受験者数がどれだけ多くても、テストの点数は正規分布には近づきません。正規分布に近いほうが良いわけでもありません。全国学力テストも、共通テストも、正規分布にはなりません。

偏差値 = 10 × (点数 - 平均)/標準偏差 + 50 ですので、点数の分布が正規分布でなければ、偏差値の分布も正規分布ではありません。「正規分布でないなら偏差値は使えない」などということはありません。どんな分布でも偏差値は使えます。

ただ、正規分布でなければ「全受験生の2.3%は偏差値70以上だ」などということは言えません。正規分布(一般に左右対称の分布)でなければ「偏差値50以下はちょうど半分いる」ということも言えません。

中心極限定理という定理が数学にありますが、これを「n → ∞ でどんな分布も正規分布になる」と間違えて覚えている人がいるようです。正しくは「母集団から大きさ n の標本を何度も抽出するとき、標本平均の分布は、n → ∞ で正規分布に近づく」が中心極限定理です。

中心極限定理の n → ∞ は百万とか千万とかでなく、数十個くらいでほぼ正規分布と見なせるようになります。昔は0以上1未満の一様乱数を12個足して6を引いたものを正規分布の乱数の代わりに使ったことがよくありましたが、これも中心極限定理の応用です。

偏差値に代わるものとして、パーセンタイル(percentile rank)が使われることがあります。これは中央値が50で、上位25%の位置にあれば75、トップは100です(実際には (小さい数 + 等しい数/2)/n × 100 で計算するので満点でも100になりません)。

パーセンタイルを平均0、分散1の正規分布にあてはめて得点に戻したものをprobit(プロビット)といいます。負の値にならないように5を加えることもあります(5を加えたもののほうがprobitの元の定義です)。