散布図にしてみると

FlowingData の Class Size and SAT Scores By State という図。何となくきれいで,教師一人あたりの生徒が多いほどSAT(日本でいうセンター試験)の点数が高いことを示すようだ。でも何だか騙されているような気もする。普通の散布図にしたらどうなるんだろう?

実際に散布図を描いてくれた人がいた。これを見ると,全然関係なさそう。この散布図は点の色でSAT参加率も表しているところがミソ。色の濃い(参加率の低い)州ほど点数が高いのは選択効果の現れである。

自己選抜

解釈は以下なのでしょうか。受験率が低い州とは、受験が相対的に強く推奨されていないので、受験したいと思う(ような成績の良さそうな)生徒だけが受けるので平均点が高い。受験率が高い州とは、受験が相対的に強く推奨されているので、受験したくないと思っている(ような成績の良くなさそうな)生徒も受けるので平均点が下がる。だとすれば、SAT受験は自発なので(しょうか?)、どのようなタイプの生徒が受けているかを考えないと、各州の平均点すら単純に比較できないというメッセージ...と理解しました。

オリジナルのFlowingDataのポスト(先生はもっと必要?)ですが、関心のきっかけを作る手段としては賛成です。でも、これだけの情報だと、議論に長い時間をかけて「これだけでは何も言えない」という結論に辿り着けるかどうかです。学習結果のばらつきをクラスサイズだけで論じるのは、そろそろ卒業した方がいいと思いました。

Re: 自己選抜

はい,その通りだと思います。

グラフ求む

教師一人あたりの生徒数とSATの点数の関係をグラフ化してください。本が当たるそうです。

コメントの表示オプション

お好みの表示方法を選択し、「設定の保存」をクリックすると、表示方法を変更することができます。