下手な散布図

体力と学力に相関関係も 秋田ともに上位、大阪は危機感(朝日),とりあえず小学校:

体力 = c(105.48, 110.1, 111.34, 107.63, 116.1, 110.72, 110.12, 114.21, 109.96, 107.24, 111.97, 113.26, 106.26, 105.41, 114.52, 111.64, 112.38, 116.79, 108.68, 109.33, 109.83, 111.63, 106.31, 105.61, 105.98, 108.84, 105.6, 106.64, 105.7, 108.49, 112.04, 112.41, 112.66, 109.66, 109.23, 105.41, 109.89, 109.52, 103.8, 106.2, 108.47, 111.33, 111.78, 106.64, 112.43, 107.77, 107.75)
学力 = c(221, 256.8, 246.8, 235.1, 276.9, 244.9, 239.9, 238.3, 235.9, 239.7, 242.8, 244.1, 252.5, 240.5, 240.7, 254.2, 252.3, 262.8, 236, 241, 240.7, 241.1, 238.1, 230.6, 230.8, 250.7, 230.8, 242.1, 243.1, 233.3, 245.2, 232.3, 231.2, 249, 228.8, 240.5, 249.4, 236.9, 234.6, 231.6, 235.4, 230.5, 242.2, 232.5, 238.9, 238.1, 214.4)
県名 = c("北海道", ...)
plot(学力, 体力, pch=県名)

[2009-02-07追記] 要するに,各県を1文字であいまいなく表す方法はないものか。

各県を1文字で

私も考えたことがあります。

一字目がユニーク(30): 北・青・岩・秋・栃・群・茨・埼・東・千・神・新・富・石・静・岐・三・和・滋・奈・兵・広・鳥・徳・香・高・佐・熊・鹿・沖
二字目がユニーク(10):形・梨・野・井・阪・都・媛・根・口・分

以上40県は、曖昧さなく、1文字で表せる。
あとは、自明ではない規約を決める必要がある。

二字重複、但し一字目としてはユニーク(1):岡

完全重複(6):宮城・福島・福岡・長崎・宮崎・愛知

->旧称で代用 >磐、筑、日、尾 (会津、三河は御免)

残り: 長崎、宮城 -> 他県と曖昧さが生じるが一字目?(長、宮)
           他県と曖昧さが生じるが旧称 (肥、陸)
           史跡名勝(出、松)+島?

ドイツの都市や、アメリカの州のような略記法がなんで日本では決まっていないのでしょうね?

ところで、散布図に各県それぞれでのばらつきも表示すると、相関の有意性の有無を実感しやすいと思います。(特に大阪は本当に劣位?)各県内での相関までわかるように共分散行列を表す傾いた楕円を描くといいと思うのですが、あまりそのような視覚化表現を見ませんね。

散布図に各県それぞれでのばらつきも表示すると

どうもありがとうございます。旧称の利用は考えつきませんでした。いいアイデアですね。JISででも都道府県1文字コードというのを作ってくれればいいのですが。

「散布図に各県それぞれでのばらつきも表示すると」,いいですね。県レベルのデータしか公表されていないのでわれわれにはできませんが,データにアクセスできる人がそういうのを作ってくださればいいですね。

コメントの表示オプション

お好みの表示方法を選択し、「設定の保存」をクリックすると、表示方法を変更することができます。