虫歯と所得

新潟県の子どもはなぜ虫歯が少ないのか?という記事は,虫歯の本数と所得に負の相関があることを示すために,それぞれを多い順に並べた二つのグラフを描き,ベスト10,ワースト10の重なりを調べている。そういうことを調べるには,散布図を描くべきであろう。

虫歯の本数については,学校保健統計調査の「平成29年度」「都道府県表」の「都道府県別 年齢別 疾病・異常被患率等(年齢ごと)」2017年度(2018-03-26)というExcelシートを使う。12歳児は 08-008 というシートにある。「永久歯の1人当り平均むし歯(う歯)等数」の「計」を読み取る。

library(readxl)
ushi = read_excel("h29_hoken_toukei_08.xlsx", "08-008", "AD13:AD59", col_names="total")

賃金については,賃金構造基本統計調査の「平成29年賃金構造基本統計調査」→「一般労働者」→「都道府県別」→「(参考表)都道府県別きまって支給する現金給与額、所定内給与額及び年間賞与その他特別給与額(47都道府県一覧)」を使う。記事では「所定内給与額」(現金給与額から超過労働給与額を差し引いた額)が使われているようだが,実態は「現金給与額」,さらにはその12倍に「年間賞与」を加えたもののほうが近いかもしれない。

income = read_excel("(1-8-sanko1).xls", "男女計", "I14:K60", col_names=c("現金","所定","賞与"), col_types="numeric")

散布図を描く。県名(kenmei)はいろいろな都道府県別データから取った。

x = with(income, 現金*12+賞与) / 10  # 元が千円単位なので10で割って万円単位にした
plot(x, ushi$total, type="n", xlab="平均年収(万円)", ylab="永久歯の虫歯の本数")
text(x, ushi$total, kenmei)
年収と虫歯

相関係数 r = -0.402 (p = 0.005) である:

cor.test(x, ushi$total)

	Pearson's product-moment correlation

data:  x and ushi$total
t = -2.9452, df = 45, p-value = 0.005094
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
 -0.6178427 -0.1298201
sample estimates:
       cor 
-0.4020004 

例によって,県レベルの相関と個人レベルの相関は違うので,注意が必要である(Simpsonのパラドックス,生態学的誤謬)。