折れ線グラフは0点に意味がない…はずだが

2010-05-13に警察庁が平成21年中における自殺の概要資料(PDF)を公開した。これを各紙が紹介している(リンクは下)。グラフがいろいろあっておもしろい。

特に朝日の折れ線グラフ「自殺者数の推移」について,Twitterで「95年までは自殺者が殆どいないのかと一瞬勘違いするよなー」というコメントが流れた。折れ線グラフは棒グラフと違って0点に意味はなく,Clevelandも各線分の傾きの絶対値が45°に近くなるように描くのがよいといったことを書いているが,確かに朝日のグラフは一瞬勘違いするかもしれない。軸線や目盛りのちょっとしたデザイン上の工夫で改善できると思うので,どなたか挑戦してみてください。私のグラフの描き方の中にもいくつか折れ線グラフの例があるが,この中にも改善を要するものがあるかもしれない。

追記:Rで適当に描いてみた。

自殺者数の推移
year=1978:2009
total=c(20788,21503,21048,20434,21228,25202,24596,23599,
  25524,24460,23742,22436,21346,21084,22104,21851,21679,
  22445,23104,24391,32863,33048,31957,31042,32143,34427,
  32325,32552,32155,33093,32249,32845)
par(family="HiraKakuProN-W3") # Mac
par(las=1)
par(mgp=c(2,0.8,0))
plot(year, total, type="o", pch=16, xlab="", ylab="",
     ylim=c(19000,35000), axes=FALSE,
     col="royalblue3", lwd=2)
t=c(1978,seq(1985,2005,5),2009)
u=t; u[1]="1978年"
axis(1,t,u)
t=seq(20000,35000,5000)
axis(2,t,t/10000)
axis(2,"万人",at=35000,padj=-1,tick=FALSE)

しかしこれは積み重ね棒グラフで男女比を示すのもいいかもしれない。警察庁のデータをそのままCSV風に載せておく:

"年","自殺者","男","女","自殺率/10万人","男","女"
"昭和53年",20788,12859,7929,18.0,22.7,13.6
"昭和54年",21503,13386,8117,18.5,23.4,13.8
"昭和55年",21048,13155,7893,18.0,22.9,13.3
"昭和56年",20434,12942,7492,17.3,22.3,12.5
"昭和57年",21228,13654,7574,17.9,23.4,12.6
"昭和58年",25202,17116,8086,21.1,29.1,13.3
"昭和59年",24596,16508,8088,20.5,27.9,13.2
"昭和60年",23599,15624,7975,19.5,26.3,13.0
"昭和61年",25524,16497,9027,21.0,27.6,14.6
"昭和62年",24460,15802,8658,20.0,26.3,13.9
"昭和63年",23742,14934,8808,19.3,24.7,14.1
"平成元年",22436,13818,8618,18.2,22.8,13.8
"平成2年",21346,13102,8244,17.3,21.6,13.1
"平成3年",21084,13242,7842,17.0,21.7,12.4
"平成4年",22104,14296,7808,17.8,23.5,12.4
"平成5年",21851,14468,7383,17.5,23.6,11.6
"平成6年",21679,14560,7119,17.3,23.7,11.2
"平成7年",22445,14874,7571,17.9,24.2,11.8
"平成8年",23104,15393,7711,18.4,25.0,12.0
"平成9年",24391,16416,7975,19.3,26.6,12.4
"平成10年",32863,23013,9850,26.0,37.2,15.3
"平成11年",33048,23512,9536,26.1,37.9,14.7
"平成12年",31957,22727,9230,25.2,36.6,14.2
"平成13年",31042,22144,8898,24.4,35.6,13.7
"平成14年",32143,23080,9063,25.2,37.1,13.9
"平成15年",34427,24963,9464,27.0,40.1,14.5
"平成16年",32325,23272,9053,25.3,37.4,13.8
"平成17年",32552,23540,9012,25.5,37.8,13.8
"平成18年",32155,22813,9342,25.2,36.6,14.3
"平成19年",33093,23478,9615,25.9,37.7,14.7
"平成20年",32249,22831,9418,25.3,36.7,14.4
"平成21年",32845,23472,9373,25.8,37.8,14.3

[2010-05-16追記] gnutarさんが改良してくださった。ちょっとの余白でずいぶん変わるものである。

nakano_labさんのご指摘で気づいたが,産経だけ横軸が元号。実は警察庁の元データも上に示したように元号である。

coke_nullさんに教えていただいたが,自殺統計では厚労省の自殺死亡統計の概況 人口動態統計特殊報告が警察庁のものとやや異なり,おもしろい。

6月26日23時(JST)に見てみました。

朝日とMSN産経以外は、全部なくなっていました。
以前から感じていましたが、日本の新聞サイトって記事がすぐ消えますね……。

gnutarさんのは見ていない(JavaScript切ってるので、twitterは見えないんです。ごめんなさい)のですが、とりあえず縦軸の下端を切る(ゼロのイメージをつけない)だけで少し違うのでしょうね。

この場合は(?),0 には,意味がある

万人いう単位ではあるが,少し前までは2ぐらいであったものが3ぐらいになっている,つまり1.5倍になっているという事実を見るためには0を起点とする必要がある。0がない折れ線グラフは0がない棒グラフと同じである。マイナスの数字はないが,0はあり得る(自殺が全くない社会ということだが)。
> ちょっとの余白でずいぶん変わるものである
つまり,0が必要なのである。

折れ線グラフで0がなくてもよいのは

例に挙げられていた中では,温度(摂氏)と出生性比。摂氏温度は間隔尺度なので 0 を基準にする意味がない(絶対温度で記載するなら 0 は必要)。つまり,間隔尺度なら 0 は不要だが,比例尺度(比尺度)なら 0 は必要。
出生性比は 0 ではなく,1(あるいは 1.04 あたり) が中心になるように描くのがよさそう。すくなくとも 0 を基準とすることは不要。つまり,比を描くときは 1 が基準。指数などのときも同じ(100 を基準とする)。
株価グラフに 0 が必要とは皆言うのに,なぜ死亡数(死亡率)に 0 が不要とは?後者は折れ線グラフで描くよりは棒グラフで描くべきもの。棒グラフのメモリが大きい数値を表すのでためらいがあるのかもしれないが,主たる理由は年次推移を表すために折れ線グラフで描く。株価は棒グラフで表す習慣はあまりない。推移を表現するという意図の方が大きいのだろう。出生性比も,年次推移を表すことに意味がないなら(例えば各国の出生性比を比較するなどのときには)マイナス方向も持つ棒グラフで表現する方が適しているだろう。

コメントの表示オプション

お好みの表示方法を選択し、「設定の保存」をクリックすると、表示方法を変更することができます。