教科書が酷いグラフを推奨している

PENの中の人に捏造グラフ推奨の教科書を教えていただいた。これはひどい!

[2010-12-06追記] 13ページにこんな図はなかったという人がおられたので,写真撮影した。口絵13ページで,後ろのほうにある。
教科書の捏造グラフ

おもしろい棒グラフ

an interesting bar graph

今日の学生の発表スライドにあったグラフ。よく見たら3.0から始まっている。文科省の資料だというので,調べたら,教育相談等に関する調査研究協力者会議(第2回)配付資料-文部科学省にある資料2の19ページのようだ。

電子教科書

本は裁断・スキャンしてiPadに入れて持ち歩いている。最初からPDFやEPUBなどの形式で入手できればもっとうれしい。電子書籍への動きは大歓迎だ。

米Amazonでは電子書籍の売上冊数がハードカバーを抜いている。日本の本も早く電子書籍で買えるようになってほしい。教科書も含めて,いずれ紙の本は珍しくなるだろう。

ただ,今の電子教科書の動きには,気になることがいくつかある。

  • iPadのようなものを子どもに持たせて,気が散らずに勉強に集中できるか。この点については,最近の次の記事とそこからたどれる論文が参考になる: これらによると,コンピュータを持たせることは成績低下につながるという。
  • 学習履歴の管理ができることが宣伝されているようだが,家でいつどの教科書のどこを読んだかまで管理されることについてプライバシー上の懸念はないのだろうか。

またもや相関関係と因果関係が混同されている

幼稚園出身の子の正答率、高い傾向 全国学力調査(朝日),学力テスト:正答率、保育所より幼稚園? 関係者に戸惑い(毎日),憂楽帳:保育園?幼稚園?(毎日),幼稚園出身が学テ好成績の傾向 データ取り扱いに波紋も(47NEWS),保育所に通った子どもより幼稚園に通った子どものほうが小6,中3ともに正答率が高い。

記事の中では家庭環境や家計などの要因を示唆していても,題名から受ける印象は異なる。特に毎日の憂楽帳は,「今回の結果に戸惑い、納得できないという人は少なくないはずだ。では、どうすればいいのか。早く答えを見つけないと。しわ寄せを受けるのは、子どもたちなのだから」と締めくくっており,誤解を煽っているようにも聞こえる。

元データを探したら,国立教育政策研究所の「平成22年度 全国学力・学習状況調査 結果概要・集計結果」についてというページの最初のPDFのp.18にあった。基線が0でない棒グラフだ。

Appleは日本語組版が苦手?

最近,電子書籍(EPUB,HTML5/CSS)がらみで日本語組版についての議論があちこちで行われている。TeX Forumでも鎌田先生がkoTeXは日本語LuaTeXへの先導役になるか?で書いてくださっている。鎌田先生からはその後Twitterでもいろいろお教えいただいた。

和文組版の話は拙著[改訂第5版]LaTeX2e 美文書作成入門の第13章にも少し書いてあるが,Asian TeX Conference 2008の私のスライドから少し切り貼りして復習しておく。

Macの画面がWindowsより美しい理由の一つはヒラギノ書体にあるが,Pagesなどでヒラギノ明朝で横書きするとなぜかしっくりこないと鎌田先生は嘆かれる。PagesやKeynoteの画面をよく見たら,縦組用の文字が横組に使われている!

ヒラギノ明朝は縦組と横組でかなの字形がかなり違う。[2010-07-25追記:下のコメント「ヒラギノ明朝のデフォルト(縦組用)は縦横両用」参照]

自炊(本を自分でスキャン)

IPv4アドレスがもうすぐ枯渇するというが,それより先に研究室の空間が枯渇しそうになってきたので,本を少しスキャンして電子化することにした。

BOOKSCANさんをはじめとするたくさんのスキャン業者が現れたが,本を箱詰めにして運ぶ過程でまた腰を痛める可能性があるので,自分で1冊ずつスキャンしてみることにした。こういう作業を自炊というらしい。

裁断機はPK-513Lを考えたが,生協に発注したところネットよりかなり割高な上に1〜2ヶ月先の入荷という。それでは夏休みの作業ができなくなるので,1万円強で買えるこちらの商品をアマゾンで私費で買って大学に届けてもらった。

ScanSnapは数世代前のものを持っていたが紙詰まりが増えたので,最新のものを生協で買った。

ExcelのF検定

Twitterでの某先生のつぶやきがきっかけで,ググって

などをざっと見ながら,等分散の検定にある練習用データをExcel 2010で試してみた(図)。結果はExcel 2003とまったく同じ。古いExcelでは片側検定の結果を間違って両側検定と表示していたが,Excel 2003以降は正しく片側検定と表示するようになった。ただ,この場面では両側検定が普通なので,直す場所が違ったようにも思う。「P(F<=f) 片側」という書き方も微妙である。「F 境界値 片側」もよく考えないと誤解しやすい。

MacのExcel 2008でやってみようとしたら,そうだ,Mac版には分析ツールがなかったのだ:

iPadゲット

日本での発売前日にApple Storeでオンライン注文したiPadが昨日届いた。一番安いWi-Fiモデル。

至急必要なもの:ケース。SteveがMacBook Airを取り出して見せたような紙封筒でもいいか。

とりあえずiTunesを立ち上げ,iPod touchのバックアップを詰め込むが,入ったのはアプリだけで,設定やパスワード類や音楽は受け継がれない。

iPod touchのときに買ったものも含めて,主なアプリ:iBooks,Kindle,Stanza,GoodReader,TwitRocker Lite,Dropbox,AudioNoteなどなど。

Kindle Storeで買った本はiPadでも再ダウンロードして読める。Stanzaで読むO'Reillyの電子書籍もそのまま受け継がれた。PDF類はMacからDropbox経由でGoodReaderに転送して読むのが楽のようだ。ACM会員割引で入ったSafari Books Onlineも問題なく読める。

明日の出張が楽しみだ。

iPod

追記:いまダイソーに行って315円でケースを買ってきた。11インチノートPC用のソフトケース。

チャートジャンクは役立つ?

Useful junk?: the effects of visual embellishment on comprehension and memorability of charts というペーパーを教えていただいた。ACM会員でない場合は,ほぼ同じものがここに公開されている。

どこかで見た絵だと思ったら,このブログで紹介されていたのを見て,忘れていた。

Nigel Holmesのグラフィックと,Rで学生が描いたような単純なグラフとを比較して,どちらが理解しやすいか,どちらが記憶に残りやすいかを,被験者を使って調べた研究である。案の定,Holmesのグラフィックのほうが記憶に残りやすいという結果であった。

これは,チャートジャンクは少ない方がよい,データ/インク比(data-ink ratio)は大きい方がよいというTufteの主張の反証ということらしい。

しかし,実際にTufteの本を読んだ人なら,情報密度の高い,目を見張るばかりの細密な図の数々に,感銘を受けたはずだ。棒が数本並んで「増えていますよ」だけしか読み取れないグラフなど,Tufteの本にもClevelandの本にも見当たらない。

Tufteの主張は,チャートジャンクにインクを使う余裕があれば,もっと多くのデータを盛り込む工夫をせよと言い換えることができる。殺風景な魅力のないグラフを描けということではない。大量のデータでもうまく視覚化すれば何かが見えてくるということだ。

Tufteのサイトに反論が載っているか調べたが,見当たらなかった。しかし,Holmesたちの図を載せたNew York TimesのOp-Edページへのコメントが掲示板にあった:Ask E.T.: Poor op/ed data graphic in New York Times。この図では,危険性と新聞掲載回数に負の相関があるように見える。コメントにもあるようにHoward Wainerがちゃんとした散布図を描いて,関連がないことを示したが,Wainerの妻はHolmesたちの図の方が好きだと言ったそうだ。

折れ線グラフは0点に意味がない…はずだが

2010-05-13に警察庁が平成21年中における自殺の概要資料(PDF)を公開した。これを各紙が紹介している(リンクは下)。グラフがいろいろあっておもしろい。

特に朝日の折れ線グラフ「自殺者数の推移」について,Twitterで「95年までは自殺者が殆どいないのかと一瞬勘違いするよなー」というコメントが流れた。折れ線グラフは棒グラフと違って0点に意味はなく,Clevelandも各線分の傾きの絶対値が45°に近くなるように描くのがよいといったことを書いているが,確かに朝日のグラフは一瞬勘違いするかもしれない。軸線や目盛りのちょっとしたデザイン上の工夫で改善できると思うので,どなたか挑戦してみてください。私のグラフの描き方の中にもいくつか折れ線グラフの例があるが,この中にも改善を要するものがあるかもしれない。

コンテンツの配信