学校の暴力行為のグラフ比較

文科省が11月30日に発表した平成20年度「児童生徒の問題行動等生徒指導上の諸問題に関する調査」結果(暴力行為、いじめ等)についての内容を各紙が報道している。

問題の暴力行為の件数は上記サイトのPDFファイルの8ページ下のグラフで表されている。このグラフを素直に描き直したのが産経時事ドットコムも同様(上の楕円グラフは問題だがさておき)。一方,朝日は母集団が違う2006年度以降も同じ線で繋いでしまった。読売はさらに「合計」を付けてグラフをうるさく(clutter)してしまった。

東京新聞の栃木版は積み重ね棒グラフ。茨城版は中学と高校のラベルが間違っているようだ。

PowerShot G11

PowerShot G11

今年の1月にRICOH R10を買ったばかりだが,10の次は11ということでPowerShot G11を買ってしまった。最安値ではないが11月24日にアマゾンで42522円で買い,26日に届く。

R10は高級コンデジで定評があるRICOHのハイコストパフォーマンスモデルで,1cm接写,7.1倍ズーム,電子水準器といった特徴を持つ。これからもポケットに入れて持ち歩きたい。しかし,暗い室内では被写体ブレが起きやすい。後継機CX1,CX2では改良されているかもしれない。

G11はコンデジとしては設定の自由度は最高だが,ズームは5倍で,R10のような電子水準器はない。大きくて重く,一般受けするモデルではない。PowerShotならS90のほうが売れるだろう。

RAW現像ソフトとしてDigital Photo Professional (DPP) 3.7.0.1が付いている。CDからMacにインストールしようとすると,まず管理者権限がないと怒られる。自分のアカウントは一般ユーザにしてあるので,ログインし直してインストール。しかし,起動して環境設定を開こうとすると異常終了する。Snow Leopardだけの現象らしい。ここに対処法が載っていた。これを管理者でも済ませてから,キヤノンのサイトから3.7.2アップデータを取ってきて更新するというのが手順らしい。[3.7.3が出ている。追記参照]

USBケーブルでMacにつなぐと今まで通りiPhotoで取り込めるが,ファイルシステムにマウントされるわけではないようだ。どういう仕組みなのだろう。

[2009-11-29追記 [この内容はもう古い。下の追記参照]] G11のRAWファイル(*.CR2)はiPhotoでは読み込めないが,カメラをUSB接続しているときは ~/Pictures/iPhoto Library/Import の下に見えるので,それをどこかにコピーしておき,DPPで現像する。Adobe Photoshop Camera Raw正式版5.5ではまだPowerShot G11はサポートされていないが,Adobe LabsからAdobe Photoshop Camera Raw 5.6RCを入手してインストールすれば,DPPを使わなくてもPhotoshop CS4で扱えるようになる。ここまでできれば,iPhotoではなくPhotoshopに付いているAdobe Bridgeを使ってもいいかもしれない。Bridge,Camera Raw,Photoshopの使い方は,Scott Kelby『フォトグラファーのためのPhotoshop CS4』(ボーンデジタル,2009)が参考になる。どうしてもiPhotoを使いたいなら,Camera Rawと同じところでDNG ConverterをダウンロードしてCR2を汎用RAW形式のDNG(Digital Negative)に変換すればiPhotoでも扱えるようになる。Adobe BridgeのフォトダウンローダでDNGに自動変換することもできる。変換は(おそらく)ロスレスであり,DNGのほうがサイズも若干小さく扱いやすい。

[2009-12-14追記] キヤノンのサイトにMac用DPP 3.7.3が出た。

[2009-12-18追記] Adobe Photoshop Camera Raw 5.6正式版が出た。Adobe DNG Converter 5.6も同じところからダウンロードできる。両方インストールしておこう。DPPとAdobe Camera Rawの違いも含めてG11の詳細なレビュー(英語)がここにある。

[2009-12-19追記] こちらにも書いたが,Mac OS XもアップデートするとiPhotoでG11のRAWが扱えるようになる。AdobeとAppleは新機種対応で競争しているのだろう。

[2009-12-21追記] Picasa for MacでもG11のRAWが扱える!

[2010-01-02追記] GIMP に含まれている UFRaw でもG11のRAWが扱える!

[2010-05-03追記] Camera Raw 5.7が2010-04-21に出ていた。

Kindle for PC

Kindleを買いそびれたので,Kindle for PCをダウンロードして試してみた。ただし,まだWindows版しかない。Mac版はcoming soonだそうである。Wineで動かないだろうか。iPhone/iPod touch版もあるはずだが,日本からはダウンロードできないようだ。

いくつかの本のサンプルページをダウンロードし,安い本を実際に買ってみたが,特に問題なく動作した。本文の文字サイズは自由に変えられるが,数式は画像なので,大きさが変わらない。

調べているうちに,Barnes & NobleのeReaderならMac版もiPhone/iPod touch版も日本からダウンロードできることを知り,Mac版をインストールしてみた。しかし本は少ない。大昔の本をディジタイズした無料の本はけっこうあるが,どれも米国オンリーと書いてある。無料なら大丈夫だろうと思ってImmanuel KantのLogicを購入しようとしたが,クレジットカード情報を入力させられた末,住所が米国でないので断られた。

最悪の棒グラフ

消すなんてもったいない

今日の昼前のNHK総合TVによれば,記録メディアがフィルムからテープに変わった一時期の番組が,テープ節約のために上書きされ,残っていないものが多数あり,視聴者が録画したテープを探しているとのこと。埼玉県川口市のNHKアーカイブスには大量のアナログメディアが保管されており,うち約6000本は行けば見せてもらえる。どんどんデジタル化してネットで見られるようにしてくれればいいのだが,著作権上そうはいかないのだろう。

URI変えるな,ページ消すなのコメントで教えていただいたが,衆議院TVはアーカイブを過去1年分しか残していない。消してしまうとすれば,もったいない話だ。

行政刷新会議による学校ICT活用推進事業の仕分け結果についてのコメントを某所で文科省に出そうとしているのだが,貧弱な公式ネット中継があっただけで,どこにも録画が残っていない(一部の仕分けについてはダダ漏れ中継もあり,MP3ファイルも残っている)。後で公開してくれるものと思っていたのに。

NHK特集「リーマン予想」を見忘れた。NHKオンデマンドで315円でと思ったら,Windowsでしか見られなかった。ちなみに,Twitterで教えてもらったところによれば,このNHK特集は,その後BShiで放送された番組のダイジェスト版らしい。フル版はNHKオンデマンドにもない。フル版もNHKオンデマンドに入った。

format=flowed がなくなって quoted-printable になった

Mac OS XのApple MailはRFC3676の format=flowed; delsp=yes を素直に実装したMUA(メーラ)だったが,他のMUAが追随しないので,やめてしまったようだ。その代わり,CRLFも含めて80バイト以上の行が本文に1行でもあれば,全体が quoted-printable になってしまうようだ(Mac OS X 10.6.2の時点で)。これについての他の人の意見:

今のところ実害といえば,Mewの右コラムの本文プレビューが文字化けしてしまうことくらいか。

散布図にしてみると

FlowingData の Class Size and SAT Scores By State という図。何となくきれいで,教師一人あたりの生徒が多いほどSAT(日本でいうセンター試験)の点数が高いことを示すようだ。でも何だか騙されているような気もする。普通の散布図にしたらどうなるんだろう?

実際に散布図を描いてくれた人がいた。これを見ると,全然関係なさそう。この散布図は点の色でSAT参加率も表しているところがミソ。色の濃い(参加率の低い)州ほど点数が高いのは選択効果の現れである。

Flickrを使ってみた

ボストンなどで撮ってきた写真を整理するため,Flickrのアカウントを作ってみた。

同僚にはGoogleのPicasa Web Albumの利用者が多い。これは容量1Gまで無料,年5ドル出せば20Gになるなどの料金体系。金を払わないと1G超過分は消えるらしい。これに対して,Yahoo!のサービスの一つとなったFlickrは,昔からの写真ファンに人気があるようだ。アップロード量100MB/月まで無料,年24.95ドルで無制限になる。金を払わないと最近の200枚しか見えなくなるが,データが消えるわけではなく,また金を払えば全部見えるようになる。コミュニティの層から考えて,とりあえずFlickrを無料の分だけ使ってみることにした。

カメラは相変わらずRicohのコンデジR10だ。GXRが欲しいが先立つものがない。

年齢別投票率のグラフ

民主党 藤末健三氏の 予算委員会質問に向けた準備その2 のグラフは,誇張された棒グラフの好例。Twitterでつぶやいたら,ご本人が謝ってくださった。

先の総選挙(2009-08-30)についての同様なグラフが 総務省のこのページ の一番下のPDFにある(Macの「プレビュー」では開けない)。これはうまく描かれている(色遣いは原色でないほうがよい)。折れ線グラフは本来は0から始める必要はないが,このような場合は0-100%の範囲で描くほうが割合がわかりやすい。

四分位偏差の定義

新学習指導要領(URLがnew-csでは10年後に困ると文科省は思わなかったのか。また,URLに不要なindex.htmが付いている。これをindex.htmlに変えると別ページが表示される。…といった突っ込みはさておき)では,しばらく消えていた統計が中学校で復活し,高校でも必修の数学Iに「データの分析」が入る。これに「情報」関係者も注目し,協力すべきだということは私もしゃべったり書いたりしているし,昨日の高校教科「情報」シンポジウム2009秋でも少し話が出ていた。

それに関連して,データで学ぶ!統計活用授業のための教材サイトというサイトを教えていただいた。この中に新指導要領 数学1「データの分析」四分位偏差に関する考察(吉田 一)という解説テキストがある。指導要領に「四分位偏差」(第3四分位数と第1四分位数の差の1/2)が出てくるが,そもそも四分位数の定義が2通りある。Tukeyのhingeの定義と,単純な内分による定義である。内分は数学IIで出るので,数学Iの「データの分析」では前者の定義のほうがよさそうだが,Excelのquartile関数は後者なので混乱しないように注意が必要という内容だ。「追って発行される『指導要領解説』ではどう記載されるのでしょうか」と締めくくられている。

吉田氏の解説の後で出た文科省の「指導要領解説」には,四分位数,四分位範囲,四分位偏差,箱ひげ図といったことばが解説されているが,どちらの定義を使うかは書かれていない。

Rquantile() のヘルプを見ると,2通りどころか9通りの定義が載っており,SやRでは第7の定義を使うとある。これは吉田氏の挙げた第2の定義に相当する。同じRでも fivenum()boxplot() ではTukeyの定義を使う。

ちなみに,指導要領には分散・標準偏差も出ているが,これも n で割る定義と n-1 で割る定義とがある(→ 標本分散)。統計屋は自由度 n-1 で割るのが普通だが,高校生に1を引く理由を説明するのはたいへんなので,n で割ることになるのであろう。

コンテンツの配信