statistics

e-Stat

e-Stat は、日本の統計が閲覧できる政府統計ポータルサイトです。

ここで公開されているデータは、だれでも自由に使えるオープンデータです。利用ルールは、政府標準利用規約(第2.0版)に準拠し、Creative Commons の「表示」ライセンス(CC BY)と互換性があります。

登録なしで使えますが、右上の「新規登録」でユーザ登録して、ログインして使うと、ダッシュボードで自分のダウンロード履歴をたどれるので、便利です。

例えば都道府県別の人口を知りたいとします。キーワードで検索してもいいのですが、「分野」→「人口・世帯」→「人口推計」のようにたどることもできます。「データベース」と「ファイル」がありますが、「ファイル」のほうが概して新しい・詳しいことがあるので、ここでは「ファイル」を選ぶことにします。「月次」が新しいのですが、ここでは都道府県別が載っている「年次」を選びます。最新の2021年を選びます。

都道府県別は、4「都道府県,男女別人口及び人口性比-総人口,日本人人口(2021年10月1日現在)」がそれらしいので、Excelファイルをダウンロードして眺めてみます。その際に、ダウンロードしたURLを記録しておきます:

https://www.e-stat.go.jp/stat-search/file-download?statInfId=000032191045&fileKind=0

この 000032191045 がデータ番号です。このURLを変形して

https://www.e-stat.go.jp/stat-search/files?stat_infid=000032191045

としたものが、このファイルへのリンクと説明を含むHTMLページです。データのURLを示す際には、ファイルをダウンロードするURL(いわゆる直リン)よりも、こちらのURLのほうが適切です。登録ユーザのダウンロード履歴に出るURLもこれです。このページから、該当のExcelファイル以外に、閲覧用Excelファイル(いわゆるネ申Excel)、DB(データベース)にも飛ぶことができますし、「政府統計名」>「提供統計名」>「提供分類」というナビゲーション(パンくずリスト)もたどれます。

fileKind は次の表のようにファイルの種別を表します:

fileKind=0Excel
fileKind=1CSV
fileKind=2PDF
fileKind=3XML
fileKind=4Excel閲覧用