e-Stat は、日本の統計が閲覧できる政府統計ポータルサイトです。
ここで公開されているデータは、だれでも自由に使えるオープンデータです。利用ルールは、政府標準利用規約(第2.0版)に準拠し、Creative Commons の「表示」ライセンス(CC BY)と互換性があります。
登録なしで使えますが、右上の「新規登録」でユーザ登録して、ログインして使うと、ダッシュボードで自分のダウンロード履歴をたどれるので、便利です。
例えば都道府県別の人口を知りたいとします。キーワードで検索してもいいのですが、「分野」→「人口・世帯」→「人口推計」のようにたどることもできます。「データベース」と「ファイル」がありますが、「ファイル」のほうが概して新しい・詳しいことがあるので、ここでは「ファイル」を選ぶことにします。「月次」が新しいのですが、ここでは都道府県別が載っている「年次」を選びます。最新の2021年を選びます。
都道府県別は、4「都道府県,男女別人口及び人口性比-総人口,日本人人口(2021年10月1日現在)」がそれらしいので、Excelファイルをダウンロードして眺めてみます。その際に、ダウンロードしたURLを記録しておきます:
https://www.e-stat.go.jp/stat-search/file-download?statInfId=000032191045&fileKind=0
この 000032191045
がデータ番号です。このURLを変形して
https://www.e-stat.go.jp/stat-search/files?stat_infid=000032191045
としたものが、このファイルへのリンクと説明を含むHTMLページです。データのURLを示す際には、ファイルをダウンロードするURL(いわゆる直リン)よりも、こちらのURLのほうが適切です。登録ユーザのダウンロード履歴に出るURLもこれです。このページから、該当のExcelファイル以外に、閲覧用Excelファイル(いわゆるネ申Excel)、DB(データベース)にも飛ぶことができますし、「政府統計名」>「提供統計名」>「提供分類」というナビゲーション(パンくずリスト)もたどれます。
fileKind
は次の表のようにファイルの種別を表します:
fileKind=0 | Excel |
fileKind=1 | CSV |
fileKind=2 | |
fileKind=3 | XML |
fileKind=4 | Excel閲覧用 |