オープンデータとは
デジタル庁のオープンデータのページで公開されている「オープンデータ基本指針」(令和6年7月5日改正)のp.2「オープンデータの定義」には次のように書かれている:
国、地方公共団体及び事業者が保有する官民データのうち、国民誰もがインターネット等を通じて容易に利用(加工、編集、再配布等)できるよう、次のいずれの項目にも該当する形で公開されたデータをオープンデータと定義する。
① 営利目的、非営利目的を問わず二次利用可能なルールが適用されたもの
② 機械判読に適したもの
③ 無償で利用できるもの
この定義に従えば、オープンデータは「国、地方公共団体及び事業者が保有する官民データ」の部分集合である。大学の研究室や個人が収集して公開したオープンなデータは、オープンデータにはならないことになる。
しかし、以下に見るように、この定義は狭すぎる。この「オープンデータ基本指針」という文書が扱うオープンデータの範囲をこのように限定しているという意味にとるほうがよさそうである。
実際、Open Data Handbook にある What is Open Data?(日本語版: オープンデータとは何か?)では、Open Definition の定義に従うデータをオープンデータと呼ぶとされ、
オープンデータとは、自由に使えて再利用もでき、かつ誰でも再配布できるようなデータのことだ。従うべき決まりは、せいぜい「作者のクレジットを残す」あるいは「同じ条件で配布する」程度である。
と書かれている。これであれば、個人が公開するオープンデータもありうる。ちなみに、Creative Commons のライセンスにあてはめれば、たかだか CC BY か CC BY-SA までで、NC や ND はオープンではない。
「オープンデータ基本指針」の上に挙げた定義の前文、「機械判読」、「無償」には脚注がある。このうち前文の脚注は、「ただし、セキュリティの理由により、利用者に対し、事前登録を求めたり、データへのアクセス方法に制限を設けたりといった措置が講じられることがあり得る。」となっており、Open Definition に合致しそうにない。また、「無償」の脚注には「オープンデータとは言えないものの、データ提供システムの維持管理に要するコストを限定された利用者からの料金徴収でまかなうケースもある。」とあり、有償のものはオープンデータとは言えないという立場である。一方、Open Definition の詳細版 Open Definition 2.1 には
The work must be provided as a whole and at no more than a reasonable one-time reproduction cost, and should be downloadable via the Internet without charge.
とあり、無償は絶対的な条件ではなさそうである(これはオープンソースソフトウェアも同様で、かつては磁気テープなどに収めて有償で配布していたこともあるし、最近まで雑誌や書籍の付録CD-ROM・DVD-ROMに収録して配布していたものもあった)。
ちなみに、デジタル庁のオープンデータのページにある「政府標準利用規約(第2.0版)」およびそれを改正した「公共データ利用規約(第1.0版)」は、CC BY 4.0 と互換性のあるライセンスである。
ソフトウェア ライセンス | GNU GPL | BSD-like | パブリック ドメイン | ||||
---|---|---|---|---|---|---|---|
CCライセンス | BY-NC-ND | BY-NC-SA | BY-ND | BY-NC | BY-SA | BY | CC0 |
オープンデータ | × | × | × | × | ○ | ○ | ○ |
日本のオープンデータについては、首相官邸の電子行政オープンデータ実務者会議(←2022年3月11日のアーカイブ)のページにまとめられていたが、その後政府CIOポータルのオープンデータに移動し、さらにデジタル庁のオープンデータに移動した。首相官邸のページにあった「政府標準利用規約(第1.0版)」は政府CIOポータルやデジタル庁には見つからない。
「政府標準利用規約(第1.0版)」には次のような文言があった:
ア コンテンツに関し、以下のように利用することは禁止します。
(ア) 法令、条例又は公序良俗に反する利用
(イ) 国家・国民の安全に脅威を与える利用
こういった「公序良俗」「国家・国民の安全に脅威」といった判断基準は、為政者が恣意的に解釈するのが常であり、オープンデータに相応しくない。