オープンデータ早わかり

column M1

ICT業界での新しい潮流として「オープンデータ」とよばれる概念が注目を浴びています。 今回は、私がオープンデータについて勉強してわかったことを、自分の言葉で改めて書き直すことを試みます。

オープンデータとは

オープンデータは、一言でいうと「会社や国などが、自分の持っているデータを公開し、誰でも何にでも使ってもらえるようにしたもの」です。

より正確には、内閣が掲げるオープンデータ基本指針[1]において、

国、地方公共団体及び事業者が保有する官民データのうち、国民誰もがインターネット等を通じて容易に利用(加工、編集、再配布等)できるよう、次のいずれの項目にも該当する形で公開されたデータをオープンデータと定義する。

  • 営利目的、非営利目的を問わず二次利用可能なルールが適用されたもの
  • 機械判読に適したもの
  • 無償で利用できるもの

と定義されています。

例えば、「住民基本台帳」は、全自治体が日本中の全世帯について、その氏名・生年月日・性別・住所などをまとめた巨大なデータです。皆さんは、ご自身の身分を証明するために「住民票の写し」をもらうことはできますね。しかし、全国民の氏名に営利目的でアクセスすることはできないでしょう。これでは、オープンデータとは言えません

しかし、住民基本台帳から「X県の男性の人口はn人」「Y市の総人口はn人」といった人口統計データだけを切り出し、Excelファイルにまとめたものが、国や自治体によって公開されています[2]。これは、営利・非営利に関わらず自由に無償で使うことができます。これこそがオープンデータなのです

ここではExcelファイルを紹介しました。しかし、これがPDFファイルで公開されていた場合はオープンデータとは呼ばない事が多いです。それは、例えば統計表をPDFに書き出したものは、機械判読するのが難しいためです。(しかし、Excelを処理するのも比較的難しいので、本当はJSONやXMLなどの構造化テキストに整形してもらえるともっとありがたいです)

余談ですが、最も理想的なオープンデータはLOD(Linked Open Data)と呼ばれる形式のものです(図1参照)。LODでは、スキーマとよばれる構造にしたがってあらゆるデータが表現され、それぞれのデータはURIによって識別され、他のデータのURIへのリンクを貼ることができます。そのため、まるで人間がネットサーフィンするかのように、たくさんのデータを機械が横断して理解することが可能です。


図1. Tim Berners-Leeが主張する5-star deployment schemeの模式図[3]


なぜオープンデータなのか?

なぜ、オープンデータが注目を浴びているのでしょうか? いくつかの利点をもとに、その理由を探ってみました。

誰でも企業級の開発者になれる

今まで、企業の情報システムは、その企業自らが企画立案することで生まれてきました。なぜなら、自社の資産やデータにアクセスしたり改変したりできるのは、基本的には自社だけだからです。

しかし、企業のデータを一般市民が取得できるようになると、どうなるでしょう? 一般市民が、自分で企業級の情報システムを企画・設計できるようになるのです。

今まで企業が思いもよらなかったような新しい情報システムを、その企業の従来の思考にとらわれずにデータを読み解くことができる外部の人が作り、このデータをこう処理して、こんな感じで提示できるシステムを作ってみてはどうでしょう? と企業に提案することができるようになります。これによって、今までにないスピードでの技術革新が進むようになるでしょう。

企業が新入社員に求めることは「新人ならではのフレッシュな発想」である、と言われることがあります。この効果を、新入社員ではなく全国民に期待できようになるのが、オープンデータ化の魅力といえましょう。

デジタル化が進む

機械判読可能なデータが増えることで、今まで人手が必要であった作業を機械で代替できる可能性が生まれます。

例えば、紙のデータが機械のデータになったので読み取る手間がなくなる、ということは言うに及ばず、人がいくつかの情報をもとに行動を選択していたのが、その情報を機械で処理できるようになるためにAIによる予測・判断に置き換えられることもあるでしょう。情報を集めるのも、自分の手で探し集めるのではなく、機械がインターネット中を探していくだけで済むかもしれません。

このような近未来的ともとれる世界は、オープンデータによって支えられ、現実のものになるでしょう。

こんなところにオープンデータ

自治体

内閣は、オープンデータに関する一連の活動を「官民データ活用推進」と名付け、政策決定・ガイドライン策定に乗り出しています。中でも「官民データ活用推進基本法」は、国や地方公共団体に自らのデータのオープンデータ化の推進を義務付けています[4]。これらによって、AED設置箇所一覧、イベント一覧、公衆無線LANアクセスポイント一覧など[5]の公共物に関するあらゆる情報公開が全国単位で促進されることが期待できます。実際、これらの成果は「オープンデータ100」にて公開されています[6]。


図2. オープンデータ100選定事例: さばえぶらり


図2は、観光情報・グルメ情報・Wi-Fi設置場所などを一括表示する地図アプリ「さばえぶらり」です。このアプリにより、観光客への情報提供が円滑になるほか、自治体・学術機関・民間企業の分業による事業推進が実現できているとされています。


図3. オープンデータ100選定事例: 税金はどこへ行った?


図3は、自治体の税金・予算に関するページをオープンデータと捉え、自分の払った税金がどこに使われているかを計算・可視化するアプリ「税金はどこへ行った?」です。調布市にも対応しています。使途が思い当たらないデータでも、とりあえず公開・二次利用可能にしておくことで、このような思わぬアイデアにつながるかもしれません。

公共交通

鉄道・バス・飛行機・フェリーなどの公共交通についても、路線網、時刻表、運行情報などは、従来は運行会社や乗換案内アプリに閉じたデータでした。しかし、これらのデータをオープンデータ化するために「公共交通オープンデータセンター」が設立されました。このプラットフォームを通じて、運行会社からデータを受け取り、開発者にはデータ取得用のAPIを公開する取り組みが行われています[7]。


図4. Mini Tokyo 3D: 時刻表やリアルタイム遅延情報を元に、列車の運行を可視化。直感的に運行系統を把握できるアプリ。


この取り組みを補完するのが、オープンデータを用いたアプリのコンテストである「東京公共交通オープンデータチャレンジ」です。図4に示す「Mini Tokyo 3D」を始めとして、様々なデータを自由に組み合わせたアプリケーションが数多く提案されています。

オープンデータの壁

以上のようなオープンデータですが、まだ導入にあたっては壁もあります。

インセンティブが感じられない

データを公開するメリットよりも、データの整備に掛かる負担のほうが大きなデメリットとして感じられれば、オープンデータ化には手をつけることはないでしょう。今まで述べたオープンデータ化のメリットは、データを受け取った個人や、社会全体が主に受け取るものであり、データを公開する側に直接行き渡るものではないのが現状であると考えます。

オープンにしてはいけないデータもある

部外秘・社外秘・関係者外秘……など、秘匿すべき情報をどの企業も多かれ少なかれ抱えているものです。こういったデータは、再検討により公開できると判断される可能性もありますし、価値があるデータかもしれませんが、基本的には公開できないでしょう。

それだけではなく、もともと秘密ではなかったデータも、他のデータが掛け合わせることで秘密にすべきデータに変貌することもあります。例えば、「ある地域の数百メートル四方のメッシュ形式の人口・属性データ」と「住宅地図」をかけ合わせると、その地域が人口の少ない地域である時、個人や世帯が特定されることがあります[8]。この効果を「メッシュ効果」と呼びます。このように、単体では秘匿すべき情報が含まれていないデータも、オープン化にあたっては、プライバシーを侵害するリスクを抱えているのです。

おわりに

以上のように、オープンデータは「誰でも」「機械でも」アクセスできるデータが増えることにより、技術革新をリードする可能性を持っていることがわかりました。しかし、解決すべき課題もあります。ITを学ぶ学生として、私自身もなにか力になれたらと思います。

文献

[1] IT総合戦略室(2021)『オープンデータ基本指針』, https://cio.go.jp/sites/default/files/uploads/documents/data_shishin.pdf. 2017年制定, 2021年改正. 最終閲覧日: 2021/7/1.

[2] 『自治体オープンデータのCKAN』で「住民基本台帳」と検索した結果をこのリンクから閲覧できます: https://ckan.open-governmentdata.org/group/gr_0200?q=%E4%BD%8F%E6%B0%91%E5%9F%BA%E6%9C%AC%E5%8F%B0%E5%B8%B3. 最終閲覧日: 2021/7/1.

[3] Michael Hausenblasら, 『5 ★ オープンデータ』, https://5stardata.info/ja/. 最終閲覧日: 2021/7/2.

[4] 首相官邸(2016)『官民データ活用推進基本法』, https://www.kantei.go.jp/jp/singi/it2/hourei/detakatsuyo_honbun.html.

[5] IT総合戦略室(2017)『推奨データセットについて』, https://www.kantei.go.jp/jp/singi/it2/senmon_bunka/data_ryutsuseibi/jititai_swg_dai4/siryou4-3.pdf.

[6] IT総合戦略室(2021)『オープンデータ100』, https://cio.go.jp/opendata100. 最終閲覧日: 2021/7/1.

[7] 公共交通オープンデータ協議会(2019)『公共交通オープンデータセンター』, https://www.odpt.org/overview/. 最終閲覧日: 2021/7/2.

[8] 庄司昌彦(2015)『オープンデータの現状と課題』, インターネット白書2015・インプレスR&D.

文責 M1 小林

Previous Post Next Post