地理情報データを解析する際の課題
前節ではいかにPythonが地理情報解析を行う際に優れた環境であるか、ということを説明しました。ただし仙石さん曰く、ツールとしてはいろいろな環境が整ってきている、しかしながら、地理情報データを解析するためには、それ以外の部分でさまざまな困難がある。具体的には以下の項目を解決すべきとのことでした。
- データの扱いが特殊である
- データがなかなか手に入らない、高価である
データの扱いが特殊である
地球は楕円形をしています。一方、地理情報解析は地球上(3次元)のものを2次元の地図上で扱う必要がでてきます。よって、位置情報を2次元の座標(緯度・経度)に変換する場合は、何らかの投影手法によって3次元を2次元に投影した上で座標化する必要があります。ここで問題となるのは、それら投影変換の手法が数多く世の中に存在することです。もちろん、投影変換のルールは、データの利用目的などによって多種多様であるのは仕方ないのですが、データを利用する側としては、それらのデータがどの変換ルールで作られたか、専門用語でいうとどのような測地系で作られたかを把握しておく必要があります。
例えば、日本地図は以前は日本測地系といわれる仕様でデータが提供されていました。しかし最近では世界測地系という仕様で地図データが扱われています。よって、これを把握せずにデータをマッピングしてしまうと下図のような現象がおきてしまいます。
そこで、データの座標系の変換を、例えばproj4などのツールを利用して行う必要があるのですが、重要なポイントとしては「完璧な変換方法は存在しない」ということです。すなわち、地図データを変換する際に必ずある程度の誤差が発生してしまいます。よって、それらの誤差がどれだけ発生するかをあらかじめ見積もった上で変換する必要があります。大変ですね。
データは普通は無料ではない
仙石さんは地理情報を扱うにあたって、データがなかなか集まらないという課題も指摘されていました。理由として、地理データは高価である、また、無料でも利用に何らかの制約があるため、自由に使えない、などが挙げられます。
同課題に対して、各種団体から提供されるOpenDataを利用する方法が挙げられます。OpenDataとは特定のデータが、一切の著作権、特許などの制御メカニズムの制限なしで、すべての人が望むように利用・再掲載できるような形で入手できるべきであるという考えです。昨今では同じ考えに基づき、さまざまな団体が所有権、ライセンス、再利用についてコントロールしない形でデータを公開しています。
例えば、日本では、電子行政オープンデータ戦略に基づき政府行政組織や地方公共団体がオープンデータを公開しています。data.go.jpには日本の公共団体が公開しているオープンデータが網羅されているので、ぜひご参考ください。
また、民間組織が提供するオープンデータとしては、OpenStreetMapが提供するデータがあります。道路地図などの地理情報データを誰でも利用できるよう、フリーの地理情報データを作成することを目的としたプロジェクトです。誰でも自由に参加して、誰でも自由に編集でき、誰でも自由に利用することができます。最近ではFacebookやApple、Uberなども同データを利用して各社のサービスを構築していることが知られています。
OpenStreetMapは地図データベースを提供します。地図データベースは、http://www.geofabrik.de/data/download.htmlから目的とする地域を指定した上でデータをダウンロードすることができます。
地図を画像として利用したい場合は、自分自身で地図データベースをレンダリングした上で、目的とする地図を作成する手法と、OpenStreetMapが提供するタイル地図配信サーバ(openstreetmap.org)を利用する方法があります。ただし同サーバは、メンテナンスのため年に何回かシャットダウンされる、アクセス制限が厳しい、またそもそも指定したデザインの地図データしかダウンロードできない、などの課題があります。このような課題を解決したい場合は、地図データベースをレンダリングしたデータを提供しているサービスを利用する手もあります。例えばMapbox社は自分自身が指定したデザインに基づき地図をレンダリングするサービスなどを提供しています。またオンライン上の地図データへアクセスするためのiPhone/Android向けSDKやWeb APIを提供しています。利用量や目的によっては有料となる場合もありますが、地図データ自体はOpenStreetMapの地図データを利用しているため無料なので、目的によっては同サービスを利用して地図画像を入手することも検討されてはいかがでしょうか。