SHOEISHA iD

※旧SEメンバーシップ会員の方は、同じ登録情報(メールアドレス&パスワード)でログインいただけます

CodeZine編集部では、現場で活躍するデベロッパーをスターにするためのカンファレンス「Developers Summit」や、エンジニアの生きざまをブーストするためのイベント「Developers Boost」など、さまざまなカンファレンスを企画・運営しています。

「PyData.Tokyo Meetup」イベントレポート

Pythonを使って地理情報の分析・可視化をしてみよう~PyData.Tokyo Meetup #9イベントレポート

  • X ポスト
  • このエントリーをはてなブックマークに追加

地理情報データを解析する際の課題

 前節ではいかにPythonが地理情報解析を行う際に優れた環境であるか、ということを説明しました。ただし仙石さん曰く、ツールとしてはいろいろな環境が整ってきている、しかしながら、地理情報データを解析するためには、それ以外の部分でさまざまな困難がある。具体的には以下の項目を解決すべきとのことでした。

  • データの扱いが特殊である
  • データがなかなか手に入らない、高価である

データの扱いが特殊である

 地球は楕円形をしています。一方、地理情報解析は地球上(3次元)のものを2次元の地図上で扱う必要がでてきます。よって、位置情報を2次元の座標(緯度・経度)に変換する場合は、何らかの投影手法によって3次元を2次元に投影した上で座標化する必要があります。ここで問題となるのは、それら投影変換の手法が数多く世の中に存在することです。もちろん、投影変換のルールは、データの利用目的などによって多種多様であるのは仕方ないのですが、データを利用する側としては、それらのデータがどの変換ルールで作られたか、専門用語でいうとどのような測地系で作られたかを把握しておく必要があります。

 例えば、日本地図は以前は日本測地系といわれる仕様でデータが提供されていました。しかし最近では世界測地系という仕様で地図データが扱われています。よって、これを把握せずにデータをマッピングしてしまうと下図のような現象がおきてしまいます。

 そこで、データの座標系の変換を、例えばproj4などのツールを利用して行う必要があるのですが、重要なポイントとしては「完璧な変換方法は存在しない」ということです。すなわち、地図データを変換する際に必ずある程度の誤差が発生してしまいます。よって、それらの誤差がどれだけ発生するかをあらかじめ見積もった上で変換する必要があります。大変ですね。

データは普通は無料ではない

 仙石さんは地理情報を扱うにあたって、データがなかなか集まらないという課題も指摘されていました。理由として、地理データは高価である、また、無料でも利用に何らかの制約があるため、自由に使えない、などが挙げられます。

 同課題に対して、各種団体から提供されるOpenDataを利用する方法が挙げられます。OpenDataとは特定のデータが、一切の著作権、特許などの制御メカニズムの制限なしで、すべての人が望むように利用・再掲載できるような形で入手できるべきであるという考えです。昨今では同じ考えに基づき、さまざまな団体が所有権、ライセンス、再利用についてコントロールしない形でデータを公開しています。

 例えば、日本では、電子行政オープンデータ戦略に基づき政府行政組織や地方公共団体がオープンデータを公開しています。data.go.jpには日本の公共団体が公開しているオープンデータが網羅されているので、ぜひご参考ください。

 また、民間組織が提供するオープンデータとしては、OpenStreetMapが提供するデータがあります。道路地図などの地理情報データを誰でも利用できるよう、フリーの地理情報データを作成することを目的としたプロジェクトです。誰でも自由に参加して、誰でも自由に編集でき、誰でも自由に利用することができます。最近ではFacebookやApple、Uberなども同データを利用して各社のサービスを構築していることが知られています。

 OpenStreetMapは地図データベースを提供します。地図データベースは、http://www.geofabrik.de/data/download.htmlから目的とする地域を指定した上でデータをダウンロードすることができます。

 地図を画像として利用したい場合は、自分自身で地図データベースをレンダリングした上で、目的とする地図を作成する手法と、OpenStreetMapが提供するタイル地図配信サーバ(openstreetmap.org)を利用する方法があります。ただし同サーバは、メンテナンスのため年に何回かシャットダウンされる、アクセス制限が厳しい、またそもそも指定したデザインの地図データしかダウンロードできない、などの課題があります。このような課題を解決したい場合は、地図データベースをレンダリングしたデータを提供しているサービスを利用する手もあります。例えばMapbox社は自分自身が指定したデザインに基づき地図をレンダリングするサービスなどを提供しています。またオンライン上の地図データへアクセスするためのiPhone/Android向けSDKやWeb APIを提供しています。利用量や目的によっては有料となる場合もありますが、地図データ自体はOpenStreetMapの地図データを利用しているため無料なので、目的によっては同サービスを利用して地図画像を入手することも検討されてはいかがでしょうか。

次のページ
今後の地理情報データ解析はもっとすごくなる

この記事は参考になりましたか?

  • X ポスト
  • このエントリーをはてなブックマークに追加
「PyData.Tokyo Meetup」イベントレポート連載記事一覧

もっと読む

この記事の著者

シバタアキラ(シバタ アキラ)

データサイエンティスト@DataRobot, Inc. PyData.Tokyoオーガナイザー 人工知能を使ったデータ分析によるビジネス価値の創出が専門分野。物理学博士。NYU研究員時代にデータサイエンティストとして加速器データの統計モデル構築を行い「神の素粒子」ヒッグスボゾン発見に貢献。その後ボストン・コンサルティング・グループでコンサルタント。白ヤギコーポレーションCEOを経て現職 Twitter: @madyagi Facebook: Akira Shibata DATAブログ: http://ashibata.com DataRobot, Incウェブサイト: http://datarobot.com

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

池内 孝啓(イケウチ タカヒロ)

神奈川県横浜市出身。1984年生まれ。ソフトウェア開発会社、インフラサービス提供会社を経て2011年3月株式会社ALBERT入社。クラウドコンピューティングを活用したマーケティングプラットフォーム事業の立ち上げに携わる。2014年1月に同社執行役員に就任。2015年8月株式会社ユーリエを設立。同社代表取締役社長兼CTO。2014年にコミュニティ PyData.Tokyo を共同で立ち上げるなど、Python と PyData ...

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

山本 光穂(ヤマモト ミツオ)

デンソーアイティーラボラトリ シニアエンジニア。2006年デンソーアイティーラボラトリ入社以来、時空間情報閲覧サービス(製品名:今昔散歩)や情報検索等に関する研究に従事。特に最近はドライバーの意図推定技術や同推定結果に基づく最適な情報提示技術に興味を持つ。趣味はマウンテンバイクとイングレス(Resistance)。Facebook: https://www.facebook.com/mitsuo.yamamoto.0112 Twitter: @kaita

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

この記事は参考になりましたか?

この記事をシェア

  • X ポスト
  • このエントリーをはてなブックマークに追加
CodeZine(コードジン)
https://codezine.jp/article/detail/9765 2016/11/15 14:00

おすすめ

アクセスランキング

アクセスランキング

イベント

CodeZine編集部では、現場で活躍するデベロッパーをスターにするためのカンファレンス「Developers Summit」や、エンジニアの生きざまをブーストするためのイベント「Developers Boost」など、さまざまなカンファレンスを企画・運営しています。

新規会員登録無料のご案内

  • ・全ての過去記事が閲覧できます
  • ・会員限定メルマガを受信できます

メールバックナンバー

アクセスランキング

アクセスランキング