国立情報学研究所(NII)と地球の歩き方は学術研究分野でのデータ活用促進に向けて提携し、地球の歩き方が運営するウェブサイト「旅スケ」サービスに投稿された旅行記のテキストデータを、研究用に「地球の歩き方旅行記データセット」として11月24日(木)より無償提供を開始した。
地球の歩き方では、ガイドブック「地球の歩き方」を出版する傍ら、ウェブサイト「地球の歩き方web」にて、旅に関するさまざまな情報発信や、旅行者同士の情報交換の場の提供をしている。
今回の発表により、「地球の歩き方web」で2022年3月まで運営していた旅行記投稿サービス「旅スケ」に、サービス開始の2007年11月から2022年2月までに投稿された旅行記約1万4000件とそれに紐づく旅スケジュール約9500件のテキストが無償で提供される。
旅行記テキストについては、自動解析による形態素情報(単語の品詞など)と固有表現(地名、施設名など)をリストしたデータも併せて提供され、自然言語処理分野における場所を参照する言語表現の分析や、場所に対する感情分析および評判分析などの研究への活用が見込まれる。また、テキスト中の地名が実際に訪れた場所であるのか一般論としての言及であるのか周辺の文脈を読み解いたり、実際の地図上の位置と紐づけたりできるようになれば、旅行プランニングや観光地ナビゲーションといったアプリケーションへの応用も期待できるとしている。
NIIは2015年4月にデータセット共同利用研究開発センターを設置し、さまざまな民間企業や研究機関が保有する各種のデータセットを受け入れて研究者に提供する「情報学研究データリポジトリ」(IDR)事業に取り組むことで、大規模な実データと最先端情報技術を活用したデータサイエンス研究の加速に取り組んでいる。
- 関連リンク
この記事は参考になりましたか?
- この記事の著者
-
CodeZine編集部(コードジンヘンシュウブ)
CodeZineは、株式会社翔泳社が運営するソフトウェア開発者向けのWebメディアです。「デベロッパーの成長と課題解決に貢献するメディア」をコンセプトに、現場で役立つ最新情報を日々お届けします。
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です