Shoeisha Technology Media

CodeZine(コードジン)

特集ページ一覧

Google、「Google日本語入力(ベータ)」をリリース
Web上のデータを利用した豊富な語彙力と高い変換精度

  • ブックマーク
  • LINEで送る
  • このエントリーをはてなブックマークに追加
2009/12/03 15:21

 グーグルは3日、インプットメソッド「Google日本語入力(ベータ)」をリリースした。

Windows(32ビット)およびMac OSに対応した日本語入力ソフトウェアで、Web上の大量のデータを有効に利用して豊富な語彙力と高い変換精度を実現するなど、Googleらしい製品となっている。

 Google日本語変換の最大の特徴は、Web上の語句から機械的・自動的に生成された辞書で、人手ではカバーできない豊富な語彙力を誇る。実際に、MS IME 2007には最新語辞書11月版で追加された「婚カツ(こんかつ)」「ニコ動(にこどう)」「飛翔体(ひしょうたい)」「花鶏(あとり)」なども問題なく変換できる。

 また、既存の技術も活用されている。変換エンジンは、Web上の大量のデータから統計的言語モデルを構築することで高い変換精度を実現しているが、この分析にはGoogleの大規模分散処理システム「MapReduce」を利用。さらに、強力な予測変換は、Google検索のサジェストや「もしかして」で培われた機能だ。

 開発にあたったのはグーグル社内のエンジニアで、日本語形態素解析エンジン「MeCab」などで知られる工藤拓氏と、2003年度未踏ソフトウェアに採択された予測入力システム「PRIME」の小松弘幸氏を中心としたメンバー。Googleのいわゆる「20%プロジェクト」として開発された。なお、この記事も「Google日本語入力」によって執筆されている。

 
【関連リンク】
Google 日本語入力 - ダウンロード
Google Japan Blog: 思いどおりの日本語入力 - Google 日本語入力

  • ブックマーク
  • LINEで送る
  • このエントリーをはてなブックマークに追加
All contents copyright © 2005-2019 Shoeisha Co., Ltd. All rights reserved. ver.1.5