グーグルは3日、インプットメソッド「Google日本語入力(ベータ)」をリリースした。
Google日本語変換の最大の特徴は、Web上の語句から機械的・自動的に生成された辞書で、人手ではカバーできない豊富な語彙力を誇る。実際に、MS IME 2007には最新語辞書11月版で追加された「婚カツ(こんかつ)」「ニコ動(にこどう)」「飛翔体(ひしょうたい)」「花鶏(あとり)」なども問題なく変換できる。
また、既存の技術も活用されている。変換エンジンは、Web上の大量のデータから統計的言語モデルを構築することで高い変換精度を実現しているが、この分析にはGoogleの大規模分散処理システム「MapReduce」を利用。さらに、強力な予測変換は、Google検索のサジェストや「もしかして」で培われた機能だ。
開発にあたったのはグーグル社内のエンジニアで、日本語形態素解析エンジン「MeCab」などで知られる工藤拓氏と、2003年度未踏ソフトウェアに採択された予測入力システム「PRIME」の小松弘幸氏を中心としたメンバー。Googleのいわゆる「20%プロジェクト」として開発された。なお、この記事も「Google日本語入力」によって執筆されている。
【関連リンク】
・Google 日本語入力 - ダウンロード
・Google Japan Blog: 思いどおりの日本語入力 - Google 日本語入力
この記事は参考になりましたか?
- この記事の著者
-
CodeZine編集部(コードジンヘンシュウブ)
CodeZineは、株式会社翔泳社が運営するソフトウェア開発者向けのWebメディアです。「デベロッパーの成長と課題解決に貢献するメディア」をコンセプトに、現場で役立つ最新情報を日々お届けします。
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です