Web界隈の現場プログラマーを突撃インタビューする「プログラマーインタビュー」シリーズ。第7回のゲストは、オモロ検索エンジン「SAGOOL」(サグール)を開発するチームラボ代表 猪子氏です。日本再生を謳うチームラボの技術力・創造力とは? オモロ話が次々と飛び出した今回のインタビュー。ぜひ、お楽しみください。
チームラボの設立 -
高いテクノロジーと豊かな文化を創造する
編集部
本日はよろしくお願いします。それではまず、
チームラボ株式会社を設立するまでの経緯から教えてください。
猪子
チームラボではインターネットテクノロジーを扱ってるんですが、インターネットに興味を持ったきっかけは、高校3年生の終わりに出会ったNHKの「
新・電子立国」という番組でした。
編集部
どのような番組だったのですか。
猪子
もっと昔に「
電子立国」という、日本が世界へガンガン進出していく時代のドキュメンタリーがあって、これの続編です。だけど、新・電子立国になると日本の話はほとんど出てこなくてアメリカの話ばっかり。第1回の最後でシリコングラフィックスの会長を辞めたジム・クラークが、最終回のネットスケープの話でまた出てくるという、ドラマチックでちょっとうそくさい作りだったのですが、ここでインターネットが出てきて、インターネットすごいな、インターネットやらなきゃ! と思ったんです。
編集部
どの辺が特にすごいと感じたんですか?
猪子
インターネットって、体制側じゃなくて資本も権力もない人たちが自由に情報が取れて情報を発信できる、人類史上始めてのメディアじゃないですか。必然として、革命のようにすべてがひっくり返るような変化が起こるんじゃないかと。
編集部
なるほど。それでその後は?
猪子
大学では、
ヒドゥンマルコフモデル(HMM)という確率モデルを使った、オンライン(時間情報を持った)の手描き文字認識を研究しました。すでに起業を考えていたので、大学院への進学と同時に起業した感じですね。大学院では、自然言語処理を研究しました。
編集部
では、その経験を活かして会社を設立したことになるのでしょうか?
猪子
そういうことになりますかね(笑)。チームラボの関連会社「チームラボビジネスディベロップメント株式会社」で開発している検索エンジン「
SAGOOL(サグール)」では、そのときに知識が役に立っているんじゃないかと思います。
編集部
具体的に、どう役に立ったのでしょうか?
猪子
従来のサーチエンジンは、自然言語処理によるキーワードとページのマッチ度だけで検索していたのですが、Googleがページランクという概念を導入したことで検索精度が飛躍的に上昇しました。被リンク数の多いページは価値が高い、価値が高いページからのリンクは価値が高い、というやつですね。実は、その検索エンジンのページランクもマルコフモデルなんです。
基本的には、ページからページへリンク数分だけ同等の確率で遷移するとして、リンク先のページにいったらそのリンク分だけ同様に遷移する。それを繰り返して、ある一定時間後(無限時間後)に全体でどこにいる確率がそれぞれあるか、がページランクなんですよね。
つまり、現在のサーチエンジンテクノロジーのメインとも言えるこの2つを大学で勉強しました。
レコメンデーションとコンテンツマッチング
編集部
どんな仕事から始められたんですか?
猪子
初めは「
セレクトウェア」という、アクセスログを分析するレコメンデーションエンジンを作ったんですけど、まったく売れなくて…(笑)。Amazonみたいなお薦めのリンクを提供するエンジンです。
編集部
なるほど、大変ですね。それでどうされたのでしょうか。
猪子
それで仕方なく、小さい店舗のWebサイトを15万とかで作っていました。そのうち評判が上がってWeb制作の仕事が増えてくると、こちらがよいと思うものを作りやすくなるじゃないですか。そこで大きいサイトをトータルでソリューションした際に先端の技術を導入したら、さらにドンドン売れるようになって、最近ようやく、テクノロジーが単体で売れるようになってきた感じですね。
編集部
レコメンデーションエンジン以外のテクノロジーも扱っているんでしょうか?
猪子
やってますよ。たとえば、ニュースサイトの「
iza(イザ!)」(産経新聞社)に導入したコンテンツマッチングというエンジンも扱っています。文章の全文を分析して、それと近いコンテンツを選び出すものですね。これも売れ始めてきました。
コンテンツマッチングエンジン「セレクトウェア コンテンツマッチ」の導入例:
iza(株式会社産経デジタル)
編集部
そういう単体のテクノロジーは、既存のサイトにもスムーズに導入できるんですか?
猪子
完全に汎用化されているので、問題ないですね。
編集部
レコメンデーションとコンテンツマッチングの大きな違いはどの辺にあるんでしょうか?
猪子
どちらも、コンテンツに関連したコンテンツなり商品なりにリンクを付けていくという最終的なアウトプットは同じなんですけど、レコメンデーションエンジンのメリットは、あまりコンテンツに依存しないことですね。
たとえば、デザインの良し悪しといった人の選択って、理屈だけじゃ分からない部分があるじゃないですか。そういった、コンテンツ自体にあまり依存しないモノの最適解を、サイトのアクセスログ解析から確率モデルで見つけようという話です。
編集部
なるほど。どちらがいいとかあるのでしょうか。
猪子
究極的にいうとログ解析の方がいいんですよ。ただ、コンテンツマッチングの方がよいときがいっぱいあって、たとえばニュースの場合は、出た瞬間に関連リンクがあった方がいいですよね。このように、コンテンツマッチングはアクセスログが貯まるまえに対応できるのがメリットです。
編集部
テクノロジーが単体で売れ始めて、よかったですか?
猪子
初めからこういったテクノロジーを売りたかったんで、嬉しいですね。OSが普及してデータベースが広まり、ネットなのでデータがすごい勢いで増え出したら、データをどう扱うかが必要になってくるじゃないですか。そこで今まで話したようなエンジンに需要が出てくるんじゃないかと考えていました。