SHOEISHA iD

※旧SEメンバーシップ会員の方は、同じ登録情報(メールアドレス&パスワード)でログインいただけます

CodeZine編集部では、現場で活躍するデベロッパーをスターにするためのカンファレンス「Developers Summit」や、エンジニアの生きざまをブーストするためのイベント「Developers Boost」など、さまざまなカンファレンスを企画・運営しています。

【デブサミ2018 夏】セッションレポート

教えて!goo「恋愛相談AI」が挑むのは、「予定調和を破壊する」コミュニケーション――世界初の長文生成AIはどのように生まれたのか【デブサミ2018 夏】

【B-4】「教えて!goo」3000万件のQAデータから、世界初の長文生成AIが生まれるまで~AIによる恋愛相談の裏側~

  • X ポスト
  • このエントリーをはてなブックマークに追加

「世界初」長文AIの構造とその実力

 オシエルは、「教えて!goo」上に回答者として登場する。書き込む回答は、質問の文脈をまず汲み取り、その上で過去のQAデータをもとにして生成される。生成されたものを必ず使用するのではなく、一定のスコアを上回るもののみを採用することで品質を確保しているという。また回答後に、質問者、閲覧者からの評価を学習することで、回答の精度が自動的に高まっていく仕組みとしている。

 回答の生成プロセスには、「NTTレゾナント手法」と呼ぶ手法を採用している。その有効性として「QA-LSTM」[1]という既存手法と比較した解説がなされた。QA-LSTMがいくつかの回答の中から最も適合すると思われるものを一つ抜き出して使用するのに対し、NTTレゾナント手法は回答群から文脈を解析・抽出して自然な文章を生成するため、より質問に最適で、また多様性のある回答を生み出せるという。

NTTレゾナント手法では、最終的な回答生成のために複数の回答が用いられる
NTTレゾナント手法では、最終的な回答生成のために複数の回答が用いられる

[1] 「QA-LSTM」は計算言語学・自然言語処理に関する国際学会ACL(Annual Meeting of the Association for Computational Linguistics)にて2016年に発表された手法

 NTTレゾナント手法を用いたオシエルの回答には、内部的に3つのアプローチがとられている。

 一つ目は、AIでの回答生成に先立ち、「抽象的なシナリオ」を定義しているということ。複雑かつ長文の回答生成を実現するためにまずその枠組みを定型化する必要があり、「共感」「結論」「理由」「励まし」「名言」の順に記入するという構造をサービスデザイン担当者が定義した。

オシエルの回答形式は担当者にデザインされた形式を適用
オシエルの回答形式は担当者にデザインされた形式を適用

 二つ目に、質問と回答のマッチングの最適化と同時に「回答文間のマッチングの最適化」を行うということ。回答は「理由」と「結論」に分けることができ、その「質問」「理由」「結論」すべての組み合わせが最適化されていなければならない。

 例えば「彼の態度が気になる」という質問に対し、「その態度は脈ありだと思います」という結論を出す場合は、質問と結論の両方に合致する「もし嫌いならそのような返事はしません」という理由が導き出される。

 三つ目は、結論と理由の流れを自然にするために、「アテンションメカニズム」を導入しているということ。これは結論において特に重要なトピックが理由に含まれるようにするという仕組みである。先の例でいえば恋愛において重要な「脈」というキーワードを抜き出し、それに関連しそうな言葉が理由の中に現れるようにする。すると、「その態度は脈ありだと思います」の結論に対する理由として「脈があれば連絡がすぐ来るものですから」のような、先の例に比べてより結論と理由の流れが滑らかになる回答が生成できる。

 これらの構造を持つAIに対し、サービス開始前に行われた机上検証では、まず18万以上の質問と77万以上の既存QAから単語ベクトルの学習が行われ、結論・理由のペア5,000件から回答生成の学習が行われた。レゾナント手法をQA-LSTMと比較した評価では、定量評価(生成した回答が元の質問に紐づく回答と同一であれば正答とする)で20%以上の差をつけて勝り、定性評価(複数人の被験者が生成された200件の回答に対し4段階でグレード評価)では2倍以上の差をつけてグレード1を獲得したという。

定性評価、定量評価のいずれもNTTレゾナント手法が既存手法(QA-LSTM)を凌駕 定性評価、定量評価のいずれもNTTレゾナント手法が既存手法(QA-LSTM)を凌駕
定性評価、定量評価のいずれもNTTレゾナント手法が既存手法(QA-LSTM)を凌駕

 実用化後の実績も上々で、オシエルは2018年7月23日現在で30,000件を超える回答を行い、そのうちgood獲得率は約17%、ベストアンサー獲得率は5%に及ぶが、このスコアは一般の回答者に引けを取らないレベルであるとされた。

現在のオシエルの実力。人間と比較しても上々の成績であるという
現在のオシエルの実力。人間と比較しても上々の成績であるという

今後の展開

 オシエルの技術からさまざまに派生した取り組みを行っている。その一つが「チャットボット版AIオシエル」である。NTTドコモ社のサービス「my daiz」上に登場するキャラクターで、一問一答ではなく数ターンのセッション対話を通じて恋の悩みに回答するというもの。セッション内での対話を記憶し、パーソナライズも行うという。

チャットボット版のオシエルもセッション当日にリリースされた
チャットボット版のオシエルもセッション当日にリリースされた

 パーソナライズ対話を実現するのは、「PLSTM(パーソナライズLSTM)」と呼ぶ技術である。一つ前の発話、二つ前の発話、と過去のユーザーの発話をベクトル化し、それぞれが「現在の発話にどれくらい貢献するか」という重みづけを学習した上でコンテクストベクトルを生成する。それをもとに応答を生成することで過去の発話と今回のAI応答の関係を最適化するという。

 チャットボット版はアプローチの一例であり、今後のAI活用として、音や色彩など言語外データとの連動や、適用領域を恋愛シミュレーションなどのゲームやアート、さらにはお笑いや短歌などにまで広げようという幅広い研究が行われているという。

 さまざまな枠組みに向けて発展する同社の試みに一貫するのは、「人に寄り添うAI」によって「予定調和のないワクワクするコミュニケーション」を生み出すというコンセプト。最新のAIが人間の情緒にどう作用しているか、その片鱗に触れるために、まずは教えて!gooの恋愛相談カテゴリで、オシエルの活躍を覗いてみては。

この記事は参考になりましたか?

  • X ポスト
  • このエントリーをはてなブックマークに追加
【デブサミ2018 夏】セッションレポート連載記事一覧

もっと読む

この記事の著者

西野 大介(SOMPOホールディングス株式会社)(ニシノ ダイスケ)

 SOMPOホールディングス株式会社デジタル戦略部(SOMPO Digital Lab)勤務。損保ジャパン日本興亜グループにおける先進技術の研究開発を担当。過去には基幹システムの開発にも従事し、SoR/SoE双方の開発において幅広い経験を持つ。本業以外では、CodeZineの連載をはじめ、国内/海外の各種カンファレンスへの登壇や企業向けの講演にてテクノロジー情報を幅広く提供している。主な登壇実績:IBM THINK(米ラスベガス)、Java Day Tokyo、IBM THINK Ja...

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

この記事は参考になりましたか?

この記事をシェア

  • X ポスト
  • このエントリーをはてなブックマークに追加
CodeZine(コードジン)
https://codezine.jp/article/detail/11132 2018/10/12 14:00

おすすめ

アクセスランキング

アクセスランキング

イベント

CodeZine編集部では、現場で活躍するデベロッパーをスターにするためのカンファレンス「Developers Summit」や、エンジニアの生きざまをブーストするためのイベント「Developers Boost」など、さまざまなカンファレンスを企画・運営しています。

新規会員登録無料のご案内

  • ・全ての過去記事が閲覧できます
  • ・会員限定メルマガを受信できます

メールバックナンバー

アクセスランキング

アクセスランキング