番号を押す時代の終わり——AI音声ボットは「実用段階」に達している
KDDIウェブコミュニケーションズのコミュニケーションDX本部でエバンジェリストを務める高橋氏は、グローバル・インターネット・ジャパン株式会社のCEOも兼務する実践者だ。2014年には自ら音声認識を活用した留守番電話サービス「TRANSREC(トランスレック)」を開発した経歴を持ち、音声とコミュニケーション技術の現場に携わってきた。
電話のユーザー体験は長らくIVR(インタラクティブ・ボイス・レスポンス)によって支えられてきた。1970年代から続くこの番号選択型の仕組みは、受ける側には取り次ぎ業務を削減するメリットがある。しかしかける側には、全選択肢を最後まで聞かなければ番号を押せない、「その他」の問い合わせは大抵一番後ろにある、誤操作すると戻れないといった不便が伴う。
その閉塞を打ち破ろうと登場したのがAI音声ボットだ。自然言語で会話ができるため、番号選択なしに一発で目的を達成できる。しかし、会話としてやり取りをするには、人間とは少し違うと感じる部分がある。「しゃべりにくさ」の課題があったのだ。
その課題がどこまで克服されたのかを、高橋氏はライブデモで示した。自作のトレーニングツールでシステムインストラクションを設定した「チャッピー電話」に、OpenAIのリアルタイムAPIを組み込み、会場で実際に電話をかけた。
まずサービスの解約方法を問い合わせると、ボットはFAQを検索して数秒で手順を案内した。続けて「新しい金融商品の営業です」と告げると、「申し訳ございませんが、営業のお電話はお断りしております」と即座に対応し、通話を切った。
AIが話している途中に、かぶせて(割り込んで)人が話す「バージイン(barge-in)」にも対応し、応答速度も良好だ。「これぐらいのクオリティで話してくれると、実用レベルに達している感じではないでしょうか」と高橋氏は語った。さらに「これは誰でもできるんですね。自分で作りましたから」と付け加えた。音声ボットは大企業の専売特許ではなく、今やエンジニアなら誰でも実装に踏み出せる段階にあるという。

