顧客体験がよければファンやリピーターを増やし、売上増加につながる
まずは顧客体験を想像してみてほしい。誰かが「スマートウォッチがほしい」と思ったとする。では、どこで買うだろうか。選択肢は山とある。オンラインショップから最安値を探す人もいれば、量販店で実物を手に取りながら比較したい人もいる。顧客が選ぶ基準は金額だけとは限らない。商品を探す段階から購入後のサポートまで、トータルの体験を考慮したうえで、自分好みの店舗を選んでいるはずだ。
なかでも接客は顧客からの信頼を高める重要な要素だ。対応がよければファンやリピーターとなり、売上の増加につながる。海外の調査では「顧客体験に優れたブランドは、そうでないブランドと比較して5.7倍もの収益をあげている」と指摘するものもある。Twilio Japan 中村光晴氏は「顧客体験への取り組みはコストととらえられがちですが、実際は明確な投資対効果のある成長戦略です」と強調する。
いま顧客体験の改善にAI活用が急速に広がっている。特にコールセンターではAI導入が早くから進んでいる。しかし日本はAIに対する評価が厳しい。TwilioがAI対応のカスタマーサポートの満足度を調査したところ、アジア太平洋地域平均の満足度は41%だったのに対し、日本は24%。調査国では最低の数字だ。
チャネル別に比較してみよう。日本の回答者が「忍耐強くいられる」(対話を続けられる)のは、人間との通話で76%、人間とのライブチャットで67%、AIとのチャットボットで55%、自動音声メニューで54%だった。
この結果について中村氏は「日本の消費者はカスタマーサポートにおいて、人間らしさや、自分の要求を理解してもらえること、スムーズな問題解決を重視しているところがあります。そのためAIを組み込んだサポートでは理想とのギャップがあり、不満につながっています」と説明する。日本の消費者はAIに対する期待が高い一方、実際の体験が追いついていない現状が浮き彫りになっている。
AIで変わるコールセンター──Twilioが描く顧客エンゲージメントプラットフォーム
コールセンターにAIを導入するメリットには、顧客体験向上とコスト削減が挙げられる。自動音声応答システム(IVR)では「〜〜は1番を押してください」と長々と音声案内を聞いてからボタン操作を強いるものだが、AIなら「本日はどのようなご用件ですか?」から始め、顧客は口頭で用件を単刀直入に伝えるだけで次のステップに進むことができる。これだけでも顧客のストレスは大きく減らせるだろう。
また従来型のコンタクトセンターだと、スキルがあるオペレーターに長々と待機列ができてしまい、待たされた顧客が不満を抱えることにつながっていた。一方、AIエージェントなら、投資できるリソース次第だが無制限に用意できるので顧客を待たせることはない。人間のオペレーターに比べればまだ解決能力は低いかもしれないが、初期対応や定型的な問い合わせなら対応可能なので待機列の解消に役立つだろう。
注目すべきは費用だ。中村氏の試算では、オペレーターの平均時給から換算すると、1分あたりの人件費は約26.67円だ。一方、AIエージェントだと、Twilioの音声連携サービス「ConversationRelay」の利用料が1分あたり約10円未満($0.07)で、これにGemini 2.5 Flashの生成AI使用料を加えても1分あたり10円強に収まる。人間なら約27円かかる1分の対応が、AIなら約10円にまで下がる計算だ。中村氏は「このコスト差は、これならPoCを開始してみようという強力な判断材料になるはずです」と強調した。
Twilioが描くAIを活用した顧客体験の世界は、データとAIとコミュニケーションチャネルの3つの柱がリアルタイムでつながり価値を高めていく「顧客エンゲージメントプラットフォーム」だ。
データにはコールのログや購買履歴などがあり、このデータをもとにAIがパーソナライズした回答を導き出し、顧客が望むコミュニケーションチャネル(電話、SMS、メッセージアプリ、ビデオ通話など)を通じて顧客にフィードバックしていくという流れだ。
顧客体験を改善していくうえで重要な要素は4つ挙げられる。(1)AIエージェント、(2)インテリジェントルーティング、(3)人間の能力の強化、(4)実用的なインサイトだ。
(1)AIエージェントは、顧客が自身で日常的な疑問を素早く解決できるよう対応し、リアルタイムの顧客データをもとにパーソナライズした回答を提供する。(2)は重要な情報をシームレスに引き継いだ状態で最適なエージェントにルーティングする。(3)はやりとりの最中に関連性の高い情報を提供するなどして人間のオペレーターをサポートする。(4)は現状でも実施されていることだが、コール履歴を分析し、実用的なインサイトとして改善に活かしていく。
これまでは「電話を切って終わり」だった対応が、会話の内容を要約してCRMに自動入力し、そのデータを次のアクションにつなげるサイクルに変わる。
ConversationRelayが実現する自然な対話──最適なLLMやサービスを選んで連携
Twilioが提供する電話とAIをつなぐ音声連携サービス「ConversationRelay」を詳しく見ていこう。電話の音声を文字起こしして、それぞれの環境で使うLLMに渡す。そして、LLMが出力するテキストを再び音声に変換して読み上げる。この一連の流れをワンパッケージで提供しているソリューションだ。
特徴としては、それぞれの環境で使うサービスやLLMに自由に接続できることだ。そのためLLMはGeminiでも、ChatGPTでも、Claudeでも、どれでもいい。また音声認識や音声合成とのサービス接続もリアルタイムかつ超低遅延でできるため、より人間らしい会話に近づく。もしAIが返事している途中に人間が割り込んでも、AIは一度立ち止まって聞いてから応答するなど、より人間のオペレーターの返答に近づけることができる。
業務の性質に合わせて最適なサービスを柔軟に選べるところが優位点であり、人間らしい会話を実現するための大きなポイントだ。会話の一連の流れでは、聞く(音声認識:Speech-to-Text)、回答を考える(LLM)、話す(音声合成:Text-to-Speech)のプロセスに分けることができて、それぞれのプロセスに応じてGoogle、AWS、Deepgram、ElevenLabsから多様なサービスが提供されている。
例えば電話品質(ノイズが入る)の日本語認識に強いGoogle、感情豊かな声を生成できるElevenLabs、遅延が少ないDeepgram、他にも低コスト、多言語対応など、それぞれに独自の強みや特徴がある。自由に選べるのは大きなメリットだ。
一般的には、異なるベンダーのAPIを連携することや、人間が話し始めたら会話を止めるといった割り込みも入ると制御が複雑になる。しかしConversationRelayはこうした複雑なオーケストレーションをTwilioが吸収する。アプリケーション開発者はTwilioとのWebSocketのコネクションを用意するだけで、あとはAIロジックに専念できる。具体的にはTwiMLの<ConversationRelay>タグに接続先のLLMやサービスを指定すればいい。そして既存のCRM(SalesforceやZendesk)、CCaaS(Contact Center as a Service:GenesysやNICEなど)とも連携できるので、既存システムを大きく変えることなく導入できる。
ConversationRelayが向いているのは、ある程度の開発力を持つISVや大企業だ。そのうえで「コア部分は自社で管理し、電話の応答部分は外部のサービスに委託したい」「AIエージェントを細かく自社制御したい」「好きなLLMを使いたい」「チャットボットに音声対応を追加したい」「レガシーIVRを生成AIでモダナイズしたい」「システム動作を自由にカスタマイズしたい」といった要望にマッチする。
活用事例の1つにアメリカの医療費支払いの体験改善を目指すCedarがある。アメリカでは医療制度が複雑なため、患者は診察後の支払いに戸惑うことが多い。そこでCedarは医療費請求・支払いプロセスを簡素化するプラットフォームを提供している。そのなかでコールセンターの問い合わせにAIエージェントを導入しており、その音声連携をTwilioのConversationRelayが支えている。今では受電のAI自動対応が進み、顧客の満足度の向上や待ち時間の短縮といった成果をあげている。
講演ではConversationRelayを活用したピザ注文のデモが披露された。ブラウザから電話をかけるとAIが対応し、注文内容を確認しながら画面上にリアルタイムでピザのイメージが組み上がっていく。顧客が質問の途中で返事をしても自然に会話が成立することを、デモを通じて示した。
最後に中村氏は「AIが登場したからといって、人間が要らなくなることはないと考えています。しかしある程度のことはAIに任せることで、人間は人間しか対応できないことにフォーカスしたり、時間を短縮したりできるので、お客さまの体験をさらに向上させることが可能です。AIエージェントを活用したシステム構築をぜひ一緒に実現させてもらえればと考えています」と締めくくった。
Twilio Japanからのお知らせ
本セッションでご紹介したサービスにご興味を持たれた方は、ぜひ公式サイトをご覧ください。

