SHOEISHA iD

※旧SEメンバーシップ会員の方は、同じ登録情報(メールアドレス&パスワード)でログインいただけます

CodeZine編集部では、現場で活躍するデベロッパーをスターにするためのカンファレンス「Developers Summit」や、エンジニアの生きざまをブーストするためのイベント「Developers Boost」など、さまざまなカンファレンスを企画・運営しています。

Developers Summit 2025 セッションレポート(AD)

LLM登場で進化したバーチャルヒューマンエージェント、“人間らしさ”を追求する技術とは?

【14-E-5】自然言語で駆動するバーチャルヒューマン:より人間らしい対話を実現する技術 ~LLM登場前と後で何が変わり、どんな課題があるか~

  • X ポスト
  • このエントリーをはてなブックマークに追加

 まるで人間のような対話ができる「バーチャルヒューマンエージェント」。各社がAIエージェントの開発競争を繰り広げる中、より人間に近づけるために欠かせないものとは何なのか。全国のファミリーマート約7000店舗で導入されている人型AIアシスタント「レイチェル」を提供するクーガー株式会社の平賀一昭氏と大須賀稔氏が、その裏側について語った。

  • X ポスト
  • このエントリーをはてなブックマークに追加

バーチャルヒューマンエージェントの仕組み

 クーガーが開発する人型AIプラットフォーム「LUDENS(ルーデンス)」は、中枢となる「LudensCore」、視覚となる「VisualCortex」、言語能力となる「LanguageCortex」、そしてインターフェースとなる「バーチャルヒューマンエージェント(VHA)」で構成されている。

 このLUDENSから生まれたのが、人型AIアシスタント「レイチェル」だ。レイチェルは3Dモデルで表現された人間らしい外見や表情、音声認識と自然言語処理などを用いて対話する能力、対話の文脈を理解して適切な応答を生成する知能や判断力を持ち合わせている。一言で定義するなら「コンピュータ上で人間の姿や振る舞いを再現している仮想人間」だ。

 そんなバーチャルエージェントのアーキテクチャーを示したのが、以下の図である。

バーチャルヒューマンエージェントのアーキテクチャー
バーチャルヒューマンエージェントのアーキテクチャー

 入力は、ユーザーの音声と画像の2つ。カメラが捉えた画像からユーザーの表情などを分析すると同時に、発話の音声データをテキストに変換して、対話システムで応答を生成する。その後、画像から得た情報と生成された応答テキストをもとに、3Dモデルの振る舞いを決定し、最終的に3Dモデルを通して応答と振る舞いを同時に出力する仕組みになっている。

 対話システムの中身をより詳しく見てみよう。まず発話のテキストに含まれる情報を分析する。ユーザーの意図を理解して、対話履歴として保存した後に、過去の対応履歴などから行動を選択。その際、必要があれば、外部のリソースにもアクセスして、データを参照している。次の応答生成においては、より自然な文章になるよう、大規模言語モデル(以下、LLM)などを用いている。

 改めて、対話システムとしてのバーチャルヒューマンエージェントを紐解いてみると、主に次のようなモジュールの集合体であると捉えることができる。

  1. 自然言語理解
    • テキスト解析を用いて、ユーザーの発話内容(意図や感情)を理解する。
  2. 画像認識
    • 画像解析を用いて、ユーザーを識別・表情や感情を理解する。
  3. 対話管理
    • 文脈(ユーザーの状況・これまでの発話など)を管理し、次の行動を決定する。
    • シナリオベースやルールベース、もしくはAIを用いた動的な行動選択する。
  4. 応答生成
    • 応答内容を自然言語で表現する。
    • LLMを活用することで、より自然で豊かな言い回しが可能に。
  5. マルチモーダル出力
    • 発話を含め、3Dモデルの口の動きや表情の変化、身振り・手振りといったアニメーションを追加する。
    • 人間的な存在感や親しみやすさを演出し、ユーザーの没入感を高める。

 バーチャルヒューマンエージェントの高度化において欠かせないのが、応答生成におけるLLMだ。最新情報や企業内情報のインプットには外部の知識ベースにAPI連携しておく必要があったり、ファインチューニングするためには一定の専門知識や技術力が必要であったりするものの、人間らしさを追求する上で、LLMは必要不可欠である。次に、バーチャルヒューマンエージェント開発におけるLLMの重要性について見ていこう。

次のページ
自然な会話をするために欠かせないLLM

この記事は参考になりましたか?

  • X ポスト
  • このエントリーをはてなブックマークに追加
Developers Summit 2025 セッションレポート連載記事一覧

もっと読む

この記事の著者

野本 纏花(ノモト マドカ)

 フリーライター。IT系企業のマーケティング担当を経て2010年8月からMarkeZine(翔泳社)にてライター業を開始。2011年1月からWriting&Marketing Company 518Lab(コトバラボ)として独立。共著に『ひとつ上のFacebookマネジメント術~情報収集・人脈づくり...

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

井山 敬博(イヤマ タカヒロ)

 STUDIO RONDINOのカメラマン。 東京綜合写真専門学校を卒業後、photographer 西尾豊司氏に師事。2008年に独立し、フリーを経て2012年からSTUDIO RONDINOに参加。 STUDIO RONDINO Works

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

CodeZine編集部(コードジンヘンシュウブ)

CodeZineは、株式会社翔泳社が運営するソフトウェア開発者向けのWebメディアです。「デベロッパーの成長と課題解決に貢献するメディア」をコンセプトに、現場で役立つ最新情報を日々お届けします。

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

提供:クーガー株式会社

【AD】本記事の内容は記事掲載開始時点のものです 企画・制作 株式会社翔泳社

この記事は参考になりましたか?

この記事をシェア

  • X ポスト
  • このエントリーをはてなブックマークに追加
CodeZine(コードジン)
https://codezine.jp/article/detail/21126 2025/03/31 12:00

おすすめ

アクセスランキング

アクセスランキング

イベント

CodeZine編集部では、現場で活躍するデベロッパーをスターにするためのカンファレンス「Developers Summit」や、エンジニアの生きざまをブーストするためのイベント「Developers Boost」など、さまざまなカンファレンスを企画・運営しています。

新規会員登録無料のご案内

  • ・全ての過去記事が閲覧できます
  • ・会員限定メルマガを受信できます

メールバックナンバー

アクセスランキング

アクセスランキング