CodeZine(コードジン)

特集ページ一覧

NVIDIA、対話型AIサービス開発用フレームワーク「Jarvis」を提供 音声認識、リアルタイム翻訳、読み上げ機能を搭載

  • LINEで送る
  • このエントリーをはてなブックマークに追加
2021/04/13 12:00

 米NVIDIAは、開発者が対話型AIサービスを構築できるフレームワーク「NVIDIA Jarvis」を4月12日(現地時間)に提供開始した。

 Jarvisは、高精度な自動音声認識や言語理解、複数言語へのリアルタイム翻訳、新しいテキスト読み上げ機能を提供し、表現力に優れた対話型AIエージェントの開発を可能にする。異なる言語、発音、環境、専門用語で構成された10億ページ以上のテキストおよび60,000時間分の音声データで、数100万GPU時間をかけてトレーニングされたさまざまなモデルを使って構築されており、高い精度を実現している。

 エンドツーエンドの音声パイプラインは100ミリ秒未満で実行可能であり、聴き取り、理解、応答の生成を高速に処理できる。音声パイプラインはクラウド、データ センター、エッジに展開し、瞬時にスケーリングして数100万ユーザーに対応可能。

 同社は、Jarvisの活用シーンとして、患者を24時間モニタリングすることで医療従事者の厳しい負担を和らげるデジタルナースや、消費者が求めている商品を理解し最適な候補を提案するオンラインアシスタント、国境を越えた共同作業や、母国語でのライブコンテンツ視聴を可能にするリアルタイム翻訳を挙げている。

 さらに同社は、世界最大規模のパブリックドメインの音声データセット「Common Voice」を提供するMozilla Common Voiceとも連携。Common VoiceとJarvisを使用してトレーニング済みモデルを開発し、そのモデルをMozillaコミュニティに無償で還元している。

関連リンク

  • LINEで送る
  • このエントリーをはてなブックマークに追加

あなたにオススメ

All contents copyright © 2005-2021 Shoeisha Co., Ltd. All rights reserved. ver.1.5