パナソニックは11月27日、パナソニックR&Dカンパニー オブ アメリカ(PRDCA)およびアメリカのUCLAと共同で、拡散モデルを用いたマルチモーダルAI「LaViDa」を開発したと発表した。
従来の自己回帰型手法に比べ、LaViDaは文章生成のスピードを可変にし、約2倍の高速化を実現した。また、画像とテキストを組み合わせて処理できる同モデルは、計算量削減やマスキング手法を工夫することで、精度と効率の両立を達成している。
LaViDaは、自然画像のQ&Aや数学・科学の問題、グラフ・チャートの内容理解など複数のデータセットで有効性を確認。既存手法よりも高性能・高効率を示した。この研究成果はAI・ML分野の国際会議NeurIPS 2025で発表される予定だ。
この記事は参考になりましたか?
- この記事の著者
-
CodeZine編集部(コードジンヘンシュウブ)
CodeZineは、株式会社翔泳社が運営するソフトウェア開発者向けのWebメディアです。「デベロッパーの成長と課題解決に貢献するメディア」をコンセプトに、現場で役立つ最新情報を日々お届けします。
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です
