サイバーエージェントは、225億パラメータの日本語LLMである「CyberAgentLM3」を、7月9日に公開している。
同社はかねてより日本語LLMの開発に取り組んでおり、2023年5月には独自の日本語LLMである「CyberAgentLM」を一般公開した。2023年11月にはバージョン2となる「CyberAgentLM2」、2024年6月には視覚を付与したVLM(大規模視覚言語モデル)を公開しており、これらの技術は同社が提供する「極予測AI」をはじめとするサービスにおいて広く活用されている。
今回、公開された「CyberAgentLM3」は、既存のモデルがベースではなく、スクラッチで開発された225億パラメータのCyberAgentLM3-22B-Chatとなる。LLMの日本語能力を評価するNejumi LLM リーダーボード3においては、700億パラメータのMeta-Llama-3-70B-Instructと同等の性能となっており、スクラッチ開発のオープンな日本語LLMとしてはトップクラスの性能といえる。
同モデルは、商用利用可能なApache License 2.0で提供されている。
この記事は参考になりましたか?
- この記事の著者
-
CodeZine編集部(コードジンヘンシュウブ)
CodeZineは、株式会社翔泳社が運営するソフトウェア開発者向けのWebメディアです。「デベロッパーの成長と課題解決に貢献するメディア」をコンセプトに、現場で役立つ最新情報を日々お届けします。
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です