Shisa.AIは、日英バイリンガル汎用チャットモデル「Shisa V2」シリーズの正式リリースを、4月22日に発表した。
Shisa V2は、Shisa V1からさらに進化して、業界標準ベンチマークにおいて日本語処理能力で圧倒的なスコアを達成するとともに、英語性能もトップクラスを維持するバイリンガルモデル。高コストな事前学習に代えて合成データを活用した訓練後最適化を重点的に実施することによって、出力の自然さ・文脈理解力の向上、翻訳やロールプレイなど、実用的なタスクにおける性能の向上を実現している。
小型の7Bモデルから大型の70Bモデルまで、幅広い規模でのバージョンを公開しており、Qwen2.5やLlama3.1といった各クラスのベースモデルから日本語処理能力が大幅に向上して、日常業務から専門的なタスクまで、あらゆるシーンで高い実用性を発揮する。
これまで測定が難しかった、実用的なタスクにも焦点を当てて、同社が独自開発した以下の日本語ベンチマークでも、卓越した能力を発揮している。
- shisa-jp-ifeval:高度な日本語指示追従能力を評価
- shisa-jp-rp-bench:複雑なロールプレイおよび複数ターンにわたる対話能力を評価
- shisa-jp-tl-bench:高品質な日英翻訳能力を評価
なお、これらのベンチマークは近日中にオープンソースで公開される。
- 関連リンク
この記事は参考になりましたか?
- この記事の著者
-
CodeZine編集部(コードジンヘンシュウブ)
CodeZineは、株式会社翔泳社が運営するソフトウェア開発者向けのWebメディアです。「デベロッパーの成長と課題解決に貢献するメディア」をコンセプトに、現場で役立つ最新情報を日々お届けします。
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です