Cognitionは3月1日(現地時間)、ソフトウェアエンジニアリング向け大規模言語モデルの新バージョン「SWE-1.6」の早期プレビューを発表した。
SWE-1.6は、既存のSWE-1.5の事後学習を施したモデルであり、従来と同等の速度(950トークン/秒)を維持しつつ、ベンチマーク「SWE-Bench Pro」においてSWE-1.5比で11%高いスコアを記録した。
同社は強化学習(RL)の手法を改良し、計算インフラを大幅に拡張することで、学習に使用する計算資源を100倍規模にまで拡大した。これにより、SWE-1.6の学習ステップは3カ月前と比較して6倍高速になったと説明している。評価方法に関しては、SWE-Bench Proを中心に用い、信頼性を重視して複数モデルや環境で正確な比較を行っている。
実運用で観察された課題として、SWE-1.6ではタスクの「考えすぎ」や過度な自己確認行動がみられるなど、強化学習による“ユーザー体験”への影響にも言及。Cognitionは、これらの現象を今後の重点研究分野と位置づけつつ、ユーザーからのフィードバックを基にさらなるチューニングを進める構えだ。
また、モデルの使い勝手に影響するUX(ユーザーエクスペリエンス)面への注目も集まっている。SWE-1.6は長時間思考や丁寧な問題分解が強化された一方で、過剰なコマンド実行や手順の増加も課題として挙げられており、今後はインタラクティブ性や作業効率の最適化も追求していく。同社は、正式リリースに向けてSWE-1.6の精度と使いやすさのさらなる向上を目指す方針である。
- 関連リンク
この記事は参考になりましたか?
- この記事の著者
-
CodeZine編集部(コードジンヘンシュウブ)
CodeZineは、株式会社翔泳社が運営するソフトウェア開発者向けのWebメディアです。「デベロッパーの成長と課題解決に貢献するメディア」をコンセプトに、現場で役立つ最新情報を日々お届けします。
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です
