Qwenは、6月23日、新しい言語モデル「Qwen-AgentWorld」を発表した。
Qwen-AgentWorldは、7つのドメインにわたるエージェント環境をシミュレートするネイティブ言語ワールドモデル。
一般的に言語エージェントは対話型環境で動作するようにトレーニングされているが、次に何が起こるかを予測するなど、環境自体をモデル化するように訓練された言語モデルは存在しない。その中でQwen-AgentWorldは「言語モデルに基き構築された世界モデリングが、汎用エージェントの能力の限界をさらに拡大する方法を調査する試み」だと位置づけられている。
Qwen-AgentWorldは単一のモデルで7つのエージェント環境(テキストベース:MCP、検索、ターミナル、SWE、GUIベース:Web、OS、Android)をカバーし、ドメインをシミュレートし、ナレッジを転送する。3つのGUIドメインでは、環境観測はレンダリング可能なコードの形式で行われるため、テキストのみで視覚環境のワールドモデリングが実現できる。
学習のプロセスは3段階で行われ、CPTが環境ナレッジを取り込み、SFTが次の状態予測推論を活性化し、RLがシミュレーションの忠実度を高める。
Qwen-AgentWorldは、2つの観点で世界モデリングが汎用エージェントを強化する方法を検証する。一つ目の観点は、現実環境では実現できない拡張性と制御性を提供する「分離型シミュレーション」。もう一つは、統一されたエージェント基盤モデル。LWMトレーニングに含まれていないドメインでも高い推論能力を発揮し、汎用的な能力が確認されている。
本モデルは、Hugging FaceとModelScopeから利用可能になっている。同時に、7つのドメインの評価ベンチマークであるAgentWorldBenchも公開されている。
詳細はブログポストから確認できる。
- 関連リンク
この記事は参考になりましたか?
- この記事の著者
-
CodeZine編集部(コードジンヘンシュウブ)
CodeZineは、株式会社翔泳社が運営するソフトウェア開発者向けのWebメディアです。「デベロッパーの成長と課題解決に貢献するメディア」をコンセプトに、現場で役立つ最新情報を日々お届けします。
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です
