AIエージェントがコマンドラインからブラウザを直接制御する自動化ツール「Browser Use CLI」がリリースされた。
Browser Use CLIは、ページのナビゲーション、要素のクリック、フォームへの入力、JavaScriptの実行といったブラウザ操作を実行可能。管理されたHeadless Chromium、既存のユーザープロファイルとログイン情報を持ったChrome、そしてBrowser Use Cloud APIを介したクラウドホスト型ブラウザの、3つのブラウザモードをサポートしている。
また、クラウドプラットフォーム管理も可能で、エージェントタスク、クラウドブラウザセッション、プロファイル、ワークスペースなどを管理するためのBrowser Use API(v2 および v3)への汎用RESTパススルー機能を備えている。クラウドダッシュボードで利用可能なすべての機能に、ターミナルからアクセスできる。
ブラウザの基本的なワークフローは、ページに移動し、state要素のインデックス番号を取得するコマンドを実行し、そのインデックスを使用して操作を行う。クラウドのワークフローは、cloud login認証を行い、cloud v2/cloud v3コマンドを使用して任意のAPIエンドポイントにアクセスするか、またはcloud connectクラウドブラウザを直接プロビジョニングして操作する。
インストールや仕組みの詳細は公式ドキュメントを参照のこと。
- 関連リンク
この記事は参考になりましたか?
- この記事の著者
-
CodeZine編集部(コードジンヘンシュウブ)
CodeZineは、株式会社翔泳社が運営するソフトウェア開発者向けのWebメディアです。「デベロッパーの成長と課題解決に貢献するメディア」をコンセプトに、現場で役立つ最新情報を日々お届けします。
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です
