agent-browser
AI エージェント向けのブラウザ自動化 CLI です。ウェブサイトとの対話が必要な場合に使用します。ページ遷移、フォーム入力、ボタンクリック、スクリーンショット取得、データ抽出、ウェブアプリのテスト、ブラウザ操作の自動化など、あらゆるブラウザタスクに対応できます。「ウェブサイトを開く」「フォームに記入する」「ボタンをクリックする」「スクリーンショットを取得する」「ページからデータを抽出する」「このウェブアプリをテストする」「サイトにログインする」「ブラウザ操作を自動化する」といった要求や、プログラマティックなウェブ操作が必要なタスクで起動します。
description の原文を見る
Browser automation CLI for AI agents. Use when the user needs to interact with websites, including navigating pages, filling forms, clicking buttons, taking screenshots, extracting data, testing web apps, or automating any browser task. Triggers include requests to "open a website", "fill out a form", "click a button", "take a screenshot", "scrape data from a page", "test this web app", "login to a site", "automate browser actions", or any task requiring programmatic web interaction.
SKILL.md 本文
agent-browser によるブラウザ自動化
コアワークフロー
すべてのブラウザ自動化は以下のパターンに従います:
- ナビゲーション:
agent-browser open <url> - スナップショット:
agent-browser snapshot -i(要素参照@e1、@e2などを取得) - インタラクション: 参照を使用してクリック、入力、選択を実行
- 再スナップショット: ナビゲーション後や DOM 変更後、新しい参照を取得
agent-browser open https://example.com/form
agent-browser snapshot -i
# 出力: @e1 [input type="email"], @e2 [input type="password"], @e3 [button] "Submit"
agent-browser fill @e1 "user@example.com"
agent-browser fill @e2 "password123"
agent-browser click @e3
agent-browser wait --load networkidle
agent-browser snapshot -i # 結果を
...
詳細情報
- 作者
- JimmyLv
- リポジトリ
- JimmyLv/BibiGPT-v1
- ライセンス
- GPL-3.0
- 最終更新
- 2026/5/4
Source: https://github.com/JimmyLv/BibiGPT-v1 / ライセンス: GPL-3.0