browser-use
browser-use CLIを使用したAI搭載ブラウザ自動化(`uvx browser-use`)です。Webサイトの閲覧、要素のクリック、フォーム入力、スクリーンショット撮影、データ抽出、Web タスク自動化ができます。ユーザーがWebページを操作したい、データをスクレイピングしたい、フォームを自動入力したい、ワークフローを自動化したい、またはWebサイトをテストしたい場合に使用します。初回使用時は、`uvx browser-use install`を実行してChromiumをセットアップしてください。
description の原文を見る
AI-powered browser automation via browser-use CLI (`uvx browser-use`). Navigate websites, click elements, fill forms, take screenshots, extract data, and automate web tasks. Use when user needs to interact with web pages, scrape data, fill forms, automate workflows, or test websites. First-time use: run `uvx browser-use install` to set up Chromium.
SKILL.md 本文
Browser-Use — AI ブラウザ自動化
uvx browser-use コマンドラインでブラウザを制御でき、手動でのインストール作業は不要です。
初回利用
# Chromiumをインストール(初回のみ必要)
uvx browser-use install
# 環境が準備完了しているか確認
uvx browser-use doctor
標準的なワークフロー
ブラウザはコマンド間でも実行し続けるため、迅速な対話が実現します。
1. ウェブページを開く
uvx browser-use open https://example.com
2. ページの状態を確認(操作可能な要素一覧を取得)
uvx browser-use state
# URL、タイトル、クリック可能な要素およびそのインデックス番号を返す
3. 操作
# 要素をクリック(state から返されたインデックス番号を使用)
uvx browser-use click 5
# 入力フィールドにテキストを入力
uvx browser-use input 3 "検索内容"
# 汎用入力(現在フォーカスがある要素に入力)
uvx browser-use type "He
...
詳細情報
- 作者
- Terialion
- リポジトリ
- Terialion/Jarvis
- ライセンス
- unknown
- 最終更新
- 2026/5/7
Source: https://github.com/Terialion/Jarvis / ライセンス: unknown
関連スキル
agent-browser
AI エージェント向けのブラウザ自動化 CLI です。ウェブサイトとの対話が必要な場合に使用します。ページ遷移、フォーム入力、ボタンクリック、スクリーンショット取得、データ抽出、ウェブアプリのテスト、ブラウザ操作の自動化など、あらゆるブラウザタスクに対応できます。「ウェブサイトを開く」「フォームに記入する」「ボタンをクリックする」「スクリーンショットを取得する」「ページからデータを抽出する」「このウェブアプリをテストする」「サイトにログインする」「ブラウザ操作を自動化する」といった要求や、プログラマティックなウェブ操作が必要なタスクで起動します。
anyskill
AnySkill — あなたのプライベート・スキルクラウド。GitHubを基盤としたリポジトリからエージェントスキルを管理、同期、動的にロードできます。自然言語でクラウドスキルを検索し、オンデマンドでプロンプトを自動ロード、カスタムスキルのアップロードと共有、スキルバンドルの一括インストールが可能です。OpenClaw、Antigravity、Claude Code、Cursorに対応しています。
engram
AIエージェント向けの永続的なメモリシステムです。バグ修正、意思決定、発見、設定変更の後はmem_saveを使用してください。ユーザーが「覚えている」「記憶している」と言及した場合、または以前のセッションと重複する作業を開始する際はmem_searchを使用します。セッション終了前にmem_session_summaryを使用して、コンテキストを保持してください。
skyvern
AI駆動のブラウザ自動化により、任意のウェブサイトを自動化できます。フォーム入力、データ抽出、ファイルダウンロード、ログイン、複数ステップのワークフロー実行など、ユーザーがウェブサイトと連携する必要があるときに使用します。Skyvernは、LLMとコンピュータビジョンを活用して、未知のサイトも自動操作可能です。Python SDK、TypeScript SDK、REST API、MCPサーバー、またはCLIを通じて統合できます。
pinchbench
PinchBenchベンチマークを実行して、OpenClawエージェントの実世界タスクにおけるパフォーマンスを評価できます。モデルの機能テスト、モデル間の比較、ベンチマーク結果のリーダーボード提出、またはOpenClawのセットアップがカレンダー、メール、リサーチ、コーディング、複数ステップのワークフローにどの程度対応しているかを確認する際に使用します。
openui
OpenUIとOpenUI Langを使用してジェネレーティブUIアプリを構築できます。これらはLLM生成インターフェースのためのトークン効率的なオープン標準です。OpenUI、@openuidev、ジェネレーティブUI、LLMからのストリーミングUI、AI向けコンポーネントライブラリ、またはjson-render/A2UIの置き換えについて述べる際に使用します。スキャフォルディング、defineComponent、システムプロンプト、Renderer、およびOpenUI Lang出力のデバッグに対応しています。