agent-onboarding
Bright DataにAgentをオンボーディングします。コーディングAgentがBright Dataを初めて利用する際に使用します。ライブWeb検索・スクレイピング・構造化データの取得、プロダクトコードへの組み込み、Agentスキルバンドルのインストール、APIキーの取得などに対応しています。1つのインストールコマンドでCLI・Agentスキル・認証をまとめてセットアップでき、ライブツール・アプリ統合・MCP・認証のみ・インストール不要の直接REST利用など、目的に応じた最適な手順へ誘導します。
description の原文を見る
| Onboard an agent to Bright Data. Use when a coding agent first encounters Bright Data — for live web work (search, scrape, structured data), for wiring Bright Data into product code, for installing the agent skill bundle, or for getting an API key. One install command sets up the CLI, agent skills, and authentication. Routes the reader to the right path: live tools, app integration, MCP, auth-only, or direct REST without any install.
SKILL.md 本文
Bright Data — エージェント オンボーディング
Bright Data は、エージェントに開かれたウェブへの確実なアクセスを提供します。実際のブラウザのように見える SERP 結果、あらゆる URL からのクリーンなマークダウン(CAPTCHA + JS 処理済み)、40 以上のプラットフォーム向けの構造化データセット(Amazon、LinkedIn、Instagram、TikTok、YouTube、Reddit、Crunchbase など)、および実際のインタラクションが必要なページ用の Browser API です。
このスキルはエントリー ポイントです。一度読んで、パスを選択し、そのパスを所有する限定的なスキルに引き継ぎます。
インストール
1 つのコマンドで CLI と エージェント スキルをインストールし、ブラウザ経由で人間を OAuth に導きます:
# macOS / Linux — 最速インストール
curl -fsSL https://cli.brightdata.com/install.sh | bash
# クロスプラットフォーム(またはインストール スクリプトを使用したくない場合)
npm install -g @brightdata/cli
# 1 回限り、インストール不要
npx --yes --package @brightdata/cli brightdata <command>
Node.js >= 20 が必要です。インストール後、brightdata と bdata(短縮形)の両方が利用可能になります。
その後、1 回だけ認証します:
bdata login
このコマンド 1 つで:
- OAuth 用にブラウザを開きます(またはヘッドレス / SSH マシンでは
bdata login --deviceを使用) - API キーをローカルに保存します。トークンを貼り付ける必要は二度とありません
- 必要なプロキシ ゾーン(
cli_unlocker、cli_browser)を自動作成します - 妥当なデフォルト設定を設定します
非対話的なセットアップでは、キーを直接渡すことができます:
bdata login --api-key <key>
# または
export BRIGHTDATA_API_KEY=<key>
実際の作業を行う前にインストールを確認します:
bdata version
bdata config # 認証 + ゾーンを確認
bdata zones # cli_unlocker、cli_browser をリストする必要があります
bdata budget # アカウント + 残高を確認
これらのいずれかが失敗した場合は、続行する前にパス C(認証)にルーティングします。
エージェント スキルをインストール(オプション、推奨)
CLI は Bright Data スキルをコーディングエージェントのスキル ディレクトリに直接ドロップするインストーラを備えています:
# インタラクティブ ピッカー — スキル + ターゲット エージェントを選択
bdata skill add
# 特定のスキルをインストール
bdata skill add scrape
bdata skill add data-feeds
bdata skill add competitive-intel
# 利用可能なすべてを表示
bdata skill list
これらはあなたが以下のパスから引き継ぐスキルです(scrape、search、data-feeds、scraper-builder、brightdata-cli、bright-data-mcp など)。
パスを選択
すべてのパスは上記の同じインストール + 認証を共有します。違いは次に何をするかです。
| 状況 | パス |
|---|---|
| このセッション中にウェブ データが必要 | パス A — ライブ CLI ツール |
| アプリ コードに Bright Data を追加する必要がある | パス B — SDK / REST 統合 |
| LLM エージェント用のドロップイン ツール レイヤーが必要 | パス M — MCP サーバー |
| まず API キーが必要 | パス C — 認証のみ |
| インストール不要 | パス D — ダイレクト REST API |
タスクがパスをまたぐ場合は、順序で実行してください。認証 → ライブ ツールで探索 → 形状が判明したらアプリ統合。
パス A — ライブ ウェブ ツール(CLI)
エージェント自体がすぐにウェブ データが必要な場合に使用します。URL の発見、クリーン コンテンツの取得、既知プラットフォームからの構造化レコードの抽出、または迅速な競合スキャンの実行。
インストール + ログイン後、限定的なスキルに引き継ぎます:
brightdata-cli— 全体的なコマンド サーフェス(scrape、search、pipelines、status、zones、budget、config)search—bdata search経由での発見(Google / Bing / Yandex SERP、構造化 JSON)scrape—bdata scrape経由での既知 URL からのクリーン コンテンツ(マークダウン / HTML / JSON / スクリーンショット)data-feeds—bdata pipelines <type>経由での 40 以上のサポートされたプラットフォームからの構造化レコード(Amazon、LinkedIn、Instagram、TikTok、YouTube、Reddit、Crunchbase、Google Maps など)competitive-intel— CLI の上にパッケージされた競合他社 / 価格設定 / レビュー / 採用 / SEO 分析seo-audit— サイトマップ層別のライブ SEO 監査
ライブ ウェブ作業用のデフォルト フロー:
- 発見が必要な場合は最初に検索
bdata search "query" --json - ターゲットがサポートされたプラットフォームの場合は次にパイプライン — 解析なしで構造化 JSON を取得
bdata pipelines amazon_product "https://amazon.com/dp/..." - URL があり、プラットフォーム パイプラインが適用されない場合はスクレイプ
bdata scrape "https://example.com" -f markdown - ページが本当にクリック、フォーム、またはログインが必要な場合のみ Browser API(
brightdata-cliスキルでbdata browserとbright-data-best-practicesbrowser-api リファレンスを参照)
タスクが「今すぐ データを取得」から「これをアプリに配線」に移行したら、パス B に切り替えます。
パス B — Bright Data をアプリに統合
Bright Data をコードから呼び出し、.env またはランタイム設定で BRIGHTDATA_API_KEY(およびゾーン)が必要なアプリケーション、エージェント、またはワークフローを構築している場合に使用します。
このパスの必須質問は次のとおりです:
Bright Data は製品で何をすべきですか?
答えを使用して API を選択します:
| 製品のジョブ | API | スキル |
|---|---|---|
| 単一ページをマークダウン / HTML / JSON として取得 | Web Unlocker | bright-data-best-practices → web-unlocker.md |
| 構造化 JSON の検索エンジン結果 | SERP API | bright-data-best-practices → serp-api.md |
| サポートされたプラットフォームからの構造化レコード | Web Scraper API | bright-data-best-practices → web-scraper-api.md |
| Playwright/Puppeteer を使用した JS 集約的 / インタラクティブ ページ | Browser API | bright-data-best-practices → browser-api.md |
| 任意のサイト用のカスタム スクレイパーをビルド | すべて 4 つ(サイト形状で選択) | scraper-builder |
スタックを選択
-
Python → 公式 SDK を使用
pip install brightdata-sdkpython-sdk-best-practicesにハンドオフしてクライアント セットアップ (非同期/同期)、プラットフォーム スクレイパー、SERP、データセット、Browser API、エラー処理。 -
Node / TypeScript / shell / その他 → REST API を直接呼び出し (以下のパス D にエンドポイントがあります)、または
npx @brightdata/cliを使用して CLI をライブラリとして使用します。 -
LLM ツール レイヤー(Claude、ChatGPT など) → MCP サーバーを使用 (パス M)。
認証情報を設定
BRIGHTDATA_API_KEY=...
BRIGHTDATA_UNLOCKER_ZONE=cli_unlocker # `bdata login` によって自動作成
BRIGHTDATA_SERP_ZONE=cli_unlocker # または専用 SERP ゾーン
キーをまだ持っていない場合は、パス C を最初に実行します。
実際のコードを書く前にスモーク テスト
スケーリング統合作業を開始する前に、常に 1 つの実際の Bright Data リクエストを実行します。認証、ゾーン、クォーターの問題をアプリのエラー パスに隠れる前にキャッチします。
# Web Unlocker 経由の REST
curl -sS https://api.brightdata.com/request \
-H "Authorization: Bearer $BRIGHTDATA_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"url": "https://example.com",
"zone": "'"$BRIGHTDATA_UNLOCKER_ZONE"'",
"format": "raw",
"data_format": "markdown"
}' | head -40
これがクリーンなマークダウンを出力する場合、あなたは配線されています。そうでない場合は、ゾーン名とキーを確認してください。
パス M — MCP サーバー(LLM ツール レイヤー)
消費者が Bright Data をツールとして呼び出すべき LLM エージェント(例:Claude Code、ChatGPT デスクトップ、カスタム エージェント ループ)である場合に使用します。MCP サーバーは 60 以上のツール(検索、スクレイピング、プラットフォームごとの構造化データ、ブラウザ オートメーション)を単一 URL で公開します。
次を使用して接続します:
https://mcp.brightdata.com/mcp?token=YOUR_BRIGHTDATA_API_TOKEN
オプションの URL パラメーター:
| パラメーター | 効果 |
|---|---|
pro=1 | すべての 60 以上の Pro ツールを有効化 |
groups=<name> | ツール グループを有効化(social、ecommerce、business、finance、research、app_stores、travel、browser、advanced_scraping) |
tools=<names> | 特定のツール リストを有効化(カンマ区切り) |
bright-data-mcp スキルにハンドオフしてツール選択、ツール グループの自動有効化、ワークフロー パターンを実行します。そのスキルは WebFetch / WebSearch を Bright Data MCP 相当物で明示的に置き換えます。
パス C — API キーを取得(認証のみ)
ユーザーがまだサインアップ、サインイン、またはキー生成が必要な場合に使用します。bdata config が認証済みアカウントを既に表示している場合、または BRIGHTDATA_API_KEY が既に環境に設定されている場合は、このパスをスキップします。
最も簡単:CLI の OAuth フロー を使用
bdata login # ブラウザベース OAuth
bdata login --device # ヘッドレス / SSH(デバイス コード フロー)
これにより、サインアップまたはサインイン、キー生成、ゾーン作成、ローカル設定が 1 ステップで処理されます。手動フローより優先します。
手動:ダッシュボード
ユーザーが Web UI を好む場合:
- https://brightdata.com/cp に移動(必要に応じてサインアップ)
- Web Unlocker ゾーンを作成(「追加」→「Unlocker ゾーン」)
- ダッシュボードから API キーをコピー
- アプリの残りの部分がシークレットを読む場所に保存します:
echo "BRIGHTDATA_API_KEY=..." >> .env
echo "BRIGHTDATA_UNLOCKER_ZONE=<zone-name>" >> .env
確認
bdata budget # 成功した応答はキーが機能していることを意味します
確認が失敗した場合、キーが違うか、ゾーンが違うか、またはアカウントにアクティブなサブスクリプションがありません。推測するのではなく、エラーをユーザーに表示します。
パス D — 何もインストールせずに Bright Data を使用
環境が npm / curl | bash を実行できない場合、または 1 つか 2 つのリクエストのみが必要で CLI / SDK を必要としない場合に使用します。ライブ エージェント作業とアプリ統合の両方で機能します。
API キーとゾーンが必要です。取得する 2 つの方法:
- ユーザーが貼り付け — キーが既に存在する場合、環境で
BRIGHTDATA_API_KEY=...とBRIGHTDATA_UNLOCKER_ZONE=...を設定します - ブラウザ フロー — パス C を実行します。ダッシュボードが両方を発行します
ベース URL: https://api.brightdata.com
認証ヘッダー: Authorization: Bearer $BRIGHTDATA_API_KEY
コア エンドポイント
# Web Unlocker — あらゆる URL からのクリーン コンテンツ
POST /request
{
"url": "https://target.com",
"zone": "<unlocker-zone>",
"format": "raw",
"data_format": "markdown" // または "html"、"screenshot"、"parsed_light"
}
# SERP API — 構造化検索結果
# SERP ゾーンと検索 URL で同じ /request エンドポイントを使用します。
# `brd_json=1` を追加して、生の HTML の代わりに解析済み JSON を受け取ります。
POST /request
{
"url": "https://www.google.com/search?q=web+scraping&brd_json=1",
"zone": "<serp-zone>",
"format": "raw"
}
# Web Scraper API — 40 以上のプラットフォーム用の構造化データ(非同期)
POST /datasets/v3/trigger?dataset_id=<id>
[ { "url": "https://amazon.com/dp/B09V3KXJPB" } ]
# その後ポーリング
GET /datasets/v3/snapshot/<snapshot_id>?format=json
完全なパラメーター サーフェス(x-unblock-expect のような特別なヘッダー、非同期応答 ID、データセット進捗状態、Browser API CDP コマンド)については、bright-data-best-practices スキルを参照してください。そのリファレンスは REST レベルの作業の情報源です。
ドキュメント
- 製品ドキュメント:https://docs.brightdata.com
- LLM 対応ドキュメント インデックス:https://docs.brightdata.com/llms.txt
- ダッシュボード(ゾーン、キー、請求):https://brightdata.com/cp
オンボーディング後 — 次に行く場所
エージェントがセットアップされたら、適切な限定的なスキルに作業をルーティングします。クイック マップ:
| ユーザーが言う場合... | スキル |
|---|---|
| 「この URL をスクレイプ」 / 「このページを取得」 | scrape |
| 「Google で検索」 / 「について URL を見つけ」 | search |
| 「Amazon / LinkedIn / Instagram / TikTok / YouTube / Reddit データを取得」 | data-feeds |
| 「<サイト>用のスクレイパーをビルド」 | scraper-builder |
| 「競合他社を分析」 / 「価格設定を比較」 | competitive-intel |
| 「SEO を監査」 / 「ランク チェック」 / 「スキーマ チェック」 | seo-audit |
| 「Python で Bright Data コードを書く」 | python-sdk-best-practices |
| 「Bright Data を LLM エージェントに接続」 | bright-data-mcp |
| 「CLI を使用」 / 「ターミナルから実行」 | brightdata-cli |
| 「Browser API セッションをデバッグ」 | brd-browser-debug |
不明な場合は、より限定的なスキルを優先します。サポートされたプラットフォームの場合は scrape より data-feeds、複数ページ抽出の場合は scrape より scraper-builder、消費者がターミナルの人間ではなく LLM エージェントの場合は brightdata-cli より bright-data-mcp。
ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ
詳細情報
- 作者
- brightdata
- リポジトリ
- brightdata/skills
- ライセンス
- MIT
- 最終更新
- 不明
Source: https://github.com/brightdata/skills / ライセンス: MIT