brightdata-cli
Bright Data CLI(`brightdata` / `bdata`)を使用して、ウェブサイトのスクレイピング、Google/Bing/Yandexでの検索、Amazon・LinkedIn・Instagram・TikTok・YouTube・Redditなど40以上のプラットフォームからの構造化データ抽出、プロキシゾーンの管理、アカウント残高の確認を行うためのガイドスキルです。URLのスクレイピング、SERP APIの利用、ターミナルからのウェブデータ収集、またはコーディングエージェントへのBright Dataスキルのインストールが必要な場合にこのスキルを使用してください。
description の原文を見る
Guide for using the Bright Data CLI (`brightdata` / `bdata`) to scrape websites, search the web, extract structured data from 40+ platforms, manage proxy zones, and check account budget. Use this skill whenever the user wants to scrape a URL, search Google/Bing/Yandex, extract data from Amazon/LinkedIn/Instagram/TikTok/YouTube/Reddit or any other platform, check their Bright Data balance or zones, or do anything involving web data collection from the terminal. Also trigger when the user mentions brightdata, bdata, web scraping CLI, SERP API, or wants to install Bright Data skills into their coding agent.
SKILL.md 本文
Bright Data CLI
Bright Data CLI (brightdata または bdata) は、ターミナルから Bright Data のウェブデータプラットフォームへの完全なアクセスを提供します。認証、プロキシゾーン、アンチボット迂回、CAPTCHA 解決、JavaScript レンダリングを自動的に処理します。ユーザーは 1 回ログインするだけです。
インストール
CLI がまだインストールされていない場合は、ユーザーをガイドしてください:
macOS / Linux:
curl -fsSL https://cli.brightdata.com/install.sh | bash
Windows または手動インストール (全プラットフォーム):
npm install -g @brightdata/cli
インストールなし (単発の使用):
npx --yes --package @brightdata/cli brightdata <command>
Node.js >= 20 が必要です。インストール後、brightdata と bdata (短縮形) の両方が利用可能になります。
初回セットアップ
その他の何より先に、ユーザーが認証されているかどうかを確認してください。まだログインしていない場合は、1 回限りのセットアップをガイドしてください:
# 1 回限りのログイン — ブラウザで OAuth を開き、その後はすべて自動
bdata login
このコマンドは以下を行います:
- セキュアな OAuth 認証用にブラウザを開きます
- API キーをローカルに保存します (再度入力する必要はありません)
- 必要なプロキシゾーン (
cli_unlocker、cli_browser) を自動作成します - デフォルト設定をします
ログイン後、その後のすべてのコマンドは手動干渉なしで機能します。
ブラウザが利用できないヘッドレス/SSH 環境の場合:
bdata login --device
直接 API キー認証 (非対話的) の場合:
bdata login --api-key <key>
セットアップが完了したことを確認するには、以下を実行します:
bdata config
コマンドリファレンス
すべてのコマンドのフラグ、オプション、例を含む完全なコマンドリファレンスについては、references/commands.md を参照してください。
すべてのパイプラインタイプ (Amazon、LinkedIn、Instagram、TikTok、YouTube、Reddit など) の完全なリスト (40 以上) とそれぞれのパラメータについては、references/pipelines.md を参照してください。
クイックコマンド概要
bdata は brightdata の短縮形です。両方は同じように機能します。
| コマンド | 目的 |
|---|---|
bdata scrape <url> | 任意の URL を Markdown、HTML、JSON、またはスクリーンショットとしてスクレイピング |
bdata search "<query>" | Google/Bing/Yandex を構造化結果で検索 |
bdata pipelines <type> [params] | 40 以上のプラットフォームから構造化データを抽出 |
bdata pipelines list | 40 以上の利用可能なパイプラインタイプを一覧表示 |
bdata status <job-id> | 非同期ジョブのステータスを確認 |
bdata zones | プロキシゾーンを一覧表示 |
bdata budget | アカウント残高とコストを表示 |
bdata skill add | AI エージェントスキルをインストール |
bdata skill list | 利用可能なスキルを一覧表示 |
bdata config | 設定を表示/設定 |
bdata login | Bright Data で認証 |
bdata version | CLI バージョンとシステム情報を表示 |
各コマンドの使用方法
スクレイピング
自動ボット迂回、CAPTCHA 処理、JS レンダリングで任意の URL をスクレイピング:
# デフォルト:クリーンな Markdown を返す
bdata scrape https://example.com
# 生の HTML を取得
bdata scrape https://example.com -f html
# 構造化 JSON を取得
bdata scrape https://example.com -f json
# スクリーンショットを取得
bdata scrape https://example.com -f screenshot -o page.png
# US からの地理的ターゲットスクレイピング
bdata scrape https://amazon.com --country us
# ファイルに保存
bdata scrape https://example.com -o page.md
# 重いページの非同期モード
bdata scrape https://example.com --async
検索
構造化 JSON 出力の検索エンジン (Google は解析されたオーガニック結果、広告、People Also Ask、関連検索を返します):
# フォーマットされたテーブルの Google 検索
bdata search "web scraping best practices"
# パイプ処理用の生 JSON を取得
bdata search "typescript tutorials" --json
# Bing で検索
bdata search "bright data pricing" --engine bing
# ローカライズされた検索
bdata search "restaurants berlin" --country de --language de
# ニュース検索
bdata search "AI regulation" --type news
# URL のみを抽出
bdata search "open source tools" --json | jq -r '.organic[].link'
パイプライン (構造化データ抽出)
40 以上のプラットフォームから構造化データを抽出します。これらは、結果が準備されるまでポーリングする非同期ジョブをトリガーします:
# LinkedIn プロフィール
bdata pipelines linkedin_person_profile "https://linkedin.com/in/username"
# Amazon 商品
bdata pipelines amazon_product "https://amazon.com/dp/B09V3KXJPB"
# Instagram プロフィール
bdata pipelines instagram_profiles "https://instagram.com/username"
# Amazon 検索
bdata pipelines amazon_product_search "laptop" "https://amazon.com"
# YouTube コメント (上位 50 件)
bdata pipelines youtube_comments "https://youtube.com/watch?v=..." 50
# Google Maps レビュー (過去 7 日)
bdata pipelines google_maps_reviews "https://maps.google.com/..." 7
# CSV として出力
bdata pipelines amazon_product "https://amazon.com/dp/..." --format csv -o product.csv
# すべての利用可能なパイプラインタイプを一覧表示
bdata pipelines list
ステータスの確認
非同期ジョブ (--async スクレイプまたはパイプラインから) の場合:
# クイックステータスチェック
bdata status <job-id>
# 完了まで待機
bdata status <job-id> --wait
# カスタムタイムアウト付き
bdata status <job-id> --wait --timeout 300
予算とゾーン
# クイックアカウント残高
bdata budget
# 保留中の請求を含む詳細残高
bdata budget balance
# すべてのゾーンのコスト/帯域幅
bdata budget zones
# 特定のゾーンのコスト
bdata budget zone my_zone
# 日付範囲フィルター
bdata budget zones --from 2024-01-01T00:00:00 --to 2024-02-01T00:00:00
# すべてのゾーンを一覧表示
bdata zones
# ゾーンの詳細
bdata zones info cli_unlocker
設定
# すべての設定を表示
bdata config
# デフォルトを設定
bdata config set default_zone_unlocker my_zone
bdata config set default_format json
AI エージェントスキルのインストール
# インタラクティブピッカー — スキルとターゲットエージェントを選択
bdata skill add
# 特定のスキルをインストール
bdata skill add scrape
# 利用可能なスキルを一覧表示
bdata skill list
出力モード
すべてのコマンドは複数の出力形式をサポートしています:
| フラグ | 効果 |
|---|---|
| (なし) | 色付きの人間が読める形式の出力 |
--json | stdout へのコンパクト JSON |
--pretty | stdout へのインデント JSON |
-o <path> | ファイルに書き込む (形式は拡張子から自動検出) |
パイプされている場合 (stdout が TTY でない場合)、色とスピナーは自動的に無効化されます。
コマンドのチェーン
CLI はパイプフレンドリーです:
# 検索 → 最初の URL を抽出 → スクレイピング
bdata search "top open source projects" --json \
| jq -r '.organic[0].link' \
| xargs bdata scrape
# スクレイピングして Markdown リーダーで表示
bdata scrape https://docs.github.com | glow -
# Amazon 商品データを CSV に
bdata pipelines amazon_product "https://amazon.com/dp/xxx" --format csv > product.csv
環境変数
これらは保存された設定をオーバーライドします:
| 変数 | 目的 |
|---|---|
BRIGHTDATA_API_KEY | API キー (ログインを完全にスキップ) |
BRIGHTDATA_UNLOCKER_ZONE | デフォルト Web Unlocker ゾーン |
BRIGHTDATA_SERP_ZONE | デフォルト SERP ゾーン |
BRIGHTDATA_POLLING_TIMEOUT | ポーリングタイムアウト (秒単位) |
トラブルシューティング
| エラー | 修正方法 |
|---|---|
| CLI が見つからない | npm i -g @brightdata/cli または curl -fsSL https://cli.brightdata.com/install.sh | bash でインストール |
| "No Web Unlocker zone specified" | bdata config set default_zone_unlocker <zone> または bdata login を再実行 |
| "Invalid or expired API key" | bdata login を実行 |
| "Access denied" | Bright Data コントロールパネルでゾーンのアクセス許可を確認 |
| "Rate limit exceeded" | 待機して再試行するか、大規模なジョブで --async を使用 |
| 非同期ジョブタイムアウト | --timeout 1200 または BRIGHTDATA_POLLING_TIMEOUT=1200 で増加 |
主要な設計原則
- ワンタイム認証:
bdata login後、すべてが自動です。管理するトークンやパスするキーはありません。 - ゾーン自動作成: ログインは
cli_unlockerとcli_browserゾーンを自動的に作成します。 - スマートデフォルト: Markdown 出力、ファイル拡張子からの自動検出形式、TTY でのみ色を表示します。
- パイプフレンドリー: JSON 出力 + jq でオートメーション。パイプでは色/スピナーは無効化されます。
- 非同期サポート: 重いジョブは
--async+status --waitでバックグラウンド実行できます。 - npm パッケージ:
@brightdata/cli— グローバルにインストールするか、npxで使用します。
ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ
詳細情報
- 作者
- brightdata
- リポジトリ
- brightdata/skills
- ライセンス
- MIT
- 最終更新
- 不明
Source: https://github.com/brightdata/skills / ライセンス: MIT
関連スキル
agent-browser
AI エージェント向けのブラウザ自動化 CLI です。ウェブサイトとの対話が必要な場合に使用します。ページ遷移、フォーム入力、ボタンクリック、スクリーンショット取得、データ抽出、ウェブアプリのテスト、ブラウザ操作の自動化など、あらゆるブラウザタスクに対応できます。「ウェブサイトを開く」「フォームに記入する」「ボタンをクリックする」「スクリーンショットを取得する」「ページからデータを抽出する」「このウェブアプリをテストする」「サイトにログインする」「ブラウザ操作を自動化する」といった要求や、プログラマティックなウェブ操作が必要なタスクで起動します。
anyskill
AnySkill — あなたのプライベート・スキルクラウド。GitHubを基盤としたリポジトリからエージェントスキルを管理、同期、動的にロードできます。自然言語でクラウドスキルを検索し、オンデマンドでプロンプトを自動ロード、カスタムスキルのアップロードと共有、スキルバンドルの一括インストールが可能です。OpenClaw、Antigravity、Claude Code、Cursorに対応しています。
engram
AIエージェント向けの永続的なメモリシステムです。バグ修正、意思決定、発見、設定変更の後はmem_saveを使用してください。ユーザーが「覚えている」「記憶している」と言及した場合、または以前のセッションと重複する作業を開始する際はmem_searchを使用します。セッション終了前にmem_session_summaryを使用して、コンテキストを保持してください。
skyvern
AI駆動のブラウザ自動化により、任意のウェブサイトを自動化できます。フォーム入力、データ抽出、ファイルダウンロード、ログイン、複数ステップのワークフロー実行など、ユーザーがウェブサイトと連携する必要があるときに使用します。Skyvernは、LLMとコンピュータビジョンを活用して、未知のサイトも自動操作可能です。Python SDK、TypeScript SDK、REST API、MCPサーバー、またはCLIを通じて統合できます。
pinchbench
PinchBenchベンチマークを実行して、OpenClawエージェントの実世界タスクにおけるパフォーマンスを評価できます。モデルの機能テスト、モデル間の比較、ベンチマーク結果のリーダーボード提出、またはOpenClawのセットアップがカレンダー、メール、リサーチ、コーディング、複数ステップのワークフローにどの程度対応しているかを確認する際に使用します。
openui
OpenUIとOpenUI Langを使用してジェネレーティブUIアプリを構築できます。これらはLLM生成インターフェースのためのトークン効率的なオープン標準です。OpenUI、@openuidev、ジェネレーティブUI、LLMからのストリーミングUI、AI向けコンポーネントライブラリ、またはjson-render/A2UIの置き換えについて述べる際に使用します。スキャフォルディング、defineComponent、システムプロンプト、Renderer、およびOpenUI Lang出力のデバッグに対応しています。