Anthropic ClaudeLLM・AI開発⭐ リポ 0品質スコア 50/100

brightdata-cli

Name: brightdata-cli
Author: brightdata

Bright Data CLI（`brightdata` / `bdata`）を使用して、ウェブサイトのスクレイピング、Google/Bing/Yandexでの検索、Amazon・LinkedIn・Instagram・TikTok・YouTube・Redditなど40以上のプラットフォームからの構造化データ抽出、プロキシゾーンの管理、アカウント残高の確認を行うためのガイドスキルです。URLのスクレイピング、SERP APIの利用、ターミナルからのウェブデータ収集、またはコーディングエージェントへのBright Dataスキルのインストールが必要な場合にこのスキルを使用してください。

description の原文を見る

Guide for using the Bright Data CLI (`brightdata` / `bdata`) to scrape websites, search the web, extract structured data from 40+ platforms, manage proxy zones, and check account budget. Use this skill whenever the user wants to scrape a URL, search Google/Bing/Yandex, extract data from Amazon/LinkedIn/Instagram/TikTok/YouTube/Reddit or any other platform, check their Bright Data balance or zones, or do anything involving web data collection from the terminal. Also trigger when the user mentions brightdata, bdata, web scraping CLI, SERP API, or wants to install Bright Data skills into their coding agent.

SKILL.md 本文

Bright Data CLI

Bright Data CLI (brightdata または bdata) は、ターミナルから Bright Data のウェブデータプラットフォームへの完全なアクセスを提供します。認証、プロキシゾーン、アンチボット迂回、CAPTCHA 解決、JavaScript レンダリングを自動的に処理します。ユーザーは 1 回ログインするだけです。

インストール

CLI がまだインストールされていない場合は、ユーザーをガイドしてください：

macOS / Linux:

curl -fsSL https://cli.brightdata.com/install.sh | bash

Windows または手動インストール (全プラットフォーム):

npm install -g @brightdata/cli

インストールなし (単発の使用):

npx --yes --package @brightdata/cli brightdata <command>

Node.js >= 20 が必要です。インストール後、brightdata と bdata (短縮形) の両方が利用可能になります。

初回セットアップ

その他の何より先に、ユーザーが認証されているかどうかを確認してください。まだログインしていない場合は、1 回限りのセットアップをガイドしてください：

# 1 回限りのログイン — ブラウザで OAuth を開き、その後はすべて自動
bdata login

このコマンドは以下を行います：

セキュアな OAuth 認証用にブラウザを開きます
API キーをローカルに保存します (再度入力する必要はありません)
必要なプロキシゾーン (cli_unlocker、cli_browser) を自動作成します
デフォルト設定をします

ログイン後、その後のすべてのコマンドは手動干渉なしで機能します。

ブラウザが利用できないヘッドレス/SSH 環境の場合：

bdata login --device

直接 API キー認証 (非対話的) の場合：

bdata login --api-key <key>

セットアップが完了したことを確認するには、以下を実行します：

bdata config

コマンドリファレンス

すべてのコマンドのフラグ、オプション、例を含む完全なコマンドリファレンスについては、references/commands.md を参照してください。

すべてのパイプラインタイプ (Amazon、LinkedIn、Instagram、TikTok、YouTube、Reddit など) の完全なリスト (40 以上) とそれぞれのパラメータについては、references/pipelines.md を参照してください。

クイックコマンド概要

bdata は brightdata の短縮形です。両方は同じように機能します。

コマンド	目的
`bdata scrape <url>`	任意の URL を Markdown、HTML、JSON、またはスクリーンショットとしてスクレイピング
`bdata search "<query>"`	Google/Bing/Yandex を構造化結果で検索
`bdata pipelines <type> [params]`	40 以上のプラットフォームから構造化データを抽出
`bdata pipelines list`	40 以上の利用可能なパイプラインタイプを一覧表示
`bdata status <job-id>`	非同期ジョブのステータスを確認
`bdata zones`	プロキシゾーンを一覧表示
`bdata budget`	アカウント残高とコストを表示
`bdata skill add`	AI エージェントスキルをインストール
`bdata skill list`	利用可能なスキルを一覧表示
`bdata config`	設定を表示/設定
`bdata login`	Bright Data で認証
`bdata version`	CLI バージョンとシステム情報を表示

各コマンドの使用方法

スクレイピング

自動ボット迂回、CAPTCHA 処理、JS レンダリングで任意の URL をスクレイピング：

# デフォルト：クリーンな Markdown を返す
bdata scrape https://example.com

# 生の HTML を取得
bdata scrape https://example.com -f html

# 構造化 JSON を取得
bdata scrape https://example.com -f json

# スクリーンショットを取得
bdata scrape https://example.com -f screenshot -o page.png

# US からの地理的ターゲットスクレイピング
bdata scrape https://amazon.com --country us

# ファイルに保存
bdata scrape https://example.com -o page.md

# 重いページの非同期モード
bdata scrape https://example.com --async

検索

構造化 JSON 出力の検索エンジン (Google は解析されたオーガニック結果、広告、People Also Ask、関連検索を返します)：

# フォーマットされたテーブルの Google 検索
bdata search "web scraping best practices"

# パイプ処理用の生 JSON を取得
bdata search "typescript tutorials" --json

# Bing で検索
bdata search "bright data pricing" --engine bing

# ローカライズされた検索
bdata search "restaurants berlin" --country de --language de

# ニュース検索
bdata search "AI regulation" --type news

# URL のみを抽出
bdata search "open source tools" --json | jq -r '.organic[].link'

パイプライン (構造化データ抽出)

40 以上のプラットフォームから構造化データを抽出します。これらは、結果が準備されるまでポーリングする非同期ジョブをトリガーします：

# LinkedIn プロフィール
bdata pipelines linkedin_person_profile "https://linkedin.com/in/username"

# Amazon 商品
bdata pipelines amazon_product "https://amazon.com/dp/B09V3KXJPB"

# Instagram プロフィール
bdata pipelines instagram_profiles "https://instagram.com/username"

# Amazon 検索
bdata pipelines amazon_product_search "laptop" "https://amazon.com"

# YouTube コメント (上位 50 件)
bdata pipelines youtube_comments "https://youtube.com/watch?v=..." 50

# Google Maps レビュー (過去 7 日)
bdata pipelines google_maps_reviews "https://maps.google.com/..." 7

# CSV として出力
bdata pipelines amazon_product "https://amazon.com/dp/..." --format csv -o product.csv

# すべての利用可能なパイプラインタイプを一覧表示
bdata pipelines list

ステータスの確認

非同期ジョブ (--async スクレイプまたはパイプラインから) の場合：

# クイックステータスチェック
bdata status <job-id>

# 完了まで待機
bdata status <job-id> --wait

# カスタムタイムアウト付き
bdata status <job-id> --wait --timeout 300

予算とゾーン

# クイックアカウント残高
bdata budget

# 保留中の請求を含む詳細残高
bdata budget balance

# すべてのゾーンのコスト/帯域幅
bdata budget zones

# 特定のゾーンのコスト
bdata budget zone my_zone

# 日付範囲フィルター
bdata budget zones --from 2024-01-01T00:00:00 --to 2024-02-01T00:00:00

# すべてのゾーンを一覧表示
bdata zones

# ゾーンの詳細
bdata zones info cli_unlocker

設定

# すべての設定を表示
bdata config

# デフォルトを設定
bdata config set default_zone_unlocker my_zone
bdata config set default_format json

AI エージェントスキルのインストール

# インタラクティブピッカー — スキルとターゲットエージェントを選択
bdata skill add

# 特定のスキルをインストール
bdata skill add scrape

# 利用可能なスキルを一覧表示
bdata skill list

出力モード

すべてのコマンドは複数の出力形式をサポートしています：

フラグ	効果
(なし)	色付きの人間が読める形式の出力
`--json`	stdout へのコンパクト JSON
`--pretty`	stdout へのインデント JSON
`-o <path>`	ファイルに書き込む (形式は拡張子から自動検出)

パイプされている場合 (stdout が TTY でない場合)、色とスピナーは自動的に無効化されます。

コマンドのチェーン

CLI はパイプフレンドリーです：

# 検索 → 最初の URL を抽出 → スクレイピング
bdata search "top open source projects" --json \
  | jq -r '.organic[0].link' \
  | xargs bdata scrape

# スクレイピングして Markdown リーダーで表示
bdata scrape https://docs.github.com | glow -

# Amazon 商品データを CSV に
bdata pipelines amazon_product "https://amazon.com/dp/xxx" --format csv > product.csv

環境変数

これらは保存された設定をオーバーライドします：

変数	目的
`BRIGHTDATA_API_KEY`	API キー (ログインを完全にスキップ)
`BRIGHTDATA_UNLOCKER_ZONE`	デフォルト Web Unlocker ゾーン
`BRIGHTDATA_SERP_ZONE`	デフォルト SERP ゾーン
`BRIGHTDATA_POLLING_TIMEOUT`	ポーリングタイムアウト (秒単位)

トラブルシューティング

エラー	修正方法
CLI が見つからない	`npm i -g @brightdata/cli` または `curl -fsSL https://cli.brightdata.com/install.sh \| bash` でインストール
"No Web Unlocker zone specified"	`bdata config set default_zone_unlocker <zone>` または `bdata login` を再実行
"Invalid or expired API key"	`bdata login` を実行
"Access denied"	Bright Data コントロールパネルでゾーンのアクセス許可を確認
"Rate limit exceeded"	待機して再試行するか、大規模なジョブで `--async` を使用
非同期ジョブタイムアウト	`--timeout 1200` または `BRIGHTDATA_POLLING_TIMEOUT=1200` で増加

主要な設計原則

ワンタイム認証: bdata login 後、すべてが自動です。管理するトークンやパスするキーはありません。
ゾーン自動作成: ログインは cli_unlocker と cli_browser ゾーンを自動的に作成します。
スマートデフォルト: Markdown 出力、ファイル拡張子からの自動検出形式、TTY でのみ色を表示します。
パイプフレンドリー: JSON 出力 + jq でオートメーション。パイプでは色/スピナーは無効化されます。
非同期サポート: 重いジョブは --async + status --wait でバックグラウンド実行できます。
npm パッケージ: @brightdata/cli — グローバルにインストールするか、npx で使用します。

ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ

詳細情報

作者: brightdata
リポジトリ: brightdata/skills
ライセンス: MIT
最終更新: 不明

GitHubで原本を見る →フィードバックを送る

Source: https://github.com/brightdata/skills / ライセンス: MIT