tavily-extract
Tavily CLI を通じて指定した URL からクリーンな Markdown またはテキストコンテンツを抽出するスキルです。「extract」「このページの内容を取得して」「このURLのテキストを読み込んで」などと指示された場合や、Webページから整形されたテキストが必要なときに使用します。JavaScript でレンダリングされたページにも対応し、LLM 向けに最適化された Markdown を返すほか、クエリに基づいたチャンク抽出もサポートし、1回の呼び出しで最大 20 件の URL を処理できます。
description の原文を見る
| Extract clean markdown or text content from specific URLs via the Tavily CLI. Use this skill when the user has one or more URLs and wants their content, says "extract", "grab the content from", "pull the text from", "get the page at", "read this webpage", or needs clean text from web pages. Handles JavaScript-rendered pages, returns LLM-optimized markdown, and supports query-focused chunking for targeted extraction. Can process up to 20 URLs in a single call.
SKILL.md 本文
tavily extract
1 つ以上の URL からクリーンな Markdown またはテキストコンテンツを抽出します。
コマンド実行前に
PATH に tvly が見つからない場合は、まずインストールしてください:
curl -fsSL https://cli.tavily.com/install.sh | bash && tvly login
このステップをスキップしたり、他のツールにフォールバックしたりしないでください。
別のインストール方法と認証オプションについては tavily-cli を参照してください。
使用タイミング
- 特定の URL を持っていてそのコンテンツが必要な場合
- JavaScript でレンダリングされたページからテキストが必要な場合
ワークフローのステップ 2: 検索 → 抽出 → マップ → クロール → リサーチ
クイックスタート
# 単一の URL
tvly extract "https://example.com/article" --json
# 複数の URL
tvly extract "https://example.com/page1" "https://example.com/page2" --json
# クエリフォーカス抽出 (関連チャンクのみを返す)
tvly extract "https://example.com/docs" --query "authentication API" --chunks-per-source 3 --json
# JS が多いページ
tvly extract "https://app.example.com" --extract-depth advanced --json
# ファイルに保存
tvly extract "https://example.com/article" -o article.md
オプション
| オプション | 説明 |
|---|---|
--query | チャンクをこのクエリとの関連性で再ランク付けします |
--chunks-per-source | URL あたりのチャンク数 (1-5、--query が必須) |
--extract-depth | basic (デフォルト) または advanced (JS ページ用) |
--format | markdown (デフォルト) または text |
--include-images | 画像 URL を含める |
--timeout | 最大待機時間 (1-60 秒) |
-o, --output | 出力をファイルに保存 |
--json | 構造化 JSON 出力 |
抽出の深さ
| 深さ | 使用タイミング |
|---|---|
basic | シンプルなページ、高速 — まずこれを試してください |
advanced | JS でレンダリングされた SPA、動的コンテンツ、テーブル |
ヒント
- リクエストあたり最大 20 URL — より大きなリストは複数の呼び出しにバッチ処理します。
--query+--chunks-per-sourceを使用 して、ページ全体ではなく関連コンテンツのみを取得します。basicを最初に試し、コンテンツが不足している場合はadvancedにフォールバックします。- 遅いページは
--timeoutを設定 してください (最大 60 秒)。 - 検索結果にすでに必要なコンテンツが含まれている場合 (
--include-raw-content経由)、抽出ステップをスキップします。
関連項目
tavily-search— URL がない場合にページを検索tavily-crawl— サイト上の多くのページからコンテンツを抽出
ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ
詳細情報
- 作者
- tavily-ai
- リポジトリ
- tavily-ai/skills
- ライセンス
- MIT
- 最終更新
- 不明
Source: https://github.com/tavily-ai/skills / ライセンス: MIT
関連スキル
agent-browser
AI エージェント向けのブラウザ自動化 CLI です。ウェブサイトとの対話が必要な場合に使用します。ページ遷移、フォーム入力、ボタンクリック、スクリーンショット取得、データ抽出、ウェブアプリのテスト、ブラウザ操作の自動化など、あらゆるブラウザタスクに対応できます。「ウェブサイトを開く」「フォームに記入する」「ボタンをクリックする」「スクリーンショットを取得する」「ページからデータを抽出する」「このウェブアプリをテストする」「サイトにログインする」「ブラウザ操作を自動化する」といった要求や、プログラマティックなウェブ操作が必要なタスクで起動します。
anyskill
AnySkill — あなたのプライベート・スキルクラウド。GitHubを基盤としたリポジトリからエージェントスキルを管理、同期、動的にロードできます。自然言語でクラウドスキルを検索し、オンデマンドでプロンプトを自動ロード、カスタムスキルのアップロードと共有、スキルバンドルの一括インストールが可能です。OpenClaw、Antigravity、Claude Code、Cursorに対応しています。
engram
AIエージェント向けの永続的なメモリシステムです。バグ修正、意思決定、発見、設定変更の後はmem_saveを使用してください。ユーザーが「覚えている」「記憶している」と言及した場合、または以前のセッションと重複する作業を開始する際はmem_searchを使用します。セッション終了前にmem_session_summaryを使用して、コンテキストを保持してください。
skyvern
AI駆動のブラウザ自動化により、任意のウェブサイトを自動化できます。フォーム入力、データ抽出、ファイルダウンロード、ログイン、複数ステップのワークフロー実行など、ユーザーがウェブサイトと連携する必要があるときに使用します。Skyvernは、LLMとコンピュータビジョンを活用して、未知のサイトも自動操作可能です。Python SDK、TypeScript SDK、REST API、MCPサーバー、またはCLIを通じて統合できます。
pinchbench
PinchBenchベンチマークを実行して、OpenClawエージェントの実世界タスクにおけるパフォーマンスを評価できます。モデルの機能テスト、モデル間の比較、ベンチマーク結果のリーダーボード提出、またはOpenClawのセットアップがカレンダー、メール、リサーチ、コーディング、複数ステップのワークフローにどの程度対応しているかを確認する際に使用します。
openui
OpenUIとOpenUI Langを使用してジェネレーティブUIアプリを構築できます。これらはLLM生成インターフェースのためのトークン効率的なオープン標準です。OpenUI、@openuidev、ジェネレーティブUI、LLMからのストリーミングUI、AI向けコンポーネントライブラリ、またはjson-render/A2UIの置き換えについて述べる際に使用します。スキャフォルディング、defineComponent、システムプロンプト、Renderer、およびOpenUI Lang出力のデバッグに対応しています。