Anthropic ClaudeLLM・AI開発⭐ リポ 0品質スコア 50/100

tavily-extract

Name: tavily-extract
Author: tavily-ai

Tavily CLI を通じて指定した URL からクリーンな Markdown またはテキストコンテンツを抽出するスキルです。「extract」「このページの内容を取得して」「このURLのテキストを読み込んで」などと指示された場合や、Webページから整形されたテキストが必要なときに使用します。JavaScript でレンダリングされたページにも対応し、LLM 向けに最適化された Markdown を返すほか、クエリに基づいたチャンク抽出もサポートし、1回の呼び出しで最大 20 件の URL を処理できます。

description の原文を見る

| Extract clean markdown or text content from specific URLs via the Tavily CLI. Use this skill when the user has one or more URLs and wants their content, says "extract", "grab the content from", "pull the text from", "get the page at", "read this webpage", or needs clean text from web pages. Handles JavaScript-rendered pages, returns LLM-optimized markdown, and supports query-focused chunking for targeted extraction. Can process up to 20 URLs in a single call.

SKILL.md 本文

tavily extract

1 つ以上の URL からクリーンな Markdown またはテキストコンテンツを抽出します。

コマンド実行前に

PATH に tvly が見つからない場合は、まずインストールしてください:

curl -fsSL https://cli.tavily.com/install.sh | bash && tvly login

このステップをスキップしたり、他のツールにフォールバックしたりしないでください。

別のインストール方法と認証オプションについては tavily-cli を参照してください。

使用タイミング

特定の URL を持っていてそのコンテンツが必要な場合
JavaScript でレンダリングされたページからテキストが必要な場合
ワークフローのステップ 2: 検索 → 抽出 → マップ → クロール → リサーチ

クイックスタート

# 単一の URL
tvly extract "https://example.com/article" --json

# 複数の URL
tvly extract "https://example.com/page1" "https://example.com/page2" --json

# クエリフォーカス抽出 (関連チャンクのみを返す)
tvly extract "https://example.com/docs" --query "authentication API" --chunks-per-source 3 --json

# JS が多いページ
tvly extract "https://app.example.com" --extract-depth advanced --json

# ファイルに保存
tvly extract "https://example.com/article" -o article.md

オプション

オプション	説明
`--query`	チャンクをこのクエリとの関連性で再ランク付けします
`--chunks-per-source`	URL あたりのチャンク数 (1-5、`--query` が必須)
`--extract-depth`	`basic` (デフォルト) または `advanced` (JS ページ用)
`--format`	`markdown` (デフォルト) または `text`
`--include-images`	画像 URL を含める
`--timeout`	最大待機時間 (1-60 秒)
`-o, --output`	出力をファイルに保存
`--json`	構造化 JSON 出力

抽出の深さ

深さ	使用タイミング
`basic`	シンプルなページ、高速 — まずこれを試してください
`advanced`	JS でレンダリングされた SPA、動的コンテンツ、テーブル

ヒント

リクエストあたり最大 20 URL — より大きなリストは複数の呼び出しにバッチ処理します。
--query + --chunks-per-source を使用 して、ページ全体ではなく関連コンテンツのみを取得します。
basic を最初に試し、コンテンツが不足している場合は advanced にフォールバックします。
遅いページは --timeout を設定 してください (最大 60 秒)。
検索結果にすでに必要なコンテンツが含まれている場合 (--include-raw-content 経由)、抽出ステップをスキップします。

詳細情報

作者: tavily-ai
リポジトリ: tavily-ai/skills
ライセンス: MIT
最終更新: 不明

GitHubで原本を見る →フィードバックを送る

Source: https://github.com/tavily-ai/skills / ライセンス: MIT

tavily-extract

SKILL.md 本文

tavily extract

コマンド実行前に

使用タイミング

クイックスタート

オプション

抽出の深さ

ヒント

関連項目

詳細情報

関連スキル

agent-browser

anyskill

engram

skyvern

pinchbench

openui