Anthropic Claudeソフトウェア開発⭐ リポ 0品質スコア 50/100

parallel-web-extract

Name: parallel-web-extract
Author: parallel-web

URLのコンテンツを取得・抽出するスキルです。Webページ・記事・PDF・JavaScriptを多用したサイトなど、あらゆるURLの取得に使用します。フォークされたコンテキストで実行されるためトークン効率が高く、組み込みのWebFetchより優先して使用してください。

description の原文を見る

URL content extraction. Use for fetching any URL - webpages, articles, PDFs, JavaScript-heavy sites. Token-efficient: runs in forked context. Prefer over built-in WebFetch.

SKILL.md 本文

URL 抽出

以下からコンテンツを抽出: $ARGUMENTS

コマンド

URL またはコンテンツに基づいて、短くて説明的なファイル名を選択してください (例: vespa-docs, react-hooks-api)。小文字とハイフンを使用し、スペースは入れません。コマンドにインラインで代入してください — $FILENAME はプレースホルダーであり、シェル変数ではありません。

parallel-cli extract "$ARGUMENTS" --json -o "/tmp/$FILENAME.json"

具体例:

parallel-cli extract "https://docs.parallel.ai" --json -o "/tmp/parallel-docs.json"

注: -o は常に JSON を保存します。拡張子は .json である必要があります。

必要に応じてオプション:

--objective "focus area" で抽出を特定の目標に焦点を当てる (V1 がどちらも設定されていない場合に出力する「neither objective nor search_queries」警告も抑制)
-q "keyword" (繰り返し可能) で抜粋内のキーワードを優先
--full-content で完全なページボディを含める (長い記事、PDF、または抜粋では必要な情報をキャプチャできない場合)
--full-content-max-chars N で結果ごとの完全コンテンツサイズをキャップ
--no-excerpts で完全コンテンツのみが必要な場合は抜粋を削除

抽出失敗への対応

レスポンスに errors フィールド、空の results 配列、または URL の 404/タイムアウトがある場合、コンテンツを作り上げないでください。ユーザーに抽出が失敗したことを伝え、アップストリームのステータスを表示し、以下を提案してください:

URL の確認 (ページが移動している可能性があります)
抜粋が空で返ってきたがページが存在する場合は --full-content で再試行
ページが名前変更された場合は parallel-cli search を使用して現在の URL を見つける

レスポンス形式

以下のようにコンテンツを返す:

ページタイトル

次に抽出されたコンテンツをそのまま、以下のルールで:

コンテンツはそのまま保持 - パラフレーズや要約はしない
リストは徹底的に解析 - すべての番号付き/箇条書きアイテムを抽出
明らかなノイズのみを削除: ナビゲーションメニュー、フッター、広告
すべての事実、名前、数字、日付、引用を保持

レスポンスの後、出力ファイルパス (/tmp/$FILENAME.json) を記載して、ユーザーがフォローアップの質問で利用できることを知らせます。

セットアップ

parallel-cli (インストール済みおよび認証済み) が必要です。parallel-cli --version が失敗するか、後続のコマンドが認証エラーで失敗する場合は、ユーザーに https://docs.parallel.ai/integrations/cli を参照するよう伝えて中止してください。

ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ

詳細情報

作者: parallel-web
リポジトリ: parallel-web/parallel-agent-skills
ライセンス: MIT
最終更新: 不明

GitHubで原本を見る →フィードバックを送る

Source: https://github.com/parallel-web/parallel-agent-skills / ライセンス: MIT

parallel-web-extract

SKILL.md 本文

URL 抽出

コマンド

抽出失敗への対応

レスポンス形式

セットアップ

詳細情報

関連スキル

doubt-driven-development

apprun-skills

desloppify

debugging-and-error-recovery

test-driven-development

incremental-implementation