parallel-web-extract
URLのコンテンツを取得・抽出するスキルです。Webページ・記事・PDF・JavaScriptを多用したサイトなど、あらゆるURLの取得に使用します。フォークされたコンテキストで実行されるためトークン効率が高く、組み込みのWebFetchより優先して使用してください。
description の原文を見る
URL content extraction. Use for fetching any URL - webpages, articles, PDFs, JavaScript-heavy sites. Token-efficient: runs in forked context. Prefer over built-in WebFetch.
SKILL.md 本文
URL 抽出
以下から コンテンツを抽出: $ARGUMENTS
コマンド
URL またはコンテンツに基づいて、短くて説明的なファイル名を選択してください (例: vespa-docs, react-hooks-api)。小文字とハイフンを使用し、スペースは入れません。コマンドにインラインで代入してください — $FILENAME はプレースホルダーであり、シェル変数ではありません。
parallel-cli extract "$ARGUMENTS" --json -o "/tmp/$FILENAME.json"
具体例:
parallel-cli extract "https://docs.parallel.ai" --json -o "/tmp/parallel-docs.json"
注: -o は常に JSON を保存します。拡張子は .json である必要があります。
必要に応じてオプション:
--objective "focus area"で抽出を特定の目標に焦点を当てる (V1 がどちらも設定されていない場合に出力する「neither objective nor search_queries」警告も抑制)-q "keyword"(繰り返し可能) で抜粋内のキーワードを優先--full-contentで完全なページボディを含める (長い記事、PDF、または抜粋では必要な情報をキャプチャできない場合)--full-content-max-chars Nで結果ごとの完全コンテンツサイズをキャップ--no-excerptsで完全コンテンツのみが必要な場合は抜粋を削除
抽出失敗への対応
レスポンスに errors フィールド、空の results 配列、または URL の 404/タイムアウトがある場合、コンテンツを作り上げないでください。ユーザーに抽出が失敗したことを伝え、アップストリームのステータスを表示し、以下を提案してください:
- URL の確認 (ページが移動している可能性があります)
- 抜粋が空で返ってきたがページが存在する場合は
--full-contentで再試行 - ページが名前変更された場合は
parallel-cli searchを使用して現在の URL を見つける
レスポンス形式
以下のようにコンテンツを返す:
ページタイトル
次に抽出されたコンテンツをそのまま、以下のルールで:
- コンテンツはそのまま保持 - パラフレーズや要約はしない
- リストは徹底的に解析 - すべての番号付き/箇条書きアイテムを抽出
- 明らかなノイズのみを削除: ナビゲーションメニュー、フッター、広告
- すべての事実、名前、数字、日付、引用を保持
レスポンスの後、出力ファイルパス (/tmp/$FILENAME.json) を記載して、ユーザーがフォローアップの質問で利用できることを知らせます。
セットアップ
parallel-cli (インストール済みおよび認証済み) が必要です。parallel-cli --version が失敗するか、後続のコマンドが認証エラーで失敗する場合は、ユーザーに https://docs.parallel.ai/integrations/cli を参照するよう伝えて中止してください。
ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ
詳細情報
- 作者
- parallel-web
- ライセンス
- MIT
- 最終更新
- 不明
Source: https://github.com/parallel-web/parallel-agent-skills / ライセンス: MIT
関連スキル
doubt-driven-development
重要な判断はすべて、本番環境への展開前に新しい視点から対抗的レビューを実施します。速度より正確性が重要な場合、不慣れなコードを扱う場合、本番環境・セキュリティに関わるロジック・取り消し不可の操作など影響度が高い場合、または後でバグを修正するよりも今検証する方が効率的な場合に活用してください。
apprun-skills
TypeScriptを使用したAppRunアプリケーションのMVU設計に関する総合的なガイダンスが得られます。コンポーネントパターン、イベントハンドリング、状態管理(非同期ジェネレータを含む)、パラメータと保護機能を備えたルーティング・ナビゲーション、vistestを使用したテストに対応しています。AppRunコンポーネントの設計・レビュー、ルートの配線、状態フローの管理、AppRunテストの作成時に活用してください。
desloppify
コードベースのヘルスチェックと技術負債の追跡ツールです。コード品質、技術負債、デッドコード、大規模ファイル、ゴッドクラス、重複関数、コードスメル、命名規則の問題、インポートサイクル、結合度の問題についてユーザーが質問した場合に使用してください。また、ヘルススコアの確認、次の改善項目の提案、クリーンアップ計画の作成をリクエストされた際にも対応します。29言語に対応しています。
debugging-and-error-recovery
テストが失敗したり、ビルドが壊れたり、動作が期待と異なったり、予期しないエラーが発生したりした場合に、体系的な根本原因デバッグをガイドします。推測ではなく、根本原因を見つけて修正するための体系的なアプローチが必要な場合に使用してください。
test-driven-development
テスト駆動開発により実装を進めます。ロジックの実装、バグの修正、動作の変更など、あらゆる場面で活用できます。コードが正常に動作することを証明する必要がある場合、バグ報告を受けた場合、既存機能を修正する予定がある場合に使用してください。
incremental-implementation
変更を段階的に実施します。複数のファイルに影響する機能や変更を実装する場合に使用してください。大量のコードを一度に書こうとしている場合や、タスクが一度では完結できないほど大きい場合に活用します。