Agent Skills by ALSEL
Anthropic Claudeソフトウェア開発⭐ リポ 0品質スコア 60/100

capability:document:scrap

URLまたはウェブ検索からPDFおよびWordドキュメントを検索・抽出・ダウンロードできます。フィルタリング機能とユーザー確認ポイントを備えており、必要なドキュメントを効率的に取得できます。

description の原文を見る

Search, extract, and download PDF and Word documents from URLs or web searches with filtering capabilities and user confirmation checkpoints

SKILL.md 本文

目的

ブラウザオートメーション(Playwright)またはウェブ検索を使用して、ウェブソースからPDF/Wordドキュメントを検出および抽出します。

実行

  1. 戦略: フォームベースのサイトにはPlaywright、静的サイトにはWebSearch/WebFetchを使用
  2. オートメーション: ナビゲーション、フォーム入力、送信、browser_run_codeを介したリンク抽出
  3. 抽出: ドキュメントURLとメタデータを解析し、フィルタを適用
  4. 確認: 結果を提示し、ユーザーが確認したらダウンロード

委譲

必須: このコマンドのfrontmatterで定義されたエージェントを常に呼び出し、その指定された責任を果たさせてください。スキップ、置換、または直接シミュレートしないでください。

  • zzaia-document-specialist — PlaywrightおよびTavily MCPツールを使用してPDF/Wordドキュメントを検出およびダウンロード

ワークフロー

sequenceDiagram
    participant U as User
    participant C as Command
    participant B as Browser/Search

    U->>C: /scraping <parameters>
    C->>B: Navigate/Search
    B-->>C: Extract documents
    C->>U: Present results
    U->>C: Confirm download
    C->>U: Download files

受け入れ基準

  • インタラクティブサイトにはPlaywrightを優先し、WebSearchへのフォールバック
  • メタデータ抽出を伴うPDF/Wordドキュメントの検出
  • フィルタを適用し、ダウンロードにはユーザー確認を要求
  • 有意なメッセージでエラーを適切に処理

# フィルタ付きフォームベースサイト
/capability:document:scraping url=https://site.com/search filters='{"term": "value"}'

# ダウンロード付きウェブ検索
/capability:document:scraping search="research papers 2025" download=true output-path=/workspace/docs

# ダウンロードなしURL
/capability:document:scraping url=https://site.com/resources download=false

出力

  • メタデータ付きドキュメントテーブル(タイトル、タイプ、サイズ、URL)
  • 確認プロンプトとダウンロード進捗
  • 統計サマリーとエラーログ

ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ

詳細情報

作者
zzaia
リポジトリ
zzaia/zzaia-agentic-workspace
ライセンス
MIT
最終更新
2026/5/8

Source: https://github.com/zzaia/zzaia-agentic-workspace / ライセンス: MIT

本サイトは GitHub 上で公開されているオープンソースの SKILL.md ファイルをクロール・インデックス化したものです。 各スキルの著作権は原作者に帰属します。掲載に問題がある場合は info@alsel.co.jp または /takedown フォームよりご連絡ください。
原作者: zzaia · zzaia/zzaia-agentic-workspace · ライセンス: MIT