Anthropic Claudeソフトウェア開発⭐ リポ 0品質スコア 60/100
capability:document:scrap
URLまたはウェブ検索からPDFおよびWordドキュメントを検索・抽出・ダウンロードできます。フィルタリング機能とユーザー確認ポイントを備えており、必要なドキュメントを効率的に取得できます。
description の原文を見る
Search, extract, and download PDF and Word documents from URLs or web searches with filtering capabilities and user confirmation checkpoints
SKILL.md 本文
目的
ブラウザオートメーション(Playwright)またはウェブ検索を使用して、ウェブソースからPDF/Wordドキュメントを検出および抽出します。
実行
- 戦略: フォームベースのサイトにはPlaywright、静的サイトにはWebSearch/WebFetchを使用
- オートメーション: ナビゲーション、フォーム入力、送信、browser_run_codeを介したリンク抽出
- 抽出: ドキュメントURLとメタデータを解析し、フィルタを適用
- 確認: 結果を提示し、ユーザーが確認したらダウンロード
委譲
必須: このコマンドのfrontmatterで定義されたエージェントを常に呼び出し、その指定された責任を果たさせてください。スキップ、置換、または直接シミュレートしないでください。
zzaia-document-specialist— PlaywrightおよびTavily MCPツールを使用してPDF/Wordドキュメントを検出およびダウンロード
ワークフロー
sequenceDiagram
participant U as User
participant C as Command
participant B as Browser/Search
U->>C: /scraping <parameters>
C->>B: Navigate/Search
B-->>C: Extract documents
C->>U: Present results
U->>C: Confirm download
C->>U: Download files
受け入れ基準
- インタラクティブサイトにはPlaywrightを優先し、WebSearchへのフォールバック
- メタデータ抽出を伴うPDF/Wordドキュメントの検出
- フィルタを適用し、ダウンロードにはユーザー確認を要求
- 有意なメッセージでエラーを適切に処理
例
# フィルタ付きフォームベースサイト
/capability:document:scraping url=https://site.com/search filters='{"term": "value"}'
# ダウンロード付きウェブ検索
/capability:document:scraping search="research papers 2025" download=true output-path=/workspace/docs
# ダウンロードなしURL
/capability:document:scraping url=https://site.com/resources download=false
出力
- メタデータ付きドキュメントテーブル(タイトル、タイプ、サイズ、URL)
- 確認プロンプトとダウンロード進捗
- 統計サマリーとエラーログ
ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ
詳細情報
- 作者
- zzaia
- ライセンス
- MIT
- 最終更新
- 2026/5/8
Source: https://github.com/zzaia/zzaia-agentic-workspace / ライセンス: MIT