capability:document:scrap
URLまたはウェブ検索からPDFおよびWordドキュメントを検索・抽出・ダウンロードできます。フィルタリング機能とユーザー確認ポイントを備えており、必要なドキュメントを効率的に取得できます。
description の原文を見る
Search, extract, and download PDF and Word documents from URLs or web searches with filtering capabilities and user confirmation checkpoints
SKILL.md 本文
目的
ブラウザオートメーション(Playwright)またはウェブ検索を使用して、ウェブソースからPDF/Wordドキュメントを検出および抽出します。
実行
- 戦略: フォームベースのサイトにはPlaywright、静的サイトにはWebSearch/WebFetchを使用
- オートメーション: ナビゲーション、フォーム入力、送信、browser_run_codeを介したリンク抽出
- 抽出: ドキュメントURLとメタデータを解析し、フィルタを適用
- 確認: 結果を提示し、ユーザーが確認したらダウンロード
委譲
必須: このコマンドのfrontmatterで定義されたエージェントを常に呼び出し、その指定された責任を果たさせてください。スキップ、置換、または直接シミュレートしないでください。
zzaia-document-specialist— PlaywrightおよびTavily MCPツールを使用してPDF/Wordドキュメントを検出およびダウンロード
ワークフロー
sequenceDiagram
participant U as User
participant C as Command
participant B as Browser/Search
U->>C: /scraping <parameters>
C->>B: Navigate/Search
B-->>C: Extract documents
C->>U: Present results
U->>C: Confirm download
C->>U: Download files
受け入れ基準
- インタラクティブサイトにはPlaywrightを優先し、WebSearchへのフォールバック
- メタデータ抽出を伴うPDF/Wordドキュメントの検出
- フィルタを適用し、ダウンロードにはユーザー確認を要求
- 有意なメッセージでエラーを適切に処理
例
# フィルタ付きフォームベースサイト
/capability:document:scraping url=https://site.com/search filters='{"term": "value"}'
# ダウンロード付きウェブ検索
/capability:document:scraping search="research papers 2025" download=true output-path=/workspace/docs
# ダウンロードなしURL
/capability:document:scraping url=https://site.com/resources download=false
出力
- メタデータ付きドキュメントテーブル(タイトル、タイプ、サイズ、URL)
- 確認プロンプトとダウンロード進捗
- 統計サマリーとエラーログ
ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ
詳細情報
- 作者
- zzaia
- ライセンス
- MIT
- 最終更新
- 2026/5/8
Source: https://github.com/zzaia/zzaia-agentic-workspace / ライセンス: MIT
関連スキル
doubt-driven-development
重要な判断はすべて、本番環境への展開前に新しい視点から対抗的レビューを実施します。速度より正確性が重要な場合、不慣れなコードを扱う場合、本番環境・セキュリティに関わるロジック・取り消し不可の操作など影響度が高い場合、または後でバグを修正するよりも今検証する方が効率的な場合に活用してください。
apprun-skills
TypeScriptを使用したAppRunアプリケーションのMVU設計に関する総合的なガイダンスが得られます。コンポーネントパターン、イベントハンドリング、状態管理(非同期ジェネレータを含む)、パラメータと保護機能を備えたルーティング・ナビゲーション、vistestを使用したテストに対応しています。AppRunコンポーネントの設計・レビュー、ルートの配線、状態フローの管理、AppRunテストの作成時に活用してください。
desloppify
コードベースのヘルスチェックと技術負債の追跡ツールです。コード品質、技術負債、デッドコード、大規模ファイル、ゴッドクラス、重複関数、コードスメル、命名規則の問題、インポートサイクル、結合度の問題についてユーザーが質問した場合に使用してください。また、ヘルススコアの確認、次の改善項目の提案、クリーンアップ計画の作成をリクエストされた際にも対応します。29言語に対応しています。
debugging-and-error-recovery
テストが失敗したり、ビルドが壊れたり、動作が期待と異なったり、予期しないエラーが発生したりした場合に、体系的な根本原因デバッグをガイドします。推測ではなく、根本原因を見つけて修正するための体系的なアプローチが必要な場合に使用してください。
test-driven-development
テスト駆動開発により実装を進めます。ロジックの実装、バグの修正、動作の変更など、あらゆる場面で活用できます。コードが正常に動作することを証明する必要がある場合、バグ報告を受けた場合、既存機能を修正する予定がある場合に使用してください。
incremental-implementation
変更を段階的に実施します。複数のファイルに影響する機能や変更を実装する場合に使用してください。大量のコードを一度に書こうとしている場合や、タスクが一度では完結できないほど大きい場合に活用します。