read
PDFおよびWordドキュメントからテキストを抽出し、その内容を会話のコンテキストに組み込むことができます。
description の原文を見る
Extract text from PDF and Word documents and inject content into conversation context
SKILL.md 本文
目的
PDFおよびWordドキュメントから構造化されたテキストコンテンツを抽出し、会話コンテキスト内で参照できるようにします。メタデータヘッダー付きのドキュメントページ/セクションのバッチ読み取りに対応しています。
実行方法
-
入力の検証: ファイルパスをチェックし、サポートされている拡張子(.pdfまたは.docx)を確認します
- ファイルが存在し、読み取り可能であることを確認する
- ファイル拡張子を検証する
- サポートされていない形式について、適切なエラーメッセージを表示する
-
コンテンツの抽出:
./scripts/extract-document.pyを実行してドキュメントを解析します- PDF: pypdfを使用してすべてのページからテキストを抽出する
- DOCX: python-docxを使用して段落および表から抽出する
- 構造情報を保持する
-
結果の表示: ドキュメントメタデータとコンテンツサマリーを出力します
- ファイル名と場所
- ページ数(PDF)またはセクション数(DOCX)
- 合計文字数
- 抽出されたテキスト全文
委任
必須: このコマンドのフロントマターで定義されたエージェントを、それぞれの責務に対して常に呼び出してください。スキップ、置き換え、または直接シミュレートしないでください。
zzaia-document-specialist— PDFおよびWordドキュメントからコンテンツを抽出し、構造化します
ワークフロー
sequenceDiagram
participant U as User
participant C as Command
participant P as Python Hook
participant F as File System
U->>C: /capability:document:read --file <path>
C->>C: Validate path and extension
C->>P: Execute extraction hook
P->>F: Open and read file
F-->>P: File content
P->>P: Parse by file type
P-->>C: Extracted text + metadata
C->>C: Format output with summary
C-->>U: Content ready for context
受け入れ条件
- PDFファイルからページマーカー付きのすべてのテキストを抽出する
- DOCXファイルから段落および表をセクションマーカー付きで抽出する
- ドキュメントメタデータ(ファイル名、タイプ、項目数、文字数)を表示する
- 見つからないファイルを明確なエラーメッセージで処理する
- サポートされていない形式をフォーマットガイダンス付きで処理する
- 見つからない依存関係をインストール手順付きで報告する
- 出力は会話コンテキスト注入に適したプレーンテキストである
使用例
/capability:document:read --file ~/projects/report.pdf
/capability:document:read --file ./contract.docx
/capability:document:read --file /absolute/path/document.pdf --summary
出力
- ドキュメントメタデータヘッダー(ファイル名、タイプ、数、サイズ)
- ページ/表区切り付きの抽出されたテキスト全文
- 整理のためのセクションマーカー
- コンテキスト注入用のプレーンテキスト形式
ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ
詳細情報
- 作者
- zzaia
- ライセンス
- MIT
- 最終更新
- 2026/5/8
Source: https://github.com/zzaia/zzaia-agentic-workspace / ライセンス: MIT
関連スキル
doubt-driven-development
重要な判断はすべて、本番環境への展開前に新しい視点から対抗的レビューを実施します。速度より正確性が重要な場合、不慣れなコードを扱う場合、本番環境・セキュリティに関わるロジック・取り消し不可の操作など影響度が高い場合、または後でバグを修正するよりも今検証する方が効率的な場合に活用してください。
apprun-skills
TypeScriptを使用したAppRunアプリケーションのMVU設計に関する総合的なガイダンスが得られます。コンポーネントパターン、イベントハンドリング、状態管理(非同期ジェネレータを含む)、パラメータと保護機能を備えたルーティング・ナビゲーション、vistestを使用したテストに対応しています。AppRunコンポーネントの設計・レビュー、ルートの配線、状態フローの管理、AppRunテストの作成時に活用してください。
desloppify
コードベースのヘルスチェックと技術負債の追跡ツールです。コード品質、技術負債、デッドコード、大規模ファイル、ゴッドクラス、重複関数、コードスメル、命名規則の問題、インポートサイクル、結合度の問題についてユーザーが質問した場合に使用してください。また、ヘルススコアの確認、次の改善項目の提案、クリーンアップ計画の作成をリクエストされた際にも対応します。29言語に対応しています。
debugging-and-error-recovery
テストが失敗したり、ビルドが壊れたり、動作が期待と異なったり、予期しないエラーが発生したりした場合に、体系的な根本原因デバッグをガイドします。推測ではなく、根本原因を見つけて修正するための体系的なアプローチが必要な場合に使用してください。
test-driven-development
テスト駆動開発により実装を進めます。ロジックの実装、バグの修正、動作の変更など、あらゆる場面で活用できます。コードが正常に動作することを証明する必要がある場合、バグ報告を受けた場合、既存機能を修正する予定がある場合に使用してください。
incremental-implementation
変更を段階的に実施します。複数のファイルに影響する機能や変更を実装する場合に使用してください。大量のコードを一度に書こうとしている場合や、タスクが一度では完結できないほど大きい場合に活用します。