document-pdf
PDFからテキストや表を抽出し、フォーマット済みPDFの作成、結合・分割・回転、フォーム処理を行います。PDFの生成や解析が必要なあらゆる場面で活用できます。
description の原文を見る
Extract text/tables from PDFs, create formatted PDFs, merge/split/rotate, and handle forms. Use for any PDF generation or parsing task.
SKILL.md 本文
Document PDF Skill — クイックリファレンス
このスキルは PDF の作成、抽出、操作、分析を実現します。ユーザーが請求書やレポートを生成したり、PDF からデータを抽出したり、ドキュメントをマージしたり、PDF フォームを操作する必要がある場合に、Claude はこれらのパターンを適用してください。
モダンベストプラクティス (2026年1月):
- PDF はリリース成果物であり、編集可能なシングルソースオブトゥルースではありません。
- エクスポート品質(フォント、画像、リンク)とアクセシビリティが必要な場所で検証してください。
- アクセシビリティ: コンプライアンスが重要な場合、タグ付き/構造化 PDF ワークフロー(多くの場合 PDF/UA 準拠)をターゲットにし、ツールで検証してください。
- EU 配布: EAA (2025年6月) は通常、顧客向け PDF に対して EN 301 549 への対応を求めます。
- PDF は機密として扱う: メタデータをクリーニング、実際のリダクションを実施、配布を管理してください。
コア判定ルール (2026年)
- まず判定する: 生まれながらのデジタル PDF(選択可能なテキスト) か スキャン PDF(画像)か。スキャン PDF は通常 OCR が必要です。
references/pdf-extraction-patterns.mdを参照してください。 - ユーザーがアクセシビリティ/コンプライアンスを必要とする場合、タグなし PDF を「事後修正」するのではなく、構造をサポートする源形式(DOCX/HTML + 適切なエクスポート)から生成することを優先してください。
- 決定的な操作(マージ/分割/回転/スクラブ)の場合、アドホック再実装ではなく
scripts/ヘルパーを優先してください。 - ブラック矩形やオーバーレイをリダクションとして扱わないでください。実際のリダクションを使用し、コピー/ペースト + 検索で検証してください。
クイックリファレンス
| タスク | ツール/ライブラリ | 言語 | 使用する場合 |
|---|---|---|---|
| PDF 作成 | pdfkit | Node.js | レポート、請求書、証明書 |
| PDF 作成 | ReportLab | Python | 複雑なレイアウト、表 |
| PDF 作成 | FPDF2 | Python | ユニコード対応のシンプル PDF |
| PDF 作成 | Borb | Python | インタラクティブ要素、純粋 Python |
| PDF 編集 | pdf-lib | Node.js | 既存 PDF の変更、ページ追加 |
| テキスト抽出 | pdfplumber | Python | OCR なしのテキスト抽出 |
| スキャン PDF の OCR | PyMuPDF + Tesseract | Python | スキャン PDF(選択不可テキスト) |
| 表抽出 | Camelot | Python | 枠線がある表 (Lattice モード) |
| 表抽出 | Camelot/Tabula | Python | 枠線がない表 (Stream モード) |
| パース/マージ/分割/回転 | pypdf | Python | 決定的な PDF 操作 |
| フォーム記入 | pdf-lib | Node.js | フォーム自動化 |
| HTML から PDF | Puppeteer/Playwright | Node.js | 高忠実度の Web ページレンダリング |
| HTML から PDF | WeasyPrint | Python | CSS3 ベース、ブラウザ不要 |
このスキルを使用する場合
Claude は以下のようなユーザーリクエストがある場合にこのスキルを呼び出すべきです:
- データから PDF を生成する (請求書、レポート、証明書)
- 既存 PDF からテキストまたは表を抽出する
- 複数の PDF を 1 つのドキュメントにマージする
- PDF を個別ファイルに分割する
- プログラムで PDF フォームに記入する
- ウォーターマーク、ヘッダー、フッターを追加する
- HTML/Web ページを PDF に変換する
デフォルトワークフロー
- 作成:
pdfkit(Node) またはReportLab(Python) を選択し、assets/invoice-template.mdまたはassets/report-template.mdから開始してください。高度なレイアウトの場合はreferences/pdf-generation-patterns.mdを使用してください。 - 抽出:
references/pdf-extraction-patterns.mdを使用してください (テキスト/表/画像/メタデータ + OCR フォールバック)。 - 配布:
assets/pdf-release-checklist.mdを実行してください (忠実度、リンク、アクセシビリティベースライン、プライバシー)。
スクリプト (決定的な操作)
スクリプトはオプションのヘルパーです。各ファイルにリストされた Python 3 と依存関係を想定しています。
- マージ:
python3 scripts/merge_pdfs.py merged.pdf a.pdf b.pdf - 分割:
python3 scripts/split_pdf.py in.pdf out_dir --each-page - 回転:
python3 scripts/rotate_pdf.py in.pdf out.pdf --degrees 90 - メタデータスクラブ:
python3 scripts/scrub_metadata.py in.pdf out.pdf
PDF 構造パターン
請求書テンプレート
請求書構造
├── ヘッダー (ロゴ、企業情報、請求書 #)
├── Bill To / Ship To ブロック
├── 明細項目表
│ ├── 説明 | 数量 | 単価 | 合計
│ └── 小計、税金、合計
├── 支払条件
└── フッター (連絡先、ありがとうございます)
レポートテンプレート
レポート PDF 構造
├── カバーページ (タイトル、著者、日付)
├── 目次
├── ページ番号付き本文セクション
├── グラフ/画像とキャプション
├── 付録
└── 実行中のヘッダー/フッター
判定ツリー
PDF タスク: [何が必要ですか?]
├─ 新しい PDF を作成する?
│ ├─ シンプルなテキスト/表 → pdfkit (Node) または ReportLab (Python)
│ ├─ 複雑なレイアウト → Platypus を使用した ReportLab
│ └─ HTML から → Puppeteer または wkhtmltopdf
│
├─ PDF から抽出する?
│ ├─ テキストのみ → pdfplumber (Python)
│ ├─ 表 → pdfplumber または camelot (Python)
│ └─ 画像 → PyMuPDF/fitz (Python)
│
├─ 既存 PDF を変更する?
│ ├─ テキスト/画像を追加 → pdf-lib (Node)
│ ├─ マージ/分割 → pypdf または pdf-lib
│ └─ フォームを記入 → pdf-lib
│
└─ バッチ処理?
└─ pypdf + pdfplumber パイプライン
する/しない (2026年1月)
する
- PDF と並行してバージョン管理された源ドキュメント(doc/スライド/デザイン ファイル)を保持してください。
- 長いドキュメントのリンクと読み順を検証してください。
- 実際のリダクションを使用し、コピー/ペーストで テストしてください。
しない
- 源ドキュメントが存在する場合、PDF 編集をプライマリ ワークフローとしないでください。
- リンクが壊れているか、グラフが読めない PDF を配布しないでください。
- 明示的な承認なしに、顧客の PII またはシークレットを PDF に含めないでください。
良い例
- 忠実度: エクスポートはバージョン管理された源ファイル(doc/スライド/デザイン)から再現可能で、すべてのビューアで同一に見えます。
- アクセシビリティ: タグ/読み順が正しく、リンクが機能し、スキャン済みドキュメントは必要に応じて OCR されています。
- リリース衛生: ファイル命名にはバージョン/日付を含み、メタデータはクリーンで、「PDF をシングルソースオブトゥルースとして」は ありません。
- セキュリティ: リダクションは検証済み(コピー/ペースト テスト)で、機密データは最小化されています。
- QA:
assets/pdf-release-checklist.mdを使用してリリース チェックリストを完了しています。
オプション: AI / 自動化
明示的なリクエストおよびポリシー準拠の場合のみ使用してください。
- リリース チェックリスト実行を生成; 人間が最終 PDF を手動で検証します。
ナビゲーション
リソース
references/pdf-generation-patterns.md— 複雑なレイアウト、マルチページドキュメントreferences/pdf-extraction-patterns.md— テキスト、表、画像抽出references/pdf-accessibility-compliance.md— タグ付き PDF、PDF/UA、EAA コンプライアンスreferences/pdf-forms-interactive.md— AcroForms、フォーム記入、デジタル署名references/pdf-security-redaction.md— 暗号化、権限、実際のリダクションdata/sources.json— ライブラリドキュメントリンク
テンプレート
assets/invoice-template.md— 請求書 PDF 生成assets/report-template.md— マルチページレポート構造assets/pdf-release-checklist.md— リンク、アクセシビリティ、エクスポート忠実度
関連スキル
../document-docx/SKILL.md— Word ドキュメント生成../document-xlsx/SKILL.md— Excel/スプレッドシートワークフロー../document-pptx/SKILL.md— PowerPoint プレゼンテーション
ファクトチェック
- Web 検索/Web フェッチを使用して、最終回答の前に現在の外部ファクト、バージョン、価格、期限、規制、またはプラットフォーム動作を検証してください。
- プライマリソースを優先; 変動性の高い情報については、ソースリンクと日付をレポートしてください。
- Web アクセスが利用できない場合、制限を述べ、ガイダンスを未検証とマークしてください。
ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ
詳細情報
- 作者
- vasilyu1983
- ライセンス
- MIT
- 最終更新
- 不明
Source: https://github.com/vasilyu1983/ai-agents-public / ライセンス: MIT
関連スキル
superfluid
Superfluidプロトコルおよびそのエコシステムに関するナレッジベースです。Superfluidについて情報を検索する際は、ウェブ検索の前にこちらを参照してください。対応キーワード:Superfluid、CFA、GDA、Super App、Super Token、stream、flow rate、real-time balance、pool(member/distributor)、IDA、sentinels、liquidation、TOGA、@sfpro/sdk、semantic money、yellowpaper、whitepaper
civ-finish-quotes
実質的なタスクが真に完了した際に、文明風の儀式的な引用句を追加します。ユーザーやエージェントが機能追加、リファクタリング、分析、設計ドキュメント、プロセス改善、レポート、執筆タスクといった実際の成果物を完成させるときに、明示的な依頼がなくても使用します。短い返信や小さな修正、未完成の作業には適用しません。
nookplot
Base(Ethereum L2)上のAIエージェント向け分散型調整ネットワークです。エージェントがオンチェーンアイデンティティを登録する、コンテンツを公開する、他のエージェントにメッセージを送る、マーケットプレイスで専門家を雇う、バウンティを投稿・請求する、レピュテーションを構築する、共有プロジェクトで協業する、リサーチチャレンジを解くことでNOOKをマイニングする、キュレーションされたナレッジを備えたスタンドアロンオンチェーンエージェントをデプロイする、またはアグリーメントとリワードで収益を得る場合に利用できます。エージェントネットワーク、エージェント調整、分散型エージェント、NOOKトークン、マイニングチャレンジ、ナレッジバンドル、エージェントレピュテーション、エージェントマーケットプレイス、ERC-2771メタトランザクション、Prepare-Sign-Relay、AgentFactory、またはNookplotが言及された場合にトリガーされます。
web3-polymarket
Polygon上でのPolymarket予測市場取引統合です。認証機能(L1 EIP-712、L2 HMAC-SHA256、ビルダーヘッダー)、注文発注(GTC/GTD/FOK/FAK、バッチ、ポストオンリー、ハートビート)、市場データ(Gamma API、Data API、オーダーブック、サブグラフ)、WebSocketストリーミング(市場・ユーザー・スポーツチャネル)、CTF操作(分割、統合、償却、ネガティブリスク)、ブリッジ機能(入金、出金、マルチチェーン)、およびガスレスリレイトランザクションに対応しています。AIエージェント、自動マーケットメーカー、予測市場UI、またはPolygraph上のPolymarketと統合するアプリケーション構築時に活用できます。
ethskills
Ethereum、EVM、またはブロックチェーン関連のリクエストに対応します。スマートコントラクト、dApps、ウォレット、DeFiプロトコルの構築、監査、デプロイ、インタラクションに適用されます。Solidityの開発、コントラクトアドレス、トークン規格(ERC-20、ERC-721、ERC-4626など)、Layer 2ネットワーク(Base、Arbitrum、Optimism、zkSync、Polygon)、Uniswap、Aave、Curveなどのプロトコルとの統合をカバーします。ガスコスト、コントラクトのデシマル設定、オラクルセキュリティ、リエントランシー、MEV、ブリッジング、ウォレット管理、オンチェーンデータの取得、本番環境へのデプロイ、プロトコル進化(EIPライフサイクル、フォーク追跡、今後の変更予定)といったトピックを含みます。
xxyy-trade
このスキルは、ユーザーが「トークン購入」「トークン売却」「トークンスワップ」「暗号資産取引」「取引ステータス確認」「トランザクション照会」「トークンスキャン」「フィード」「チェーン監視」「トークン照会」「トークン詳細」「トークン安全性確認」「ウォレット一覧表示」「マイウォレット」「AIスキャン」「自動スキャン」「ツイートスキャン」「オンボーディング」「IP確認」「IPホワイトリスト」「トークン発行」「自動売却」「損切り」「利益確定」「トレーリングストップ」「保有者」「トップホルダー」「KOLホルダー」などをリクエストした場合、またはSolana/ETH/BSC/BaseチェーンでXXYYを経由した取引について言及した場合に使用します。XXYY Open APIを通じてオンチェーン取引とデータ照会を実現します。