汎用音声・動画・メディア⭐ リポ 15品質スコア 72/100
ocr-and-documents
PDFやスキャン画像からテキストを抽出できます。PyMuPDFやMarker-PDFなどのツールを使用して、文書内のテキストを効率的に取得します。
description の原文を見る
Extract text from PDFs/scans (pymupdf, marker-pdf).
SKILL.md 本文
注意: このスキルのライセンスは AGPL-3.0 です。本サイトでは本文プレビューのみを表示しています。利用前に GitHub の原本でライセンス条件をご確認ください。
PDF & ドキュメント抽出
DOCX の場合: python-docx を使用してください(実際のドキュメント構造を解析し、OCR よりも優れています)。
PPTX の場合: powerpoint スキルを参照してください(python-pptx を使用し、スライド/ノート完全対応)。
このスキルは PDF とスキャン済みドキュメント に対応しています。
ステップ 1: リモート URL が利用可能か?
ドキュメントに URL がある場合、常に web_extract を最初に試してください:
web_extract(urls=["https://arxiv.org/pdf/2402.03300"])
web_extract(urls=["https://example.com/report.pdf"])
このコマンドは Firecrawl を使用して PDF からマークダウンへの変換を行い、ローカルの依存関係は不要です。
ローカル抽出を使用するケース: ファイルがローカルである、web_extract が失敗した、またはバッチ処理が必要な場合のみ。
ステップ 2: ローカルエクストラクターを選択
| 機能 | pymupdf (~25MB) | marker-pdf (~3-5GB) | |----
...
詳細情報
- 作者
- invergent-ai
- ライセンス
- AGPL-3.0
- 最終更新
- 2026/5/12
Source: https://github.com/invergent-ai/surogates / ライセンス: AGPL-3.0