Agent Skills by ALSEL
汎用音声・動画・メディア⭐ リポ 15品質スコア 72/100

ocr-and-documents

PDFやスキャン画像からテキストを抽出できます。PyMuPDFやMarker-PDFなどのツールを使用して、文書内のテキストを効率的に取得します。

description の原文を見る

Extract text from PDFs/scans (pymupdf, marker-pdf).

SKILL.md 本文

注意: このスキルのライセンスは AGPL-3.0 です。本サイトでは本文プレビューのみを表示しています。利用前に GitHub の原本でライセンス条件をご確認ください。

PDF & ドキュメント抽出

DOCX の場合: python-docx を使用してください(実際のドキュメント構造を解析し、OCR よりも優れています)。 PPTX の場合: powerpoint スキルを参照してください(python-pptx を使用し、スライド/ノート完全対応)。 このスキルは PDF とスキャン済みドキュメント に対応しています。

ステップ 1: リモート URL が利用可能か?

ドキュメントに URL がある場合、常に web_extract を最初に試してください:

web_extract(urls=["https://arxiv.org/pdf/2402.03300"])
web_extract(urls=["https://example.com/report.pdf"])

このコマンドは Firecrawl を使用して PDF からマークダウンへの変換を行い、ローカルの依存関係は不要です。

ローカル抽出を使用するケース: ファイルがローカルである、web_extract が失敗した、またはバッチ処理が必要な場合のみ。

ステップ 2: ローカルエクストラクターを選択

| 機能 | pymupdf (~25MB) | marker-pdf (~3-5GB) | |----

...

詳細情報

作者
invergent-ai
リポジトリ
invergent-ai/surogates
ライセンス
AGPL-3.0
最終更新
2026/5/12

Source: https://github.com/invergent-ai/surogates / ライセンス: AGPL-3.0

本サイトは GitHub 上で公開されているオープンソースの SKILL.md ファイルをクロール・インデックス化したものです。 各スキルの著作権は原作者に帰属します。掲載に問題がある場合は info@alsel.co.jp または /takedown フォームよりご連絡ください。
原作者: invergent-ai · invergent-ai/surogates · ライセンス: AGPL-3.0