汎用ソフトウェア開発⭐ リポ 204品質スコア 88/100
markdrop
Markdropパッケージの専門的なAIスキルと使用方法です。Markdropは、PDFをMarkdown/HTMLに変換するPythonツールで、AI技術を活用して画像やテーブルの説明を自動生成します。
description の原文を見る
Professional AI skill and usage instructions for the Markdrop package, a Python tool for converting PDFs to Markdown/HTML with AI-powered image/table descriptions.
SKILL.md 本文
注意: このスキルのライセンスは GPL-3.0 です。本サイトでは本文プレビューのみを表示しています。利用前に GitHub の原本でライセンス条件をご確認ください。
Markdrop スキル
markdrop スキルへようこそ。markdrop は、PDFドキュメントを構造化されたMarkdownと対話的なHTMLに変換する強力なPythonパッケージおよびCLIツールです。AIビジョンモデルを活用して、抽出された画像と表を自動的に解析し、説明を生成します。
PDFを処理し、テキストまたは画像の説明を付与することを目指すAIエージェントまたはユーザーの方は、このドキュメントを参考に markdrop を効率的かつ正確に活用できます。
1. 機能
- PDF to Markdown/HTML: フォーマットを保持し、画像を抽出し、Microsoft Table TransformerおよびDoclingを使用してテーブルを検出します。ローカルファイルパスおよび直接PDFのURLに対応しています。
- AIビジョン説明: GEMINI、OPENAI、ANTHROPIC、GROQ、OPENROUTER、またはLITELLMを使用して、画像とテーブルの豊かな説明を生成します。
- バッチ処理: 単一コマンドで複数のLLMバックエンドを同時に使用し、画像ディレクトリ全体を説明することができます。
- 拡張可能な設定: 使用するテキストモデルとビジョンモデル、プロンプト、解像度スケール、出力機能
...
詳細情報
- 作者
- shoryasethia
- ライセンス
- GPL-3.0
- 最終更新
- 2026/3/18
Source: https://github.com/shoryasethia/markdrop / ライセンス: GPL-3.0