markdown-converter
PDF、Word (.docx)、PowerPoint (.pptx)、Excel (.xlsx/.xls)、HTML、CSV、JSON、XML、画像(EXIF/OCR対応)、音声(文字起こし対応)、ZIPアーカイブ、YouTube URL、EPubなど多様な形式のファイルをMarkdownに変換するスキルです。LLMでの処理やテキスト解析を目的としたドキュメント変換が必要なときに使用します。変換にはmarkitdownを使用します。
description の原文を見る
Convert documents and files to Markdown using markitdown. Use when converting PDF, Word (.docx), PowerPoint (.pptx), Excel (.xlsx, .xls), HTML, CSV, JSON, XML, images (with EXIF/OCR), audio (with transcription), ZIP archives, YouTube URLs, or EPubs to Markdown format for LLM processing or text analysis.
SKILL.md 本文
Markdown Converter
uvx markitdown を使用してファイルをMarkdownに変換します。インストール不要です。
基本的な使い方
# 標準出力に変換
uvx markitdown input.pdf
# ファイルに保存
uvx markitdown input.pdf -o output.md
uvx markitdown input.docx > output.md
# 標準入力から
cat input.pdf | uvx markitdown
サポートされているフォーマット
- ドキュメント: PDF、Word (.docx)、PowerPoint (.pptx)、Excel (.xlsx, .xls)
- Web/データ: HTML、CSV、JSON、XML
- メディア: 画像 (EXIF + OCR)、音声 (EXIF + 文字起こし)
- その他: ZIP (コンテンツを反復処理)、YouTube URL、EPub
オプション
-o OUTPUT # 出力ファイル
-x EXTENSION # ファイル拡張子のヒント (標準入力用)
-m MIME_TYPE # MIMEタイプのヒント
-c CHARSET # 文字セットのヒント (例: UTF-8)
-d # Azure Document Intelligenceを使用
-e ENDPOINT # Document Intelligenceエンドポイント
--use-plugins # サードパーティプラグインを有効化
--list-plugins # インストール済みプラグインを表示
例
# Word文書を変換
uvx markitdown report.docx -o report.md
# Excelスプレッドシートを変換
uvx markitdown data.xlsx > data.md
# PowerPointプレゼンテーションを変換
uvx markitdown slides.pptx -o slides.md
# ファイルタイプヒント付きで変換 (標準入力用)
cat document | uvx markitdown -x .pdf > output.md
# より良いPDF抽出のためにAzure Document Intelligenceを使用
uvx markitdown scan.pdf -d -e "https://your-resource.cognitiveservices.azure.com/"
注釈
- 出力はドキュメント構造を保持します: 見出し、表、リスト、リンク
- 初回実行は依存関係をキャッシュします。その後の実行は高速です
- 抽出が不十分な複雑なPDFの場合は、
-dと Azure Document Intelligence を使用してください
ライセンス: CC0-1.0(寛容ライセンスのため全文を引用しています) · 原本リポジトリ
詳細情報
- 作者
- intellectronica
- ライセンス
- CC0-1.0
- 最終更新
- 不明
Source: https://github.com/intellectronica/agent-skills / ライセンス: CC0-1.0
関連スキル
agent-browser
AI エージェント向けのブラウザ自動化 CLI です。ウェブサイトとの対話が必要な場合に使用します。ページ遷移、フォーム入力、ボタンクリック、スクリーンショット取得、データ抽出、ウェブアプリのテスト、ブラウザ操作の自動化など、あらゆるブラウザタスクに対応できます。「ウェブサイトを開く」「フォームに記入する」「ボタンをクリックする」「スクリーンショットを取得する」「ページからデータを抽出する」「このウェブアプリをテストする」「サイトにログインする」「ブラウザ操作を自動化する」といった要求や、プログラマティックなウェブ操作が必要なタスクで起動します。
anyskill
AnySkill — あなたのプライベート・スキルクラウド。GitHubを基盤としたリポジトリからエージェントスキルを管理、同期、動的にロードできます。自然言語でクラウドスキルを検索し、オンデマンドでプロンプトを自動ロード、カスタムスキルのアップロードと共有、スキルバンドルの一括インストールが可能です。OpenClaw、Antigravity、Claude Code、Cursorに対応しています。
engram
AIエージェント向けの永続的なメモリシステムです。バグ修正、意思決定、発見、設定変更の後はmem_saveを使用してください。ユーザーが「覚えている」「記憶している」と言及した場合、または以前のセッションと重複する作業を開始する際はmem_searchを使用します。セッション終了前にmem_session_summaryを使用して、コンテキストを保持してください。
skyvern
AI駆動のブラウザ自動化により、任意のウェブサイトを自動化できます。フォーム入力、データ抽出、ファイルダウンロード、ログイン、複数ステップのワークフロー実行など、ユーザーがウェブサイトと連携する必要があるときに使用します。Skyvernは、LLMとコンピュータビジョンを活用して、未知のサイトも自動操作可能です。Python SDK、TypeScript SDK、REST API、MCPサーバー、またはCLIを通じて統合できます。
pinchbench
PinchBenchベンチマークを実行して、OpenClawエージェントの実世界タスクにおけるパフォーマンスを評価できます。モデルの機能テスト、モデル間の比較、ベンチマーク結果のリーダーボード提出、またはOpenClawのセットアップがカレンダー、メール、リサーチ、コーディング、複数ステップのワークフローにどの程度対応しているかを確認する際に使用します。
openui
OpenUIとOpenUI Langを使用してジェネレーティブUIアプリを構築できます。これらはLLM生成インターフェースのためのトークン効率的なオープン標準です。OpenUI、@openuidev、ジェネレーティブUI、LLMからのストリーミングUI、AI向けコンポーネントライブラリ、またはjson-render/A2UIの置き換えについて述べる際に使用します。スキャフォルディング、defineComponent、システムプロンプト、Renderer、およびOpenUI Lang出力のデバッグに対応しています。