Agent Skills by ALSEL
Anthropic ClaudeLLM・AI開発⭐ リポ 0品質スコア 50/100

hwp

HWP/HWPXドキュメントの解析、JSON抽出、差分比較、フォームフィールド抽出、Markdown→HWPX変換など、エージェント向けの処理をkordocを使って行う際に活用します(読み取り・変換専用で、バイナリ編集にはrhwp-editを使用してください)。

description の原文を見る

Use kordoc for agent-native HWP/HWPX document parsing, JSON extraction, diffing, form-field extraction, and Markdown→HWPX reverse conversion (read/convert only — for binary editing use rhwp-edit).

SKILL.md 本文

HWP

このスキルの機能

kordoc.hwp / .hwpx / .hwpml ドキュメントを AI が読みやすい Markdown または JSON に変換し、 必要に応じてドキュメント比較、フォームフィールド抽出、Markdown→HWPX 逆変換を実行します。

このスキルの基本エンジンは常に kordoc です。ドキュメント変換、比較、フィールド抽出、逆変換まで同じツールで一貫して処理します。

スキルルーティング — この hwp スキルは参照・変換(読み取り専用) 専用です。 HWP バイナリ編集(本文テキスト挿入・削除、表作成、セル編集、置換)は rhwp-edit スキルが、 レイアウトデバッグ・IR ダンプ・サムネイル・デプロイ用ドキュメントロック解除などの高度な検査rhwp-advanced スキルが担当します。

使用する場合

  • 「このHWPファイルをMarkdownに変換してほしい」
  • 「公式文書をJSON構造で抽出してAIに読ませてほしい」
  • 「2つのバージョンのドキュメント差分を見たい」
  • 「申請書HWPX内のフォームフィールドを抽出してほしい」
  • 「AIが作成したMarkdownを再度HWPXで保存してほしい」
  • 「フォルダ内のドキュメントを一括変換してほしい」

使用しない場合

  • OCR が必須だが OCR プロバイダー接続がなく、イメージベースの PDF のみある場合
  • .docx.xlsx.pdf のみを扱う場合で、ドキュメント解析自体ではなくエディター GUI 自動化が必要な場合
  • 元のプログラムのリアルタイム UI 制御が必須の場合
  • 本文テキスト直接挿入・削除・置換または表構造変更rhwp-edit スキルの k-skill-rhwp CLI を使用します
  • ページ SVG レンダリングデバッグ・IR ダンプ・ir-diff・サムネイル抽出rhwp-advanced スキルのアップストリーム rhwp CLI を使用します

前提条件

  • Node.js 18+
  • 出力パスへの書き込み権限
  • kordocpdfjs-dist を同じグローバル・ローカル環境にインストール済み、または両方を含む npx --yes --package kordoc --package pdfjs-dist kordoc ... 実行環境
  • 現在配布されている kordoc CLI は起動時に pdfjs-dist を直ちにロードするため、PDF を使用しなくても一緒にインストールする必要があります

入力

  • 元の .hwp.hwpx.hwpml ファイルパスまたはフォルダ・グロブパス
  • 希望する結果形式:markdownjsonhwpx
  • 出力ファイル・ディレクトリパス
  • ページ範囲指定の有無
  • 比較・フォームフィールド抽出・逆変換の有無

ルーティングポリシー

デフォルト:kordoc

以下のタスクはすべてデフォルトで kordoc で処理されます。

  • HWP/HWPX/HWPML → Markdown
  • HWP/HWPX/HWPML → JSON(blocksmetadata
  • バッチ変換
  • ページ範囲解析
  • 画像・表・フォームを含む公式文書構造抽出
  • ディレクトリ監視変換(watch
  • Markdown→HWPX 逆変換
  • HWPX フォームフィールド抽出

オプションライブラリパス

CLI だけでは不十分な場合は Node API を使用します。

  • parse() — Markdown + 構造化ブロック
  • compare() — 旧新ドキュメント比較
  • extractFormFields() — 解析されたブロックからフォームフィールド抽出
  • markdownToHwpx() — Markdown→HWPX 逆変換

ワークフロー

1. CLI ランタイムの準備

1 回限りの変換であれば、両方を含む npx 形式をそのまま使用します。

npx --yes --package kordoc --package pdfjs-dist kordoc --help

繰り返し実行用のグローバルインストールが必要な場合:

npm install -g kordoc pdfjs-dist

現在配布されている kordoc CLI は pdfjs-dist がないと kordoc --help の段階から失敗するため、 クリーンな環境では 2 つのパッケージをまとめてインストールしてから実行します。

2. Node API サンプル用のローカルプロジェクトの準備

parse()compare()extractFormFields()markdownToHwpx() などの ESM サンプルは グローバル NODE_PATH ではなくローカルプロジェクトインストール基準で実行します。

mkdir -p ./kordoc-local && cd ./kordoc-local
npm init -y
npm install kordoc pdfjs-dist

既に package.json があるワークディレクトリの場合は、npm install kordoc pdfjs-dist を追加実行するだけです。

3. ドキュメントを Markdown に変換

npx --yes --package kordoc --package pdfjs-dist kordoc 報告書.hwp -o 報告書.md

複数のドキュメントを一度に処理する場合:

npx --yes --package kordoc --package pdfjs-dist kordoc ./ドキュメント/* -d ./変換結果

特定ページ範囲のみ読み込む場合:

npx --yes --package kordoc --package pdfjs-dist kordoc 報告書.hwp --pages 1-3

4. AI・自動化用の構造化 JSON を抽出

npx --yes --package kordoc --package pdfjs-dist kordoc 審査書.hwpx --format json > 審査書.json

JSON 結果では successmarkdownblocksmetadata を優先確認します。 表や画像が重要な場合は、blocks 内の tableimage タイプを確認します。

5. 解析されたブロックから HWPX フォームフィールドを検査

node --input-type=module - <<'EOF'
import { parse, extractFormFields } from "kordoc";

const result = await parse("申請書.hwpx");
if (!result.success) {
  console.error(result.error);
  process.exit(1);
}

const fields = extractFormFields(result.blocks);
console.log(JSON.stringify(fields, null, 2));
EOF

自動変換が継続的に入ってくるフォルダの場合は、CLI の watch コマンドを使用します。

npx --yes --package kordoc --package pdfjs-dist kordoc watch ./ドキュメント

6. Markdown を HWPX に逆変換

node --input-type=module - <<'EOF'
import { markdownToHwpx } from "kordoc";
import { writeFileSync } from "node:fs";

const hwpx = await markdownToHwpx("# タイトル\n\n本文\n\n| 項目 | 値 |\n| --- | --- |\n| 氏名 | 太郎 |");
writeFileSync("出力.hwpx", Buffer.from(hwpx));
EOF

7. 差分が重要な場合、2 つのドキュメントバージョンを比較

node --input-type=module - <<'EOF'
import { compare } from "kordoc";
import { readFileSync } from "node:fs";

const before = readFileSync("旧バージョン.hwp");
const after = readFileSync("最新バージョン.hwpx");
const diff = await compare(before, after);
console.log(diff.stats);
EOF

実行後の出力を検証

  • Markdown:ファイルが生成され、見出し・本文・表構造が壊れていないか確認
  • JSON:success: trueblocks / metadata の存在確認
  • バッチ処理:入力数と出力数が大きくずれていないか確認
  • フォームフィールド抽出:extractFormFields(result.blocks) の結果が空でないか確認
  • 逆変換:生成された .hwpx ファイルが開き、基本書式・テーブル構造が維持されているか確認
  • 比較:diff.stats の added / removed / modified 値が合理的か確認

完了条件

  • 要求された Markdown / JSON / HWPX 成果物が生成されている
  • 公式文書の表・画像・メタデータが必要なレベルで確認されている
  • フォームフィールド抽出または逆変換要求があった場合は、結果・出力構造まで検証されている
  • バッチ要求の場合は、処理範囲と失敗件数が整理されている

障害パターン

  • 破損した HWP / HWPX / HWPML ファイル
  • 暗号化・配布制限ドキュメントで一部解析の制限が発生
  • イメージベースの PDF で OCR プロバイダーがない
  • 出力ディレクトリ権限不足
  • フォームラベルがテンプレート内で予想と異なる配置となり、一部フィールドが認識されない

注記

  • kordoc は HWP / HWPX だけでなく HWPML、PDF、XLSX、DOCX も扱います
  • 基本目的は AI が読める Markdown / JSON 変換 です
  • 現在の配布ベースでは、ドキュメント化された CLI コマンドは基本変換と watch であり、フォーム処理は extractFormFields() などの Node API で接続されます

ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ

詳細情報

作者
nomadamas
リポジトリ
nomadamas/k-skill
ライセンス
MIT
最終更新
不明

Source: https://github.com/nomadamas/k-skill / ライセンス: MIT

関連スキル

OpenAILLM・AI開発⭐ リポ 6,054

agent-browser

AI エージェント向けのブラウザ自動化 CLI です。ウェブサイトとの対話が必要な場合に使用します。ページ遷移、フォーム入力、ボタンクリック、スクリーンショット取得、データ抽出、ウェブアプリのテスト、ブラウザ操作の自動化など、あらゆるブラウザタスクに対応できます。「ウェブサイトを開く」「フォームに記入する」「ボタンをクリックする」「スクリーンショットを取得する」「ページからデータを抽出する」「このウェブアプリをテストする」「サイトにログインする」「ブラウザ操作を自動化する」といった要求や、プログラマティックなウェブ操作が必要なタスクで起動します。

by JimmyLv
汎用LLM・AI開発⭐ リポ 1,982

anyskill

AnySkill — あなたのプライベート・スキルクラウド。GitHubを基盤としたリポジトリからエージェントスキルを管理、同期、動的にロードできます。自然言語でクラウドスキルを検索し、オンデマンドでプロンプトを自動ロード、カスタムスキルのアップロードと共有、スキルバンドルの一括インストールが可能です。OpenClaw、Antigravity、Claude Code、Cursorに対応しています。

by LeoYeAI
汎用LLM・AI開発⭐ リポ 1,982

engram

AIエージェント向けの永続的なメモリシステムです。バグ修正、意思決定、発見、設定変更の後はmem_saveを使用してください。ユーザーが「覚えている」「記憶している」と言及した場合、または以前のセッションと重複する作業を開始する際はmem_searchを使用します。セッション終了前にmem_session_summaryを使用して、コンテキストを保持してください。

by LeoYeAI
汎用LLM・AI開発⭐ リポ 21,584

skyvern

AI駆動のブラウザ自動化により、任意のウェブサイトを自動化できます。フォーム入力、データ抽出、ファイルダウンロード、ログイン、複数ステップのワークフロー実行など、ユーザーがウェブサイトと連携する必要があるときに使用します。Skyvernは、LLMとコンピュータビジョンを活用して、未知のサイトも自動操作可能です。Python SDK、TypeScript SDK、REST API、MCPサーバー、またはCLIを通じて統合できます。

by Skyvern-AI
汎用LLM・AI開発⭐ リポ 1,149

pinchbench

PinchBenchベンチマークを実行して、OpenClawエージェントの実世界タスクにおけるパフォーマンスを評価できます。モデルの機能テスト、モデル間の比較、ベンチマーク結果のリーダーボード提出、またはOpenClawのセットアップがカレンダー、メール、リサーチ、コーディング、複数ステップのワークフローにどの程度対応しているかを確認する際に使用します。

by pinchbench
汎用LLM・AI開発⭐ リポ 4,693

openui

OpenUIとOpenUI Langを使用してジェネレーティブUIアプリを構築できます。これらはLLM生成インターフェースのためのトークン効率的なオープン標準です。OpenUI、@openuidev、ジェネレーティブUI、LLMからのストリーミングUI、AI向けコンポーネントライブラリ、またはjson-render/A2UIの置き換えについて述べる際に使用します。スキャフォルディング、defineComponent、システムプロンプト、Renderer、およびOpenUI Lang出力のデバッグに対応しています。

by thesysdev
本サイトは GitHub 上で公開されているオープンソースの SKILL.md ファイルをクロール・インデックス化したものです。 各スキルの著作権は原作者に帰属します。掲載に問題がある場合は info@alsel.co.jp または /takedown フォームよりご連絡ください。
原作者: nomadamas · nomadamas/k-skill · ライセンス: MIT