Agent Skills by ALSEL
Anthropic Claudeソフトウェア開発⭐ リポ 0品質スコア 50/100

kreuzberg

Kreuzbergを使用して、91以上のドキュメント形式(PDF、Office、画像、HTML、メール、アーカイブ、学術文書など)からテキスト、表、メタデータ、画像を抽出します。Python、Node.js/TypeScript、Rust、CLIでKreuzberg APIを呼び出すコードを記述する際に使用してください。インストール、抽出(同期・非同期)、設定(OCR、チャンキング、出力形式)、バッチ処理、エラーハンドリング、プラグインについて説明します。

description の原文を見る

>- Extract text, tables, metadata, and images from 91+ document formats (PDF, Office, images, HTML, email, archives, academic) using Kreuzberg. Use when writing code that calls Kreuzberg APIs in Python, Node.js/TypeScript, Rust, or CLI. Covers installation, extraction (sync/async), configuration (OCR, chunking, output format), batch processing, error handling, and plugins.

SKILL.md 本文

注意: このスキルのライセンスは NOASSERTION (未指定) です。本サイトでは本文プレビューのみを表示しています。利用前に GitHub の原本でライセンス条件をご確認ください。

Kreuzberg ドキュメント抽出

Kreuzberg は Rust コアを備えた高性能ドキュメント知能ライブラリで、Python、Node.js/TypeScript、Ruby、Go、Java、C#、PHP、Elixir のネイティブバインディングを提供します。PDF、Office ドキュメント、画像(OCR 付き)、HTML、メール、アーカイブ、学術形式を含む 91 以上のファイル形式からテキスト、テーブル、メタデータ、画像を抽出します。

以下を行うコードを記述する場合にこのスキルを使用してください:

  • ドキュメントからテキストやメタデータを抽出する
  • スキャンされたドキュメントや画像に対して OCR を実行する
  • 複数のファイルをバッチ処理する
  • 抽出オプション(出力形式、チャンキング、OCR、言語検出)を設定する
  • カスタムプラグイン(ポストプロセッサ、バリデータ、OCR バックエンド)を実装する

インストール

Python

pip install kreuzberg
# Optional OCR backends:
pip install kreuzberg[easyocr]    # EasyOCR

Node.js

npm install @kreuzberg/node

...

詳細情報

作者
kreuzberg-dev
リポジトリ
kreuzberg-dev/kreuzberg
ライセンス
NOASSERTION
最終更新
不明

Source: https://github.com/kreuzberg-dev/kreuzberg / ライセンス: NOASSERTION

関連スキル

汎用ソフトウェア開発⭐ リポ 39,967

doubt-driven-development

重要な判断はすべて、本番環境への展開前に新しい視点から対抗的レビューを実施します。速度より正確性が重要な場合、不慣れなコードを扱う場合、本番環境・セキュリティに関わるロジック・取り消し不可の操作など影響度が高い場合、または後でバグを修正するよりも今検証する方が効率的な場合に活用してください。

by addyosmani
汎用ソフトウェア開発⭐ リポ 1,175

apprun-skills

TypeScriptを使用したAppRunアプリケーションのMVU設計に関する総合的なガイダンスが得られます。コンポーネントパターン、イベントハンドリング、状態管理(非同期ジェネレータを含む)、パラメータと保護機能を備えたルーティング・ナビゲーション、vistestを使用したテストに対応しています。AppRunコンポーネントの設計・レビュー、ルートの配線、状態フローの管理、AppRunテストの作成時に活用してください。

by yysun
OpenAIソフトウェア開発⭐ リポ 797

desloppify

コードベースのヘルスチェックと技術負債の追跡ツールです。コード品質、技術負債、デッドコード、大規模ファイル、ゴッドクラス、重複関数、コードスメル、命名規則の問題、インポートサイクル、結合度の問題についてユーザーが質問した場合に使用してください。また、ヘルススコアの確認、次の改善項目の提案、クリーンアップ計画の作成をリクエストされた際にも対応します。29言語に対応しています。

by Git-on-my-level
汎用ソフトウェア開発⭐ リポ 39,967

debugging-and-error-recovery

テストが失敗したり、ビルドが壊れたり、動作が期待と異なったり、予期しないエラーが発生したりした場合に、体系的な根本原因デバッグをガイドします。推測ではなく、根本原因を見つけて修正するための体系的なアプローチが必要な場合に使用してください。

by addyosmani
汎用ソフトウェア開発⭐ リポ 39,967

test-driven-development

テスト駆動開発により実装を進めます。ロジックの実装、バグの修正、動作の変更など、あらゆる場面で活用できます。コードが正常に動作することを証明する必要がある場合、バグ報告を受けた場合、既存機能を修正する予定がある場合に使用してください。

by addyosmani
汎用ソフトウェア開発⭐ リポ 39,967

incremental-implementation

変更を段階的に実施します。複数のファイルに影響する機能や変更を実装する場合に使用してください。大量のコードを一度に書こうとしている場合や、タスクが一度では完結できないほど大きい場合に活用します。

by addyosmani
本サイトは GitHub 上で公開されているオープンソースの SKILL.md ファイルをクロール・インデックス化したものです。 各スキルの著作権は原作者に帰属します。掲載に問題がある場合は info@alsel.co.jp または /takedown フォームよりご連絡ください。
原作者: kreuzberg-dev · kreuzberg-dev/kreuzberg · ライセンス: NOASSERTION (未指定)