Agent Skills by ALSEL
Anthropic Claudeその他⭐ リポ 0品質スコア 50/100

extract

抽出という意味で、液体や物質から特定の成分を取り出したり、テキストや情報から必要な部分を引き出したりすることです。また、濃縮液や濃縮エキスを指す場合もあります。

description の原文を見る

extract

SKILL.md 本文

Extract

Extract structured data from unstructured text using Claude's vision and text processing capabilities.

概要

このスキルは、非構造化テキストまたは画像から構造化されたデータを抽出する機能を提供します。Claude の自然言語処理と視覚処理能力を活用して、以下のようなタスクに対応します:

  • テキストドキュメントから主要情報を抽出
  • 画像内のテキストや情報を認識・抽出
  • 複雑なドキュメントレイアウトから構造化データを取得
  • メタデータやエンティティの自動識別

主な機能

テキスト抽出

非構造化テキストから必要な情報を抽出します。JSON や CSV などの構造化形式で出力可能です。

ビジョン処理

画像ファイルを入力として受け取り、視覚的コンテンツからテキストやデータを抽出します。

スキーマ定義

出力形式を JSON Schema として定義し、期待される構造化データの形式を指定できます。

使用例

テキストからの抽出

from anthropic import Anthropic

client = Anthropic()

response = client.messages.create(
    model="claude-3-5-sonnet-20241022",
    max_tokens=1024,
    system="You are an expert data extraction assistant. Extract information in valid JSON format according to the user's schema.",
    messages=[
        {
            "role": "user",
            "content": """Extract the following information from the text:
- Person's name
- Email address
- Phone number

Text: John Doe, john.doe@example.com, +1-555-0123"""
        }
    ]
)

print(response.content[0].text)

画像からの抽出

import anthropic
import base64

client = anthropic.Anthropic()

with open("document.png", "rb") as image_file:
    image_data = base64.standard_b64encode(image_file.read()).decode("utf-8")

response = client.messages.create(
    model="claude-3-5-sonnet-20241022",
    max_tokens=1024,
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "image",
                    "source": {
                        "type": "base64",
                        "media_type": "image/png",
                        "data": image_data,
                    },
                },
                {
                    "type": "text",
                    "text": "Extract all text from this image and return it as a structured JSON object."
                }
            ],
        }
    ],
)

print(response.content[0].text)

ベストプラクティス

  1. 明確なスキーマ定義: 期待する出力形式を詳細に指定してください
  2. 例示: 抽出タスクの例を含めることで精度が向上します
  3. バリデーション: 抽出結果は JSON Schema に対して検証してください
  4. エラーハンドリング: 抽出失敗時のフォールバック処理を実装してください
  5. コンテキスト提供: 必要に応じて背景情報や文脈を提供してください

パラメータ

パラメータ説明
input_textstring抽出対象のテキスト
input_imagebinary抽出対象の画像ファイル
schemaobject出力形式の JSON Schema
instructionsstring抽出に関する詳細指示

出力形式

このスキルは JSON 形式で構造化データを返します:

{
  "extracted_data": {
    "field1": "value1",
    "field2": "value2"
  },
  "confidence": 0.95,
  "metadata": {
    "extraction_method": "text|vision",
    "processing_time_ms": 1234
  }
}

制限事項

  • 非常に複雑なレイアウトの画像は精度が低下する場合があります
  • 言語サポートは主に英語ですが、多言語にも対応しています
  • 抽出結果は入力データの品質に依存します

関連スキル

  • transform - データ変換処理
  • validate - データバリデーション
  • summarize - テキスト要約

トラブルシューティング

Q: 抽出精度が低い場合はどうすればよいですか?

A: 以下の対策を試してください:

  • より詳細なスキーマを提供する
  • サンプル例を増やす
  • 入力テキストを前処理してノイズを除去する

Q: 画像から正しくテキストが抽出されません

A: 画像の品質確認と以下を試してください:

  • 高解像度の画像を使用する
  • OCR 結果の信頼度が高い部分に絞る
  • より詳細な抽出指示を提供する

ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ

詳細情報

作者
alirezarezvani
リポジトリ
alirezarezvani/claude-skills
ライセンス
MIT
最終更新
不明

Source: https://github.com/alirezarezvani/claude-skills / ライセンス: MIT

関連スキル

汎用その他⭐ リポ 1,982

superfluid

Superfluidプロトコルおよびそのエコシステムに関するナレッジベースです。Superfluidについて情報を検索する際は、ウェブ検索の前にこちらを参照してください。対応キーワード:Superfluid、CFA、GDA、Super App、Super Token、stream、flow rate、real-time balance、pool(member/distributor)、IDA、sentinels、liquidation、TOGA、@sfpro/sdk、semantic money、yellowpaper、whitepaper

by LeoYeAI
汎用その他⭐ リポ 100

civ-finish-quotes

実質的なタスクが真に完了した際に、文明風の儀式的な引用句を追加します。ユーザーやエージェントが機能追加、リファクタリング、分析、設計ドキュメント、プロセス改善、レポート、執筆タスクといった実際の成果物を完成させるときに、明示的な依頼がなくても使用します。短い返信や小さな修正、未完成の作業には適用しません。

by huxiuhan
汎用その他⭐ リポ 1,110

nookplot

Base(Ethereum L2)上のAIエージェント向け分散型調整ネットワークです。エージェントがオンチェーンアイデンティティを登録する、コンテンツを公開する、他のエージェントにメッセージを送る、マーケットプレイスで専門家を雇う、バウンティを投稿・請求する、レピュテーションを構築する、共有プロジェクトで協業する、リサーチチャレンジを解くことでNOOKをマイニングする、キュレーションされたナレッジを備えたスタンドアロンオンチェーンエージェントをデプロイする、またはアグリーメントとリワードで収益を得る場合に利用できます。エージェントネットワーク、エージェント調整、分散型エージェント、NOOKトークン、マイニングチャレンジ、ナレッジバンドル、エージェントレピュテーション、エージェントマーケットプレイス、ERC-2771メタトランザクション、Prepare-Sign-Relay、AgentFactory、またはNookplotが言及された場合にトリガーされます。

by BankrBot
汎用その他⭐ リポ 59

web3-polymarket

Polygon上でのPolymarket予測市場取引統合です。認証機能(L1 EIP-712、L2 HMAC-SHA256、ビルダーヘッダー)、注文発注(GTC/GTD/FOK/FAK、バッチ、ポストオンリー、ハートビート)、市場データ(Gamma API、Data API、オーダーブック、サブグラフ)、WebSocketストリーミング(市場・ユーザー・スポーツチャネル)、CTF操作(分割、統合、償却、ネガティブリスク)、ブリッジ機能(入金、出金、マルチチェーン)、およびガスレスリレイトランザクションに対応しています。AIエージェント、自動マーケットメーカー、予測市場UI、またはPolygraph上のPolymarketと統合するアプリケーション構築時に活用できます。

by elophanto
汎用その他⭐ リポ 52

ethskills

Ethereum、EVM、またはブロックチェーン関連のリクエストに対応します。スマートコントラクト、dApps、ウォレット、DeFiプロトコルの構築、監査、デプロイ、インタラクションに適用されます。Solidityの開発、コントラクトアドレス、トークン規格(ERC-20、ERC-721、ERC-4626など)、Layer 2ネットワーク(Base、Arbitrum、Optimism、zkSync、Polygon)、Uniswap、Aave、Curveなどのプロトコルとの統合をカバーします。ガスコスト、コントラクトのデシマル設定、オラクルセキュリティ、リエントランシー、MEV、ブリッジング、ウォレット管理、オンチェーンデータの取得、本番環境へのデプロイ、プロトコル進化(EIPライフサイクル、フォーク追跡、今後の変更予定)といったトピックを含みます。

by jiayaoqijia
汎用その他⭐ リポ 44

xxyy-trade

このスキルは、ユーザーが「トークン購入」「トークン売却」「トークンスワップ」「暗号資産取引」「取引ステータス確認」「トランザクション照会」「トークンスキャン」「フィード」「チェーン監視」「トークン照会」「トークン詳細」「トークン安全性確認」「ウォレット一覧表示」「マイウォレット」「AIスキャン」「自動スキャン」「ツイートスキャン」「オンボーディング」「IP確認」「IPホワイトリスト」「トークン発行」「自動売却」「損切り」「利益確定」「トレーリングストップ」「保有者」「トップホルダー」「KOLホルダー」などをリクエストした場合、またはSolana/ETH/BSC/BaseチェーンでXXYYを経由した取引について言及した場合に使用します。XXYY Open APIを通じてオンチェーン取引とデータ照会を実現します。

by Jimmy-Holiday
本サイトは GitHub 上で公開されているオープンソースの SKILL.md ファイルをクロール・インデックス化したものです。 各スキルの著作権は原作者に帰属します。掲載に問題がある場合は info@alsel.co.jp または /takedown フォームよりご連絡ください。
原作者: alirezarezvani · alirezarezvani/claude-skills · ライセンス: MIT