extract
抽出という意味で、液体や物質から特定の成分を取り出したり、テキストや情報から必要な部分を引き出したりすることです。また、濃縮液や濃縮エキスを指す場合もあります。
description の原文を見る
extract
SKILL.md 本文
Extract
Extract structured data from unstructured text using Claude's vision and text processing capabilities.
概要
このスキルは、非構造化テキストまたは画像から構造化されたデータを抽出する機能を提供します。Claude の自然言語処理と視覚処理能力を活用して、以下のようなタスクに対応します:
- テキストドキュメントから主要情報を抽出
- 画像内のテキストや情報を認識・抽出
- 複雑なドキュメントレイアウトから構造化データを取得
- メタデータやエンティティの自動識別
主な機能
テキスト抽出
非構造化テキストから必要な情報を抽出します。JSON や CSV などの構造化形式で出力可能です。
ビジョン処理
画像ファイルを入力として受け取り、視覚的コンテンツからテキストやデータを抽出します。
スキーマ定義
出力形式を JSON Schema として定義し、期待される構造化データの形式を指定できます。
使用例
テキストからの抽出
from anthropic import Anthropic
client = Anthropic()
response = client.messages.create(
model="claude-3-5-sonnet-20241022",
max_tokens=1024,
system="You are an expert data extraction assistant. Extract information in valid JSON format according to the user's schema.",
messages=[
{
"role": "user",
"content": """Extract the following information from the text:
- Person's name
- Email address
- Phone number
Text: John Doe, john.doe@example.com, +1-555-0123"""
}
]
)
print(response.content[0].text)
画像からの抽出
import anthropic
import base64
client = anthropic.Anthropic()
with open("document.png", "rb") as image_file:
image_data = base64.standard_b64encode(image_file.read()).decode("utf-8")
response = client.messages.create(
model="claude-3-5-sonnet-20241022",
max_tokens=1024,
messages=[
{
"role": "user",
"content": [
{
"type": "image",
"source": {
"type": "base64",
"media_type": "image/png",
"data": image_data,
},
},
{
"type": "text",
"text": "Extract all text from this image and return it as a structured JSON object."
}
],
}
],
)
print(response.content[0].text)
ベストプラクティス
- 明確なスキーマ定義: 期待する出力形式を詳細に指定してください
- 例示: 抽出タスクの例を含めることで精度が向上します
- バリデーション: 抽出結果は JSON Schema に対して検証してください
- エラーハンドリング: 抽出失敗時のフォールバック処理を実装してください
- コンテキスト提供: 必要に応じて背景情報や文脈を提供してください
パラメータ
| パラメータ | 型 | 説明 |
|---|---|---|
input_text | string | 抽出対象のテキスト |
input_image | binary | 抽出対象の画像ファイル |
schema | object | 出力形式の JSON Schema |
instructions | string | 抽出に関する詳細指示 |
出力形式
このスキルは JSON 形式で構造化データを返します:
{
"extracted_data": {
"field1": "value1",
"field2": "value2"
},
"confidence": 0.95,
"metadata": {
"extraction_method": "text|vision",
"processing_time_ms": 1234
}
}
制限事項
- 非常に複雑なレイアウトの画像は精度が低下する場合があります
- 言語サポートは主に英語ですが、多言語にも対応しています
- 抽出結果は入力データの品質に依存します
関連スキル
transform- データ変換処理validate- データバリデーションsummarize- テキスト要約
トラブルシューティング
Q: 抽出精度が低い場合はどうすればよいですか?
A: 以下の対策を試してください:
- より詳細なスキーマを提供する
- サンプル例を増やす
- 入力テキストを前処理してノイズを除去する
Q: 画像から正しくテキストが抽出されません
A: 画像の品質確認と以下を試してください:
- 高解像度の画像を使用する
- OCR 結果の信頼度が高い部分に絞る
- より詳細な抽出指示を提供する
ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ
詳細情報
- 作者
- alirezarezvani
- ライセンス
- MIT
- 最終更新
- 不明
Source: https://github.com/alirezarezvani/claude-skills / ライセンス: MIT
関連スキル
superfluid
Superfluidプロトコルおよびそのエコシステムに関するナレッジベースです。Superfluidについて情報を検索する際は、ウェブ検索の前にこちらを参照してください。対応キーワード:Superfluid、CFA、GDA、Super App、Super Token、stream、flow rate、real-time balance、pool(member/distributor)、IDA、sentinels、liquidation、TOGA、@sfpro/sdk、semantic money、yellowpaper、whitepaper
civ-finish-quotes
実質的なタスクが真に完了した際に、文明風の儀式的な引用句を追加します。ユーザーやエージェントが機能追加、リファクタリング、分析、設計ドキュメント、プロセス改善、レポート、執筆タスクといった実際の成果物を完成させるときに、明示的な依頼がなくても使用します。短い返信や小さな修正、未完成の作業には適用しません。
nookplot
Base(Ethereum L2)上のAIエージェント向け分散型調整ネットワークです。エージェントがオンチェーンアイデンティティを登録する、コンテンツを公開する、他のエージェントにメッセージを送る、マーケットプレイスで専門家を雇う、バウンティを投稿・請求する、レピュテーションを構築する、共有プロジェクトで協業する、リサーチチャレンジを解くことでNOOKをマイニングする、キュレーションされたナレッジを備えたスタンドアロンオンチェーンエージェントをデプロイする、またはアグリーメントとリワードで収益を得る場合に利用できます。エージェントネットワーク、エージェント調整、分散型エージェント、NOOKトークン、マイニングチャレンジ、ナレッジバンドル、エージェントレピュテーション、エージェントマーケットプレイス、ERC-2771メタトランザクション、Prepare-Sign-Relay、AgentFactory、またはNookplotが言及された場合にトリガーされます。
web3-polymarket
Polygon上でのPolymarket予測市場取引統合です。認証機能(L1 EIP-712、L2 HMAC-SHA256、ビルダーヘッダー)、注文発注(GTC/GTD/FOK/FAK、バッチ、ポストオンリー、ハートビート)、市場データ(Gamma API、Data API、オーダーブック、サブグラフ)、WebSocketストリーミング(市場・ユーザー・スポーツチャネル)、CTF操作(分割、統合、償却、ネガティブリスク)、ブリッジ機能(入金、出金、マルチチェーン)、およびガスレスリレイトランザクションに対応しています。AIエージェント、自動マーケットメーカー、予測市場UI、またはPolygraph上のPolymarketと統合するアプリケーション構築時に活用できます。
ethskills
Ethereum、EVM、またはブロックチェーン関連のリクエストに対応します。スマートコントラクト、dApps、ウォレット、DeFiプロトコルの構築、監査、デプロイ、インタラクションに適用されます。Solidityの開発、コントラクトアドレス、トークン規格(ERC-20、ERC-721、ERC-4626など)、Layer 2ネットワーク(Base、Arbitrum、Optimism、zkSync、Polygon)、Uniswap、Aave、Curveなどのプロトコルとの統合をカバーします。ガスコスト、コントラクトのデシマル設定、オラクルセキュリティ、リエントランシー、MEV、ブリッジング、ウォレット管理、オンチェーンデータの取得、本番環境へのデプロイ、プロトコル進化(EIPライフサイクル、フォーク追跡、今後の変更予定)といったトピックを含みます。
xxyy-trade
このスキルは、ユーザーが「トークン購入」「トークン売却」「トークンスワップ」「暗号資産取引」「取引ステータス確認」「トランザクション照会」「トークンスキャン」「フィード」「チェーン監視」「トークン照会」「トークン詳細」「トークン安全性確認」「ウォレット一覧表示」「マイウォレット」「AIスキャン」「自動スキャン」「ツイートスキャン」「オンボーディング」「IP確認」「IPホワイトリスト」「トークン発行」「自動売却」「損切り」「利益確定」「トレーリングストップ」「保有者」「トップホルダー」「KOLホルダー」などをリクエストした場合、またはSolana/ETH/BSC/BaseチェーンでXXYYを経由した取引について言及した場合に使用します。XXYY Open APIを通じてオンチェーン取引とデータ照会を実現します。