Anthropic Claudeその他⭐ リポ 0品質スコア 50/100

axiom-vision

Name: axiom-vision
Author: charleswiltgen

画像分析・姿勢検出・人物セグメンテーション・被写体の切り抜き・テキスト認識・バーコードスキャンなど、あらゆるコンピュータービジョン機能を実装する際に使用します。視覚的な認識・解析が絡むタスクすべてがトリガー条件となります。

description の原文を見る

Use when implementing ANY computer vision feature — image analysis, pose detection, person segmentation, subject lifting, text recognition, barcode scanning.

SKILL.md 本文

コンピュータビジョン

Vision フレームワークを使用するコンピュータビジョン作業には、このスキルを必ず使用してください。

クイックリファレンス

症状・タスク	参照先
被写体のセグメンテーション、リフティング	`skills/vision-framework.md` を参照
手・体のポーズ検出	`skills/vision-framework.md` を参照
テキスト認識（OCR）	`skills/vision-framework.md` を参照
バーコード・QRコード検出	`skills/vision-framework.md` を参照
ドキュメントスキャン	`skills/vision-framework.md` を参照
DataScannerViewController	`skills/vision-framework.md` を参照
構造化ドキュメント抽出（iOS 26+）	`skills/vision-framework.md` を参照
手を除いたオブジェクトの分離	`skills/vision-framework.md` を参照
Vision フレームワーク API リファレンス	`skills/vision-ref.md` を参照
Visual Intelligence 統合（iOS 26+）	`skills/vision-ref.md` を参照
被写体が検出されない	`skills/vision-diag.md` を参照
手・体のポーズランドマークが見つからない	`skills/vision-diag.md` を参照
信頼度スコアが低い	`skills/vision-diag.md` を参照
処理中にUIがフリーズする	`skills/vision-diag.md` を参照
座標変換のバグ	`skills/vision-diag.md` を参照
テキストが認識されない・文字が間違っている	`skills/vision-diag.md` を参照
バーコードが検出されない	`skills/vision-diag.md` を参照
DataScanner が空白・アイテムがない	`skills/vision-diag.md` を参照
ドキュメント端が検出されない	`skills/vision-diag.md` を参照

デシジョンツリー

digraph vision {
    start [label="Computer vision task" shape=ellipse];
    what [label="What do you need?" shape=diamond];

    start -> what;
    what -> "skills/vision-framework.md" [label="implement feature"];
    what -> "skills/vision-ref.md" [label="API reference"];
    what -> "skills/vision-ref.md" [label="Visual Intelligence"];
    what -> "skills/vision-diag.md" [label="something broken"];
}

ポーズ検出、セグメンテーション、OCR、バーコード、ドキュメント、ライブスキャンを実装する？ → skills/vision-framework.md
Visual Intelligence システム統合（カメラ機能、iOS 26+）？ → skills/vision-ref.md（Visual Intelligence セクション）
API リファレンス・コード例が必要？ → skills/vision-ref.md
問題のデバッグ（検出失敗、信頼度、座標）？ → skills/vision-diag.md

重要なパターン

実装（skills/vision-framework.md）:

適切な Vision API を選択するためのデシジョンツリー
VisionKit を使用した被写体セグメンテーション
手を除きながらオブジェクトを分離する（複数の API を組み合わせる）
手・体のポーズ検出（21/18 ランドマーク）
テキスト認識（高速モード vs 高精度モード）
シンボロジー選択を使用したバーコード検出
ドキュメントスキャンと構造化抽出（iOS 26+）
DataScannerViewController を使用したライブスキャン
CoreImage HDR 合成

診断（skills/vision-diag.md）:

被写体検出失敗（フレーム端、照明）
ランドマークトラッキングの問題（信頼度閾値）
パフォーマンス最適化（フレームスキップ、ダウンスケーリング）
座標変換（左下原点 vs 左上原点）
テキスト認識失敗（言語、コントラスト）
バーコード検出の問題（シンボロジー、サイズ、グレア）
DataScanner トラブルシューティング（利用可能性、データタイプ）

反合理化

考え方	現実
「Vision フレームワークはただのリクエスト・ハンドラーパターン」	Vision には座標変換、信頼度閾値、パフォーマンスの落とし穴がある。vision-framework.md でカバーしている。
「スキルなしでテキスト認識を処理する」	VNRecognizeTextRequest は高速/高精度モードと言語固有の設定がある。vision-framework.md にパターンがある。
「被写体セグメンテーションは簡単」	インスタンスマスクには HDR 合成と手除外パターンがある。vision-framework.md は複雑なシナリオをカバーしている。
「Visual Intelligence は単なるカメラ API」	Visual Intelligence はシステムレベルの機能で、IntentValueQuery と SemanticContentDescriptor が必要。vision-ref.md に統合セクションがある。
「メインスレッドで処理するだけ」	Vision は古いデバイスで UI をブロックする。iPhone 12 のユーザーはアプリがフリーズします。バックグラウンドキューの追加に 15 分。

使用例

ユーザー: 「画像内の手のポーズを検出するには？」 → skills/vision-framework.md を参照

ユーザー: 「被写体を分離するが、ユーザーの手は除外する」 → skills/vision-framework.md を参照

ユーザー: 「画像からテキストを読むには？」 → skills/vision-framework.md を参照

ユーザー: 「カメラで QR コードをスキャンする」 → skills/vision-framework.md を参照

ユーザー: 「被写体検出が機能していない」 → skills/vision-diag.md を参照

ユーザー: 「テキスト認識で間違った文字が返される」 → skills/vision-diag.md を参照

ユーザー: 「VNDetectHumanBodyPoseRequest の例を示して」 → skills/vision-ref.md を参照

ユーザー: 「アプリを Visual Intelligence と連携させるには？」 → skills/vision-ref.md を参照

ユーザー: 「RecognizeDocumentsRequest API リファレンス」 → skills/vision-ref.md を参照

ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ

詳細情報

作者: charleswiltgen
リポジトリ: charleswiltgen/axiom
ライセンス: MIT
最終更新: 不明

GitHubで原本を見る →フィードバックを送る

Source: https://github.com/charleswiltgen/axiom / ライセンス: MIT

axiom-vision

SKILL.md 本文

コンピュータビジョン

クイックリファレンス

デシジョンツリー

重要なパターン

反合理化

使用例

詳細情報

関連スキル

superfluid

civ-finish-quotes

nookplot

web3-polymarket

ethskills

xxyy-trade