Anthropic Claude音声・動画・メディア⭐ リポ 1品質スコア 53/100

processing-computer-vision-tasks

Name: processing-computer-vision-tasks
Author: Brmbobo

物体検出、分類、セグメンテーションを用いた画像処理が可能です。「画像を分析する」「物体検出」「画像分類」「コンピュータビジョン」といったリクエストが必要な場合にご利用ください。スキルの目的に応じた関連フレーズでトリガーされます。

description の原文を見る

Process images using object detection, classification, and segmentation. Use when requesting "analyze image", "object detection", "image classification", or "computer vision". Trigger with relevant phrases based on skill purpose.

SKILL.md 本文

コンピュータビジョンプロセッサ

このスキルはコンピュータビジョンプロセッサタスクの自動支援を提供します。

概要

このスキルはコンピュータビジョンプロセッサタスクの自動支援を提供します。このスキルにより、Claudeはコンピュータビジョンプロセッサプラグインを活用して画像を分析し、オブジェクトを検出し、意味のある情報を抽出できます。コンピュータビジョンワークフローを自動化し、パフォーマンスを最適化し、画像コンテンツに基づいた詳細なインサイトを提供します。

仕組み

リクエストの分析: Claudeはユーザーのリクエストとトリガー用語に基づいて、コンピュータビジョン処理の必要性を識別します。
コード生成: Claudeはコンピュータビジョンプロセッサプラグインと連携するための適切なPythonコードを生成し、目的の分析タイプ(例:オブジェクト検出、画像分類)を指定します。
タスク実行: 生成されたコードは/process-visionコマンドを使用して実行され、画像を処理して結果を返します。

このスキルを使用する場合

以下のことが必要な場合にこのスキルが起動します:

特定のオブジェクトまたは機能について画像を分析する。
画像を事前に定義されたカテゴリに分類する。
異なる領域またはオブジェクトを識別するために画像をセグメント化する。

例

例1: オブジェクト検出

ユーザーリクエスト:「この画像を分析して、すべての車と歩行者を識別してください。」

スキルは以下を実行します:

コンピュータビジョンプロセッサプラグインを使用して提供された画像に対してオブジェクト検出を実行するコードを生成します。
検出された各車と歩行者に対するバウンディングボックスとラベルのリストを返します。

例2: 画像分類

ユーザーリクエスト:「この画像を分類してください。猫ですか、それとも犬ですか?」

スキルは以下を実行します:

コンピュータビジョンプロセッサプラグインを使用して提供された画像に対して画像分類を実行するコードを生成します。
信頼度スコアとともに分類結果(例:「猫」または「犬」)を返します。

ベストプラクティス

データ検証: 入力画像が対応形式および解像度であることを確認するため、常に検証します。
エラーハンドリング: 画像処理中の潜在的な問題に対応するための堅牢なエラーハンドリングを実装します。
パフォーマンス最適化: 特定のタスクのパフォーマンスを最適化するために、適切なコンピュータビジョン技術とパラメータを選択します。

統合

このスキルはコンピュータビジョンプロセッサプラグインが提供する/process-visionコマンドを利用します。レポート生成や検出されたオブジェクトに基づくアクション実行など、コンピュータビジョン分析の結果をさらに処理するために、他のスキルと統合できます。

前提条件

適切なファイルアクセス権限
必要な依存関係のインストール

手順

トリガー条件が満たされた場合にこのスキルを呼び出します
必要なコンテキストとパラメータを提供します
生成された出力を確認します
必要に応じて修正を適用します

出力

このスキルはタスクに関連する構造化された出力を生成します。

エラーハンドリング

無効な入力: 修正の入力を促します
不足している依存関係: 必要なコンポーネントをリストアップします
パーミッションエラー: 改善ステップを提案します

リソース

プロジェクトドキュメント
関連スキルとコマンド

ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ

詳細情報

作者: Brmbobo
リポジトリ: Brmbobo/Web2podcast
ライセンス: MIT
最終更新: 2026/1/26

GitHubで原本を見る →フィードバックを送る

Source: https://github.com/Brmbobo/Web2podcast / ライセンス: MIT

processing-computer-vision-tasks

SKILL.md 本文

コンピュータビジョンプロセッサ

概要

仕組み

このスキルを使用する場合

例

例1: オブジェクト検出

例2: 画像分類

ベストプラクティス

統合

前提条件

手順

出力

エラーハンドリング

リソース

詳細情報

関連スキル

listenhub

best-youtube-video-editor

video

clipify

speech

depth-estimation