senior-computer-vision
画像・動画処理、物体検出、セグメンテーション、視覚AIシステムの構築に対応するワールドクラスのコンピュータビジョンスキル。PyTorch、OpenCV、YOLO、SAM、拡散モデル、Vision Transformerに精通し、3Dビジョン・動画解析・リアルタイム処理・本番環境へのデプロイまでカバー。視覚AIシステムの開発、物体検出の実装、カスタムビジョンモデルの学習、推論パイプラインの最適化を行う際に活用してください。
description の原文を見る
World-class computer vision skill for image/video processing, object detection, segmentation, and visual AI systems. Expertise in PyTorch, OpenCV, YOLO, SAM, diffusion models, and vision transformers. Includes 3D vision, video analysis, real-time processing, and production deployment. Use when building vision AI systems, implementing object detection, training custom vision models, or optimizing inference pipelines.
SKILL.md 本文
シニアコンピュータビジョンエンジニア
本番環境対応の世界水準のコンピュータビジョンエンジニアスキル。
クイックスタート
主要な機能
# コアツール 1
python scripts/vision_model_trainer.py --input data/ --output results/
# コアツール 2
python scripts/inference_optimizer.py --target project/ --analyze
# コアツール 3
python scripts/dataset_pipeline_builder.py --config config.yaml --deploy
コア専門知識
このスキルは以下の世界水準の能力をカバーしています:
- 高度な本番環境パターンとアーキテクチャ
- スケーラブルなシステム設計と実装
- 大規模環境でのパフォーマンス最適化
- MLOps と DataOps のベストプラクティス
- リアルタイム処理と推論
- 分散コンピューティングフレームワーク
- モデルデプロイメントと監視
- セキュリティとコンプライアンス
- コスト最適化
- チームリーダーシップとメンタリング
テックスタック
言語: Python, SQL, R, Scala, Go MLフレームワーク: PyTorch, TensorFlow, Scikit-learn, XGBoost データツール: Spark, Airflow, dbt, Kafka, Databricks LLMフレームワーク: LangChain, LlamaIndex, DSPy デプロイメント: Docker, Kubernetes, AWS/GCP/Azure 監視: MLflow, Weights & Biases, Prometheus データベース: PostgreSQL, BigQuery, Snowflake, Pinecone
リファレンスドキュメント
1. コンピュータビジョンアーキテクチャ
references/computer_vision_architectures.md に利用可能な包括的ガイド:
- 高度なパターンとベストプラクティス
- 本番環境実装戦略
- パフォーマンス最適化技法
- スケーラビリティに関する考慮事項
- セキュリティとコンプライアンス
- 実例に基づいたケーススタディ
2. オブジェクト検出最適化
references/object_detection_optimization.md の完全なワークフロードキュメント:
- ステップバイステップのプロセス
- アーキテクチャ設計パターン
- ツール統合ガイド
- パフォーマンスチューニング戦略
- トラブルシューティング手順
3. 本番環境ビジョンシステム
references/production_vision_systems.md の技術リファレンスガイド:
- システム設計原則
- 実装例
- 設定ベストプラクティス
- デプロイメント戦略
- 監視と可観測性
本番環境パターン
パターン1: スケーラブルなデータ処理
分散コンピューティングを用いたエンタープライズスケールのデータ処理:
- 水平スケーリングアーキテクチャ
- フォールトトレランス設計
- リアルタイムおよびバッチ処理
- データ品質検証
- パフォーマンス監視
パターン2: MLモデルデプロイメント
高可用性の本番MLシステム:
- 低レイテンシーなモデルサービング
- A/Bテストインフラストラクチャ
- フィーチャーストア統合
- モデル監視とドリフト検出
- 自動再学習パイプライン
パターン3: リアルタイム推論
高スループット推論システム:
- バッチング・キャッシング戦略
- ロードバランシング
- オートスケーリング
- レイテンシー最適化
- コスト最適化
ベストプラクティス
開発
- テスト駆動開発
- コードレビューとペアプログラミング
- ドキュメント・アズ・コード
- すべてをバージョン管理
- 継続的インテグレーション
本番環境
- 重要なすべてを監視
- デプロイメント自動化
- リリースのフィーチャーフラグ
- カナリアデプロイメント
- 包括的なログ記録
チームリーダーシップ
- ジュニアエンジニアのメンタリング
- 技術的意思決定の推進
- コーディング標準の確立
- 学習文化の育成
- クロスファンクショナルなコラボレーション
パフォーマンスターゲット
レイテンシー:
- P50: < 50ms
- P95: < 100ms
- P99: < 200ms
スループット:
- リクエスト/秒: > 1000
- 同時ユーザー数: > 10,000
可用性:
- アップタイム: 99.9%
- エラー率: < 0.1%
セキュリティ & コンプライアンス
- 認証と認可
- データ暗号化(保存時・転送中)
- PII処理と匿名化
- GDPR/CCPA対応
- 定期的なセキュリティ監査
- 脆弱性管理
一般的なコマンド
# 開発
python -m pytest tests/ -v --cov
python -m black src/
python -m pylint src/
# 学習
python scripts/train.py --config prod.yaml
python scripts/evaluate.py --model best.pth
# デプロイメント
docker build -t service:v1 .
kubectl apply -f k8s/
helm upgrade service ./charts/
# 監視
kubectl logs -f deployment/service
python scripts/health_check.py
リソース
- 高度なパターン:
references/computer_vision_architectures.md - 実装ガイド:
references/object_detection_optimization.md - 技術リファレンス:
references/production_vision_systems.md - 自動化スクリプト:
scripts/ディレクトリ
シニアレベルの責務
世界水準のシニアプロフェッショナルとして:
-
技術リーダーシップ
- アーキテクチャ判断を推進
- チームメンバーをメンタリング
- ベストプラクティスを確立
- コード品質を確保
-
戦略的思考
- ビジネス目標と連携
- トレードオフを評価
- スケール化を計画
- 技術負債を管理
-
コラボレーション
- チーム横断で協働
- 効果的にコミュニケーション
- コンセンサスを構築
- 知識を共有
-
イノベーション
- 研究動向を最新に保つ
- 新しいアプローチを試験
- コミュニティに貢献
- 継続的改善を推進
-
本番環境での卓越性
- 高可用性を確保
- プロアクティブに監視
- パフォーマンスを最適化
- インシデント対応
ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ
詳細情報
- 作者
- davila7
- ライセンス
- MIT
- 最終更新
- 不明
Source: https://github.com/davila7/claude-code-templates / ライセンス: MIT
関連スキル
agent-browser
AI エージェント向けのブラウザ自動化 CLI です。ウェブサイトとの対話が必要な場合に使用します。ページ遷移、フォーム入力、ボタンクリック、スクリーンショット取得、データ抽出、ウェブアプリのテスト、ブラウザ操作の自動化など、あらゆるブラウザタスクに対応できます。「ウェブサイトを開く」「フォームに記入する」「ボタンをクリックする」「スクリーンショットを取得する」「ページからデータを抽出する」「このウェブアプリをテストする」「サイトにログインする」「ブラウザ操作を自動化する」といった要求や、プログラマティックなウェブ操作が必要なタスクで起動します。
anyskill
AnySkill — あなたのプライベート・スキルクラウド。GitHubを基盤としたリポジトリからエージェントスキルを管理、同期、動的にロードできます。自然言語でクラウドスキルを検索し、オンデマンドでプロンプトを自動ロード、カスタムスキルのアップロードと共有、スキルバンドルの一括インストールが可能です。OpenClaw、Antigravity、Claude Code、Cursorに対応しています。
engram
AIエージェント向けの永続的なメモリシステムです。バグ修正、意思決定、発見、設定変更の後はmem_saveを使用してください。ユーザーが「覚えている」「記憶している」と言及した場合、または以前のセッションと重複する作業を開始する際はmem_searchを使用します。セッション終了前にmem_session_summaryを使用して、コンテキストを保持してください。
skyvern
AI駆動のブラウザ自動化により、任意のウェブサイトを自動化できます。フォーム入力、データ抽出、ファイルダウンロード、ログイン、複数ステップのワークフロー実行など、ユーザーがウェブサイトと連携する必要があるときに使用します。Skyvernは、LLMとコンピュータビジョンを活用して、未知のサイトも自動操作可能です。Python SDK、TypeScript SDK、REST API、MCPサーバー、またはCLIを通じて統合できます。
pinchbench
PinchBenchベンチマークを実行して、OpenClawエージェントの実世界タスクにおけるパフォーマンスを評価できます。モデルの機能テスト、モデル間の比較、ベンチマーク結果のリーダーボード提出、またはOpenClawのセットアップがカレンダー、メール、リサーチ、コーディング、複数ステップのワークフローにどの程度対応しているかを確認する際に使用します。
openui
OpenUIとOpenUI Langを使用してジェネレーティブUIアプリを構築できます。これらはLLM生成インターフェースのためのトークン効率的なオープン標準です。OpenUI、@openuidev、ジェネレーティブUI、LLMからのストリーミングUI、AI向けコンポーネントライブラリ、またはjson-render/A2UIの置き換えについて述べる際に使用します。スキャフォルディング、defineComponent、システムプロンプト、Renderer、およびOpenUI Lang出力のデバッグに対応しています。