Anthropic Claudeデザイン・クリエイティブ⭐ リポ 0品質スコア 50/100

machine-learning-ops-ml-pipeline

Name: machine-learning-ops-ml-pipeline
Author: sickn33

データ準備からモデルの学習・評価・デプロイまで、指定された要件（$ARGUMENTS）に基づく完全なMLパイプラインを設計・実装します。データの前処理、特徴量エンジニアリング、モデル選定、運用監視といった一連のワークフローを包括的にカバーします。

description の原文を見る

Design and implement a complete ML pipeline for: $ARGUMENTS

SKILL.md 本文

Machine Learning Pipeline - マルチエージェント MLOps オーケストレーション

以下の項目に対する完全な ML パイプラインの設計と実装: $ARGUMENTS

このスキルを使用する場合

機械学習パイプライン - マルチエージェント MLOps オーケストレーションのタスクまたはワークフローに取り組む場合
機械学習パイプライン - マルチエージェント MLOps オーケストレーションに関するガイダンス、ベストプラクティス、またはチェックリストが必要な場合

このスキルを使用しない場合

タスクが機械学習パイプライン - マルチエージェント MLOps オーケストレーションとは無関係の場合
このスコープ外の異なるドメインやツールが必要な場合

指示

目標、制約、および必要な入力を明確にする。
関連するベストプラクティスを適用し、成果を検証する。
実行可能なステップと検証を提供する。
詳細な例が必要な場合は、resources/implementation-playbook.md を参照する。

考え方

このワークフローは複数の専門エージェントを調整し、最新の MLOps ベストプラクティスに従う本番環境対応の ML パイプラインを構築します。このアプローチは以下を強調しています:

フェーズベースの調整: 各フェーズは以前の出力に基づいており、エージェント間に明確なハンドオフがある
最新ツールの統合: 実験用の MLflow/W&B、フィーチャー用の Feast/Tecton、サービング用の KServe/Seldon
本番環境優先の考え方: 規模、モニタリング、信頼性を考慮して設計されたすべてのコンポーネント
再現性: データ、モデル、インフラストラクチャのバージョン管理
継続的な改善: 自動再学習、A/B テスト、ドリフト検出

マルチエージェント方式により、各側面をドメイン専門家が処理することが可能になります:

データエンジニアが取得と品質を処理
データサイエンティストがフィーチャーと実験を設計
ML エンジニアが学習パイプラインを実装
MLOps エンジニアが本番環境へのデプロイを処理
可観測性エンジニアがモニタリングを確保

フェーズ 1: データと要件分析

<Task> subagent_type: data-engineer prompt: | 以下の要件を持つ ML システム用のデータパイプラインを分析・設計: $ARGUMENTS

成果物:

データソース監査と取得戦略:
- ソースシステムと接続パターン
- Pydantic/Great Expectations を使用したスキーマ検証
- DVC または lakeFS を使用したデータバージョニング
- インクリメンタルロードと CDC 戦略
データ品質フレームワーク:
- プロファイリングと統計生成
- 異常検知ルール
- データ系統追跡
- 品質ゲートと SLA
ストレージアーキテクチャ:
- ロー/処理済み/フィーチャーレイヤー
- パーティショニング戦略
- 保持ポリシー
- コスト最適化

重要なコンポーネント実装コードと統合パターンを提供します。 </Task>

<Task> subagent_type: data-scientist prompt: | 以下に対するフィーチャーエンジニアリングとモデル要件を設計: $ARGUMENTS 以下のデータアーキテクチャを使用: {phase1.data-engineer.output}

成果物:

フィーチャーエンジニアリングパイプライン:
- 変換仕様
- フィーチャーストアスキーマ (Feast/Tecton)
- 統計検証ルール
- 欠損データ/外れ値の処理戦略
モデル要件:
- アルゴリズム選択の根拠
- パフォーマンスメトリクスとベースライン
- 学習データ要件
- 評価基準と閾値
実験設計:
- 仮説と成功メトリクス
- A/B テスト手法
- サンプルサイズ計算
- バイアス検出アプローチ

フィーチャー変換コードと統計検証ロジックを含めます。 </Task>

フェーズ 2: モデル開発と学習

<Task> subagent_type: ml-engineer prompt: | 以下の要件に基づいて学習パイプラインを実装: {phase1.data-scientist.output} 以下のデータパイプラインを使用: {phase1.data-engineer.output}

包括的な学習システムを構築:

学習パイプラインの実装:
- 明確なインターフェースを備えたモジュール化された学習コード
- ハイパーパラメータ最適化 (Optuna/Ray Tune)
- 分散学習サポート (Horovod/PyTorch DDP)
- クロスバリデーションとアンサンブル戦略
実験追跡のセットアップ:
- MLflow/Weights & Biases 統合
- メトリクスログと可視化
- アーティファクト管理 (モデル、プロット、データサンプル)
- 実験比較と分析ツール
モデルレジストリ統合:
- バージョン管理とタグ付け戦略
- モデルメタデータと系統
- プロモーションワークフロー (dev → staging → prod)
- ロールバック手順

設定管理を備えた完全な学習コードを提供します。 </Task>

<Task> subagent_type: python-pro prompt: | 以下の ML コードを最適化・本番化: {phase2.ml-engineer.output}

重点分野:

コード品質と構造:
- 本番環境基準にリファクタリング
- 包括的なエラーハンドリングを追加
- 構造化形式による適切なログを実装
- 再利用可能なコンポーネントとユーティリティを作成
パフォーマンス最適化:
- ボトルネックのプロファイリングと最適化
- キャッシング戦略の実装
- データ読み込みと前処理の最適化
- 大規模学習のメモリ管理
テストフレームワーク:
- データ変換のユニットテスト
- パイプラインコンポーネントの統合テスト
- モデル品質テスト (不変性、方向性)
- パフォーマンス回帰テスト

本番環境対応で保守性に優れた完全なテストカバレッジを備えたコードを提供します。 </Task>

フェーズ 3: 本番環境へのデプロイとサービング

<Task> subagent_type: mlops-engineer prompt: | 以下のモデルの本番環境へのデプロイを設計: {phase2.ml-engineer.output} 以下の最適化されたコードを使用: {phase2.python-pro.output}

実装要件:

モデルサービングインフラストラクチャ:
- FastAPI/TorchServe を使用した REST/gRPC API
- バッチ予測パイプライン (Airflow/Kubeflow)
- ストリーム処理 (Kafka/Kinesis 統合)
- モデルサービングプラットフォーム (KServe/Seldon Core)
デプロイ戦略:
- ゼロダウンタイムのためのブルーグリーンデプロイメント
- トラフィック分割を使用したカナリアリリース
- 検証用のシャドウデプロイメント
- A/B テストインフラストラクチャ
CI/CD パイプライン:
- GitHub Actions/GitLab CI ワークフロー
- 自動テストゲート
- デプロイ前のモデル検証
- GitOps デプロイ用の ArgoCD
コードとしてのインフラストラクチャ:
- クラウドリソース用の Terraform モジュール
- Kubernetes デプロイメント用の Helm チャート
- 最適化用の Docker マルチステージビルド
- Vault/Secrets Manager を使用したシークレット管理

完全なデプロイ設定と自動化スクリプトを提供します。 </Task>

<Task> subagent_type: kubernetes-architect prompt: | 以下の ML ワークロード用の Kubernetes インフラストラクチャを設計: {phase3.mlops-engineer.output}

Kubernetes 固有の要件:

ワークロードオーケストレーション:
- Kubeflow を使用した学習ジョブスケジューリング
- GPU リソース割り当てと共有
- スポット/プリエンプティブルインスタンス統合
- 優先度クラスとリソースクォータ
サービングインフラストラクチャ:
- 自動スケーリング用の HPA/VPA
- イベント駆動スケーリング用の KEDA
- トラフィック管理用の Istio サービスメッシュ
- モデルキャッシングとウォームアップ戦略
ストレージとデータアクセス:
- 学習データ用の PVC 戦略
- CSI ドライバーを使用したモデルアーティファクトストレージ
- フィーチャーストア用の分散ストレージ
- 推論最適化用のキャッシュレイヤー

ML プラットフォーム全体用の Kubernetes マニフェストと Helm チャートを提供します。 </Task>

フェーズ 4: モニタリングと継続的改善

<Task> subagent_type: observability-engineer prompt: | 以下にデプロイされた ML システムの包括的なモニタリングを実装: {phase3.mlops-engineer.output} 以下の Kubernetes インフラストラクチャを使用: {phase3.kubernetes-architect.output}

モニタリングフレームワーク:

モデルパフォーマンスモニタリング:
- 予測精度追跡
- レイテンシーとスループットメトリクス
- フィーチャー重要度シフト
- ビジネス KPI との相関
データとモデルドリフト検出:
- 統計的ドリフト検出 (KS テスト、PSI)
- コンセプトドリフトモニタリング
- フィーチャー分布追跡
- 自動ドリフトアラートとレポート
システム可観測性:
- すべてのコンポーネント用の Prometheus メトリクス
- 可視化用の Grafana ダッシュボード
- Jaeger/Zipkin を使用した分散トレーシング
- ELK/Loki を使用したログ集約
アラートと自動化:
- PagerDuty/Opsgenie 統合
- 自動再学習トリガー
- パフォーマンス低下ワークフロー
- インシデント対応ランブック
コスト追跡:
- リソース利用率メトリクス
- モデル/実験別のコスト配分
- 最適化推奨事項
- 予算アラートと制御

モニタリング設定、ダッシュボード、アラートルールを提供します。 </Task>

設定オプション

experiment_tracking: mlflow | wandb | neptune | clearml
feature_store: feast | tecton | databricks | custom
serving_platform: kserve | seldon | torchserve | triton
orchestration: kubeflow | airflow | prefect | dagster
cloud_provider: aws | azure | gcp | multi-cloud
deployment_mode: realtime | batch | streaming | hybrid
monitoring_stack: prometheus | datadog | newrelic | custom

成功基準

データパイプラインの成功:
- 本番環境でのデータ品質問題 < 0.1%
- 自動データ検証が 99.9% の時間で成功
- 完全なデータ系統追跡
- サブ秒単位のフィーチャーサービングレイテンシー
モデルパフォーマンス:
- ベースラインメトリクスを満たすまたは超える
- 再学習前のパフォーマンス低下 < 5%
- 統計的有意性を持つ成功した A/B テスト
- 24 時間以上検出されないモデルドリフトなし
運用上の優秀性:
- モデルサービングの 99.9% のアップタイム
- 推論レイテンシー p99 < 200ms
- 5 分以内の自動ロールバック
- 完全な可観測性とアラート時間 < 1 分
開発速度:
- コミットから本番環境まで < 1 時間
- 並列実験実行
- 再現可能な学習実行
- セルフサービスモデルデプロイ
コスト効率:
- インフラストラクチャウェイスト < 20%
- リソース割り当ての最適化
- ロードに基づいた自動スケーリング
- スポットインスタンス利用率 > 60%

最終成果物

完了時に、オーケストレーションされたパイプラインは以下を提供します:

完全な自動化を備えたエンドツーエンドの ML パイプライン
包括的なドキュメンテーションとランブック
本番環境対応のコードとしてのインフラストラクチャ
完全なモニタリングとアラートシステム
継続的改善用の CI/CD パイプライン
コスト最適化とスケーリング戦略
ディザスタリカバリーとロールバック手順

制限事項

このスキルは、タスクが上記で説明されているスコープと明確に一致する場合にのみ使用してください。
出力を環境固有の検証、テスト、または専門家レビューの代替として扱わないでください。
必要な入力、許可、安全境界、または成功基準が不足している場合は、停止して明確化を求めてください。

ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ

詳細情報

作者: sickn33
リポジトリ: sickn33/antigravity-awesome-skills
ライセンス: MIT
最終更新: 不明

GitHubで原本を見る →フィードバックを送る

Source: https://github.com/sickn33/antigravity-awesome-skills / ライセンス: MIT

machine-learning-ops-ml-pipeline

SKILL.md 本文

Machine Learning Pipeline - マルチエージェント MLOps オーケストレーション

このスキルを使用する場合

このスキルを使用しない場合

指示

考え方

フェーズ 1: データと要件分析

フェーズ 2: モデル開発と学習

フェーズ 3: 本番環境へのデプロイとサービング

フェーズ 4: モニタリングと継続的改善

設定オプション

成功基準

最終成果物

制限事項

詳細情報

関連スキル

nano-banana-2

octocode-slides

gpt-image2-ppt

nano-banana

oiloil-ui-ux-guide

axiom-hig-ref