machine-learning-ops-ml-pipeline
データ準備からモデルの学習・評価・デプロイまで、指定された要件($ARGUMENTS)に基づく完全なMLパイプラインを設計・実装します。データの前処理、特徴量エンジニアリング、モデル選定、運用監視といった一連のワークフローを包括的にカバーします。
description の原文を見る
Design and implement a complete ML pipeline for: $ARGUMENTS
SKILL.md 本文
Machine Learning Pipeline - マルチエージェント MLOps オーケストレーション
以下の項目に対する完全な ML パイプラインの設計と実装: $ARGUMENTS
このスキルを使用する場合
- 機械学習パイプライン - マルチエージェント MLOps オーケストレーションのタスクまたはワークフローに取り組む場合
- 機械学習パイプライン - マルチエージェント MLOps オーケストレーションに関するガイダンス、ベストプラクティス、またはチェックリストが必要な場合
このスキルを使用しない場合
- タスクが機械学習パイプライン - マルチエージェント MLOps オーケストレーションとは無関係の場合
- このスコープ外の異なるドメインやツールが必要な場合
指示
- 目標、制約、および必要な入力を明確にする。
- 関連するベストプラクティスを適用し、成果を検証する。
- 実行可能なステップと検証を提供する。
- 詳細な例が必要な場合は、
resources/implementation-playbook.mdを参照する。
考え方
このワークフローは複数の専門エージェントを調整し、最新の MLOps ベストプラクティスに従う本番環境対応の ML パイプラインを構築します。このアプローチは以下を強調しています:
- フェーズベースの調整: 各フェーズは以前の出力に基づいており、エージェント間に明確なハンドオフがある
- 最新ツールの統合: 実験用の MLflow/W&B、フィーチャー用の Feast/Tecton、サービング用の KServe/Seldon
- 本番環境優先の考え方: 規模、モニタリング、信頼性を考慮して設計されたすべてのコンポーネント
- 再現性: データ、モデル、インフラストラクチャのバージョン管理
- 継続的な改善: 自動再学習、A/B テスト、ドリフト検出
マルチエージェント方式により、各側面をドメイン専門家が処理することが可能になります:
- データエンジニアが取得と品質を処理
- データサイエンティストがフィーチャーと実験を設計
- ML エンジニアが学習パイプラインを実装
- MLOps エンジニアが本番環境へのデプロイを処理
- 可観測性エンジニアがモニタリングを確保
フェーズ 1: データと要件分析
<Task> subagent_type: data-engineer prompt: | 以下の要件を持つ ML システム用のデータパイプラインを分析・設計: $ARGUMENTS成果物:
-
データソース監査と取得戦略:
- ソースシステムと接続パターン
- Pydantic/Great Expectations を使用したスキーマ検証
- DVC または lakeFS を使用したデータバージョニング
- インクリメンタルロードと CDC 戦略
-
データ品質フレームワーク:
- プロファイリングと統計生成
- 異常検知ルール
- データ系統追跡
- 品質ゲートと SLA
-
ストレージアーキテクチャ:
- ロー/処理済み/フィーチャーレイヤー
- パーティショニング戦略
- 保持ポリシー
- コスト最適化
重要なコンポーネント実装コードと統合パターンを提供します。 </Task>
<Task> subagent_type: data-scientist prompt: | 以下に対するフィーチャーエンジニアリングとモデル要件を設計: $ARGUMENTS 以下のデータアーキテクチャを使用: {phase1.data-engineer.output}成果物:
-
フィーチャーエンジニアリングパイプライン:
- 変換仕様
- フィーチャーストアスキーマ (Feast/Tecton)
- 統計検証ルール
- 欠損データ/外れ値の処理戦略
-
モデル要件:
- アルゴリズム選択の根拠
- パフォーマンスメトリクスとベースライン
- 学習データ要件
- 評価基準と閾値
-
実験設計:
- 仮説と成功メトリクス
- A/B テスト手法
- サンプルサイズ計算
- バイアス検出アプローチ
フィーチャー変換コードと統計検証ロジックを含めます。 </Task>
フェーズ 2: モデル開発と学習
<Task> subagent_type: ml-engineer prompt: | 以下の要件に基づいて学習パイプラインを実装: {phase1.data-scientist.output} 以下のデータパイプラインを使用: {phase1.data-engineer.output}包括的な学習システムを構築:
-
学習パイプラインの実装:
- 明確なインターフェースを備えたモジュール化された学習コード
- ハイパーパラメータ最適化 (Optuna/Ray Tune)
- 分散学習サポート (Horovod/PyTorch DDP)
- クロスバリデーション と アンサンブル戦略
-
実験追跡のセットアップ:
- MLflow/Weights & Biases 統合
- メトリクスログと可視化
- アーティファクト管理 (モデル、プロット、データサンプル)
- 実験比較と分析ツール
-
モデルレジストリ統合:
- バージョン管理とタグ付け戦略
- モデルメタデータと系統
- プロモーションワークフロー (dev → staging → prod)
- ロールバック手順
設定管理を備えた完全な学習コードを提供します。 </Task>
<Task> subagent_type: python-pro prompt: | 以下の ML コードを最適化・本番化: {phase2.ml-engineer.output}重点分野:
-
コード品質と構造:
- 本番環境基準にリファクタリング
- 包括的なエラーハンドリングを追加
- 構造化形式による適切なログを実装
- 再利用可能なコンポーネントとユーティリティを作成
-
パフォーマンス最適化:
- ボトルネックのプロファイリングと最適化
- キャッシング戦略の実装
- データ読み込みと前処理の最適化
- 大規模学習のメモリ管理
-
テストフレームワーク:
- データ変換のユニットテスト
- パイプラインコンポーネントの統合テスト
- モデル品質テスト (不変性、方向性)
- パフォーマンス回帰テスト
本番環境対応で保守性に優れた完全なテストカバレッジを備えたコードを提供します。 </Task>
フェーズ 3: 本番環境へのデプロイとサービング
<Task> subagent_type: mlops-engineer prompt: | 以下のモデルの本番環境へのデプロイを設計: {phase2.ml-engineer.output} 以下の最適化されたコードを使用: {phase2.python-pro.output}実装要件:
-
モデルサービングインフラストラクチャ:
- FastAPI/TorchServe を使用した REST/gRPC API
- バッチ予測パイプライン (Airflow/Kubeflow)
- ストリーム処理 (Kafka/Kinesis 統合)
- モデルサービングプラットフォーム (KServe/Seldon Core)
-
デプロイ戦略:
- ゼロダウンタイムのためのブルーグリーンデプロイメント
- トラフィック分割を使用したカナリアリリース
- 検証用のシャドウデプロイメント
- A/B テストインフラストラクチャ
-
CI/CD パイプライン:
- GitHub Actions/GitLab CI ワークフロー
- 自動テストゲート
- デプロイ前のモデル検証
- GitOps デプロイ用の ArgoCD
-
コードとしてのインフラストラクチャ:
- クラウドリソース用の Terraform モジュール
- Kubernetes デプロイメント用の Helm チャート
- 最適化用の Docker マルチステージビルド
- Vault/Secrets Manager を使用したシークレット管理
完全なデプロイ設定と自動化スクリプトを提供します。 </Task>
<Task> subagent_type: kubernetes-architect prompt: | 以下の ML ワークロード用の Kubernetes インフラストラクチャを設計: {phase3.mlops-engineer.output}Kubernetes 固有の要件:
-
ワークロードオーケストレーション:
- Kubeflow を使用した学習ジョブスケジューリング
- GPU リソース割り当てと共有
- スポット/プリエンプティブルインスタンス統合
- 優先度クラスとリソースクォータ
-
サービングインフラストラクチャ:
- 自動スケーリング用の HPA/VPA
- イベント駆動スケーリング用の KEDA
- トラフィック管理用の Istio サービスメッシュ
- モデルキャッシングとウォームアップ戦略
-
ストレージとデータアクセス:
- 学習データ用の PVC 戦略
- CSI ドライバーを使用したモデルアーティファクトストレージ
- フィーチャーストア用の分散ストレージ
- 推論最適化用のキャッシュレイヤー
ML プラットフォーム全体用の Kubernetes マニフェストと Helm チャートを提供します。 </Task>
フェーズ 4: モニタリングと継続的改善
<Task> subagent_type: observability-engineer prompt: | 以下にデプロイされた ML システムの包括的なモニタリングを実装: {phase3.mlops-engineer.output} 以下の Kubernetes インフラストラクチャを使用: {phase3.kubernetes-architect.output}モニタリングフレームワーク:
-
モデルパフォーマンスモニタリング:
- 予測精度追跡
- レイテンシーとスループットメトリクス
- フィーチャー重要度シフト
- ビジネス KPI との相関
-
データとモデルドリフト検出:
- 統計的ドリフト検出 (KS テスト、PSI)
- コンセプトドリフトモニタリング
- フィーチャー分布追跡
- 自動ドリフトアラートとレポート
-
システム可観測性:
- すべてのコンポーネント用の Prometheus メトリクス
- 可視化用の Grafana ダッシュボード
- Jaeger/Zipkin を使用した分散トレーシング
- ELK/Loki を使用したログ集約
-
アラートと自動化:
- PagerDuty/Opsgenie 統合
- 自動再学習トリガー
- パフォーマンス低下ワークフロー
- インシデント対応ランブック
-
コスト追跡:
- リソース利用率メトリクス
- モデル/実験別のコスト配分
- 最適化推奨事項
- 予算アラートと制御
モニタリング設定、ダッシュボード、アラートルールを提供します。 </Task>
設定オプション
- experiment_tracking: mlflow | wandb | neptune | clearml
- feature_store: feast | tecton | databricks | custom
- serving_platform: kserve | seldon | torchserve | triton
- orchestration: kubeflow | airflow | prefect | dagster
- cloud_provider: aws | azure | gcp | multi-cloud
- deployment_mode: realtime | batch | streaming | hybrid
- monitoring_stack: prometheus | datadog | newrelic | custom
成功基準
-
データパイプラインの成功:
- 本番環境でのデータ品質問題 < 0.1%
- 自動データ検証が 99.9% の時間で成功
- 完全なデータ系統追跡
- サブ秒単位のフィーチャーサービングレイテンシー
-
モデルパフォーマンス:
- ベースラインメトリクスを満たすまたは超える
- 再学習前のパフォーマンス低下 < 5%
- 統計的有意性を持つ成功した A/B テスト
- 24 時間以上検出されないモデルドリフトなし
-
運用上の優秀性:
- モデルサービングの 99.9% のアップタイム
- 推論レイテンシー p99 < 200ms
- 5 分以内の自動ロールバック
- 完全な可観測性とアラート時間 < 1 分
-
開発速度:
- コミットから本番環境まで < 1 時間
- 並列実験実行
- 再現可能な学習実行
- セルフサービスモデルデプロイ
-
コスト効率:
- インフラストラクチャウェイスト < 20%
- リソース割り当ての最適化
- ロードに基づいた自動スケーリング
- スポットインスタンス利用率 > 60%
最終成果物
完了時に、オーケストレーションされたパイプラインは以下を提供します:
- 完全な自動化を備えたエンドツーエンドの ML パイプライン
- 包括的なドキュメンテーションとランブック
- 本番環境対応のコードとしてのインフラストラクチャ
- 完全なモニタリングとアラートシステム
- 継続的改善用の CI/CD パイプライン
- コスト最適化とスケーリング戦略
- ディザスタリカバリーとロールバック手順
制限事項
- このスキルは、タスクが上記で説明されているスコープと明確に一致する場合にのみ使用してください。
- 出力を環境固有の検証、テスト、または専門家レビューの代替として扱わないでください。
- 必要な入力、許可、安全境界、または成功基準が不足している場合は、停止して明確化を求めてください。
ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ
詳細情報
- 作者
- sickn33
- ライセンス
- MIT
- 最終更新
- 不明
Source: https://github.com/sickn33/antigravity-awesome-skills / ライセンス: MIT
関連スキル
nano-banana-2
inference.sh CLIを通じてGoogle Gemini 3.1 Flash Image Preview(Nano Banana 2)で画像を生成します。テキストから画像を生成する機能、画像編集、最大14枚の複数画像入力、Google Searchグラウンディング機能に対応しています。トリガーワード:「nano banana 2」「nanobanana 2」「gemini 3.1 flash image」「gemini 3 1 flash image preview」「google image generation」
octocode-slides
洗練されたマルチファイル形式のHTMLプレゼンテーションを生成します。6段階のフロー(概要 → リサーチ → アウトライン → デザイン → 実装 → レビュー)で構成されています。各スライドは独立したHTMLファイルとなり、iframeで読み込まれます。「スライドを作成してほしい」「プレゼンテーションを作ってほしい」「HTMLスライドを生成してほしい」「デックを構築してほしい」といった依頼や、ノート・ドキュメント・コードを洗練されたプレゼンテーションに変換する際に使用できます。
gpt-image2-ppt
OpenAIのgpt-image-2を使用して、視覚的に優れたPPTスライドを生成します。Spatial Glass、Tech Blue、Editorial Monoなど10種類のキュレーション済みスタイルに対応し、ユーザーが提供したPPTXファイルを模倣するテンプレートクローンモードも搭載しています。HTMLビューアと16:9形式のPPTXファイルを出力します。プレゼンテーション、スライド、ピッチデック、投資家向けPPT、雑誌風PPTの作成依頼などで活用してください。
nano-banana
Nano Banana PRO(Gemini 3 Pro Image)およびNano Banana(Gemini 2.5 Flash Image)を使用したAI画像生成機能です。以下の場合に活用できます:(1)テキストプロンプトからの画像生成、(2)既存画像の編集、(3)インフォグラフィックス、ロゴ、商品写真、ステッカーなどのプロフェッショナルなビジュアルアセット制作、(4)複数画像での人物キャラクターの一貫性保持、(5)正確なテキスト描画を含む画像生成、(6)AI生成ビジュアルが必要なあらゆるタスク。「画像を生成」「画像を作成」「写真を作る」「ロゴをデザイン」「インフォグラフィックスを作成」「AI画像」「nano banana」またはその他の画像生成リクエストをトリガーとして機能します。
oiloil-ui-ux-guide
モダンでクリーンなUI/UXガイダンス・レビュースキルです。新機能や既存システム(Webアプリ)に対して、実行可能なUI/UX改善提案、デザイン原則、デザインレビューチェックリストが必要な場合に活用できます。CRAP(コントラスト・反復・配置・近接)をベースに、タスクファーストなUX、情報設計、フィードバック・システムステータス、一貫性、affordances、エラー防止・復旧、認知負荷を重視します。モダンミニマルスタイル(クリーン・余白・タイポグラフィ主導)を強制し、不要なテキストを削減、アイコンとしての絵文字を禁止し、統一されたアイコンセットから直感的で洗練されたアイコンを推奨します。
axiom-hig-ref
Apple Human Interface Guidelines リファレンス — 色(セマンティックカラー、カスタムカラー、パターン)、背景(マテリアル階層、ダイナミック背景)、タイポグラフィ(標準スタイル、カスタムフォント、Dynamic Type)、SF Symbols(レンダリングモード、色、多言語対応)、ダークモード、アクセシビリティ、プラットフォーム固有の考慮事項を網羅したガイドラインです。