Anthropic ClaudeLLM・AI開発⭐ リポ 0品質スコア 50/100

ml-pipeline-workflow

Name: ml-pipeline-workflow
Author: wshobson

データ準備からモデルのトレーニング・検証・本番デプロイまでを網羅するエンドツーエンドのMLOpsパイプラインを構築します。MLパイプラインの作成、MLOpsプラクティスの導入、モデルのトレーニングやデプロイワークフローの自動化が必要な際に活用してください。

description の原文を見る

Build end-to-end MLOps pipelines from data preparation through model training, validation, and production deployment. Use when creating ML pipelines, implementing MLOps practices, or automating model training and deployment workflows.

SKILL.md 本文

ML パイプラインワークフロー

データ準備からモデルデプロイまでの完全なエンドツーエンド MLOps パイプラインオーケストレーション。

概要

このスキルは、完全なライフサイクルを処理する本番レベルの ML パイプラインの構築に関する包括的なガイダンスを提供します：データ取り込み → 準備 → トレーニング → 検証 → デプロイ → 監視。

このスキルを使用するタイミング

新しい ML パイプラインをゼロから構築する
ML システムのワークフローオーケストレーションを設計する
データ → モデル → デプロイメントの自動化を実装する
再現可能なトレーニングワークフローをセットアップする
DAG ベースの ML オーケストレーションを作成する
ML コンポーネントを本番システムに統合する

このスキルが提供するもの

コア機能

パイプラインアーキテクチャ
- エンドツーエンドのワークフロー設計
- DAG オーケストレーションパターン（Airflow、Dagster、Kubeflow）
- コンポーネントの依存関係とデータフロー
- エラーハンドリングと再試行戦略
データ準備
- データ検証と品質チェック
- 特徴量エンジニアリングパイプライン
- データバージョニングと系統管理
- 訓練/検証/テスト分割戦略
モデルトレーニング
- トレーニングジョブオーケストレーション
- ハイパーパラメータ管理
- 実験トラッキング統合
- 分散トレーニングパターン
モデル検証
- 検証フレームワークとメトリクス
- A/B テストインフラストラクチャ
- パフォーマンス低下検出
- モデル比較ワークフロー
デプロイメント自動化
- モデルサービングパターン
- カナリアデプロイメント
- ブルーグリーンデプロイメント戦略
- ロールバックメカニズム

リファレンスドキュメント

詳細ガイドについては、references/ ディレクトリを参照してください：

data-preparation.md - データクリーニング、検証、特徴量エンジニアリング
model-training.md - トレーニングワークフローとベストプラクティス
model-validation.md - 検証戦略とメトリクス
model-deployment.md - デプロイメントパターンとサービングアーキテクチャ

アセットとテンプレート

assets/ ディレクトリには以下が含まれます：

pipeline-dag.yaml.template - ワークフローオーケストレーション用の DAG テンプレート
training-config.yaml - トレーニング設定テンプレート
validation-checklist.md - デプロイ前検証チェックリスト

使用パターン

基本的なパイプラインセットアップ

# 1. パイプラインステージを定義
stages = [
    "data_ingestion",
    "data_validation",
    "feature_engineering",
    "model_training",
    "model_validation",
    "model_deployment"
]

# 2. 依存関係を設定
# 完全な例については assets/pipeline-dag.yaml.template を参照してください

本番ワークフロー

データ準備フェーズ
- ソースから生データを取り込む
- データ品質チェックを実行
- 特徴量変換を適用
- 処理済みデータセットをバージョン管理
トレーニングフェーズ
- バージョン管理されたトレーニングデータを読み込む
- トレーニングジョブを実行
- 実験とメトリクスを追跡
- トレーニング済みモデルを保存
検証フェーズ
- 検証テストスイートを実行
- ベースラインと比較
- パフォーマンスレポートを生成
- デプロイメント承認
デプロイメントフェーズ
- モデルアーティファクトをパッケージ化
- サービングインフラストラクチャにデプロイ
- 監視を設定
- 本番トラフィックを検証

ベストプラクティス

パイプライン設計

モジュール性: 各ステージは独立してテスト可能であること
べき等性: ステージの再実行は安全であること
可観測性: すべてのステージでメトリクスをログ記録
バージョニング: データ、コード、モデルのバージョンを追跡
障害処理: 再試行ロジックとアラート機能を実装

データ管理

データ検証ライブラリ（Great Expectations、TFX）を使用
DVC などのツールでデータセットをバージョン管理
特徴量エンジニアリング変換を文書化
データ系統追跡を保守

モデル運用

トレーニングとサービングインフラストラクチャを分離
モデルレジストリ（MLflow、Weights & Biases）を使用
新しいモデルの段階的ロールアウトを実装
モデルパフォーマンスドリフトを監視
ロールバック機能を保持

デプロイメント戦略

シャドウデプロイメントから開始
検証のためのカナリアリリースを使用
A/B テストインフラストラクチャを実装
自動ロールバックトリガーをセットアップ
レイテンシーとスループットを監視

統合ポイント

オーケストレーションツール

Apache Airflow: DAG ベースのワークフローオーケストレーション
Dagster: アセットベースのパイプラインオーケストレーション
Kubeflow Pipelines: Kubernetes ネイティブの ML ワークフロー
Prefect: モダンなデータフロー自動化

実験トラッキング

MLflow による実験トラッキングとモデルレジストリ
Weights & Biases による可視化とコラボレーション
TensorBoard によるトレーニングメトリクス

デプロイメントプラットフォーム

AWS SageMaker による管理 ML インフラストラクチャ
Google Vertex AI による GCP デプロイメント
Azure ML による Azure クラウド
OCI Data Science による Oracle Cloud Infrastructure デプロイメント
Kubernetes + KServe によるクラウド非依存サービング

段階的な情報開示

基本から始めて段階的に複雑さを追加します：

レベル 1: シンプルな線形パイプライン（データ → トレーニング → デプロイ）
レベル 2: 検証と監視ステージを追加
レベル 3: ハイパーパラメータチューニングを実装
レベル 4: A/B テストと段階的ロールアウトを追加
レベル 5: アンサンブル戦略を使用したマルチモデルパイプライン

一般的なパターン

バッチトレーニングパイプライン

# assets/pipeline-dag.yaml.template を参照してください
stages:
  - name: data_preparation
    dependencies: []
  - name: model_training
    dependencies: [data_preparation]
  - name: model_evaluation
    dependencies: [model_training]
  - name: model_deployment
    dependencies: [model_evaluation]

リアルタイム特徴量パイプライン

# リアルタイム特徴量用のストリーム処理
# バッチ トレーニングと組み合わせる
# references/data-preparation.md を参照してください

継続的トレーニング

# スケジュールに基づいた自動再トレーニング
# データドリフト検出によってトリガー
# references/model-training.md を参照してください

トラブルシューティング

一般的な問題

パイプライン障害: 依存関係とデータの可用性を確認
トレーニング不安定性: ハイパーパラメータとデータ品質を確認
デプロイメント問題: モデルアーティファクトとサービング設定を検証
パフォーマンス低下: データドリフトとモデルメトリクスを監視

デバッグ手順

各ステージのパイプラインログを確認
境界部分で入力/出力データを検証
コンポーネントを単独でテスト
実験トラッキングメトリクスを確認
モデルアーティファクトとメタデータを検査

次のステップ

パイプラインをセットアップした後：

hyperparameter-tuning スキルで最適化を探索
experiment-tracking-setup で MLflow/W&B を学習
model-deployment-patterns でサービング戦略を確認
オブザーバビリティツールで監視を実装

詳細情報

作者: wshobson
リポジトリ: wshobson/agents
ライセンス: MIT
最終更新: 不明

GitHubで原本を見る →フィードバックを送る

Source: https://github.com/wshobson/agents / ライセンス: MIT

ml-pipeline-workflow

SKILL.md 本文

ML パイプラインワークフロー

概要

このスキルを使用するタイミング

このスキルが提供するもの

コア機能

リファレンスドキュメント

アセットとテンプレート

使用パターン

基本的なパイプラインセットアップ

本番ワークフロー

ベストプラクティス

パイプライン設計

データ管理

モデル運用

デプロイメント戦略

統合ポイント

オーケストレーションツール

実験トラッキング

デプロイメントプラットフォーム

段階的な情報開示

一般的なパターン

バッチトレーニングパイプライン

リアルタイム特徴量パイプライン

継続的トレーニング

トラブルシューティング

一般的な問題

デバッグ手順

次のステップ

関連スキル

詳細情報

関連スキル

agent-browser

anyskill

engram

skyvern

pinchbench

openui

SKILL.md 本文

ML パイプライン ワークフロー

概要

このスキルを使用するタイミング

このスキルが提供するもの

コア機能

リファレンス ドキュメント

アセットとテンプレート

使用パターン

基本的なパイプライン セットアップ

本番ワークフロー

ベストプラクティス

パイプライン設計

データ管理

モデル運用

デプロイメント戦略

統合ポイント

オーケストレーション ツール

実験トラッキング

デプロイメント プラットフォーム

段階的な情報開示

一般的なパターン

バッチトレーニング パイプライン

リアルタイム特徴量パイプライン

継続的トレーニング

トラブルシューティング

一般的な問題

デバッグ手順

次のステップ

関連スキル

詳細情報

関連スキル

agent-browser

anyskill

engram

skyvern

pinchbench

openui

ML パイプラインワークフロー

リファレンスドキュメント

基本的なパイプラインセットアップ

オーケストレーションツール

デプロイメントプラットフォーム

バッチトレーニングパイプライン