Agent Skills by ALSEL
Anthropic ClaudeLLM・AI開発⭐ リポ 0品質スコア 50/100

ml-pipeline-workflow

データ準備からモデルのトレーニング・検証・本番デプロイまでを網羅するエンドツーエンドのMLOpsパイプラインを構築します。MLパイプラインの作成、MLOpsプラクティスの導入、モデルのトレーニングやデプロイワークフローの自動化が必要な際に活用してください。

description の原文を見る

Build end-to-end MLOps pipelines from data preparation through model training, validation, and production deployment. Use when creating ML pipelines, implementing MLOps practices, or automating model training and deployment workflows.

SKILL.md 本文

ML パイプライン ワークフロー

データ準備からモデルデプロイまでの完全なエンドツーエンド MLOps パイプライン オーケストレーション。

概要

このスキルは、完全なライフサイクルを処理する本番レベルの ML パイプラインの構築に関する包括的なガイダンスを提供します:データ取り込み → 準備 → トレーニング → 検証 → デプロイ → 監視。

このスキルを使用するタイミング

  • 新しい ML パイプラインをゼロから構築する
  • ML システムのワークフロー オーケストレーションを設計する
  • データ → モデル → デプロイメントの自動化を実装する
  • 再現可能なトレーニング ワークフローをセットアップする
  • DAG ベースの ML オーケストレーションを作成する
  • ML コンポーネントを本番システムに統合する

このスキルが提供するもの

コア機能

  1. パイプラインアーキテクチャ

    • エンドツーエンドのワークフロー設計
    • DAG オーケストレーション パターン(Airflow、Dagster、Kubeflow)
    • コンポーネントの依存関係とデータフロー
    • エラーハンドリングと再試行戦略
  2. データ準備

    • データ検証と品質チェック
    • 特徴量エンジニアリング パイプライン
    • データバージョニングと系統管理
    • 訓練/検証/テスト分割戦略
  3. モデル トレーニング

    • トレーニング ジョブ オーケストレーション
    • ハイパーパラメータ管理
    • 実験トラッキング統合
    • 分散トレーニング パターン
  4. モデル検証

    • 検証フレームワークとメトリクス
    • A/B テストインフラストラクチャ
    • パフォーマンス低下検出
    • モデル比較ワークフロー
  5. デプロイメント自動化

    • モデルサービング パターン
    • カナリアデプロイメント
    • ブルーグリーン デプロイメント戦略
    • ロールバック メカニズム

リファレンス ドキュメント

詳細ガイドについては、references/ ディレクトリを参照してください:

  • data-preparation.md - データクリーニング、検証、特徴量エンジニアリング
  • model-training.md - トレーニング ワークフローとベストプラクティス
  • model-validation.md - 検証戦略とメトリクス
  • model-deployment.md - デプロイメント パターンとサービング アーキテクチャ

アセットとテンプレート

assets/ ディレクトリには以下が含まれます:

  • pipeline-dag.yaml.template - ワークフロー オーケストレーション用の DAG テンプレート
  • training-config.yaml - トレーニング設定テンプレート
  • validation-checklist.md - デプロイ前検証チェックリスト

使用パターン

基本的なパイプライン セットアップ

# 1. パイプラインステージを定義
stages = [
    "data_ingestion",
    "data_validation",
    "feature_engineering",
    "model_training",
    "model_validation",
    "model_deployment"
]

# 2. 依存関係を設定
# 完全な例については assets/pipeline-dag.yaml.template を参照してください

本番ワークフロー

  1. データ準備フェーズ

    • ソースから生データを取り込む
    • データ品質チェックを実行
    • 特徴量変換を適用
    • 処理済みデータセットをバージョン管理
  2. トレーニング フェーズ

    • バージョン管理されたトレーニング データを読み込む
    • トレーニング ジョブを実行
    • 実験とメトリクスを追跡
    • トレーニング済みモデルを保存
  3. 検証フェーズ

    • 検証テストスイートを実行
    • ベースラインと比較
    • パフォーマンス レポートを生成
    • デプロイメント承認
  4. デプロイメント フェーズ

    • モデル アーティファクトをパッケージ化
    • サービング インフラストラクチャにデプロイ
    • 監視を設定
    • 本番トラフィックを検証

ベストプラクティス

パイプライン設計

  • モジュール性: 各ステージは独立してテスト可能であること
  • べき等性: ステージの再実行は安全であること
  • 可観測性: すべてのステージでメトリクスをログ記録
  • バージョニング: データ、コード、モデルのバージョンを追跡
  • 障害処理: 再試行ロジックとアラート機能を実装

データ管理

  • データ検証ライブラリ(Great Expectations、TFX)を使用
  • DVC などのツールでデータセットをバージョン管理
  • 特徴量エンジニアリング変換を文書化
  • データ系統追跡を保守

モデル運用

  • トレーニングとサービング インフラストラクチャを分離
  • モデルレジストリ(MLflow、Weights & Biases)を使用
  • 新しいモデルの段階的ロールアウトを実装
  • モデルパフォーマンス ドリフトを監視
  • ロールバック機能を保持

デプロイメント戦略

  • シャドウ デプロイメントから開始
  • 検証のためのカナリア リリースを使用
  • A/B テスト インフラストラクチャを実装
  • 自動ロールバック トリガーをセットアップ
  • レイテンシーとスループットを監視

統合ポイント

オーケストレーション ツール

  • Apache Airflow: DAG ベースのワークフロー オーケストレーション
  • Dagster: アセット ベースのパイプライン オーケストレーション
  • Kubeflow Pipelines: Kubernetes ネイティブの ML ワークフロー
  • Prefect: モダンなデータフロー自動化

実験トラッキング

  • MLflow による実験トラッキングとモデルレジストリ
  • Weights & Biases による可視化とコラボレーション
  • TensorBoard によるトレーニング メトリクス

デプロイメント プラットフォーム

  • AWS SageMaker による管理 ML インフラストラクチャ
  • Google Vertex AI による GCP デプロイメント
  • Azure ML による Azure クラウド
  • OCI Data Science による Oracle Cloud Infrastructure デプロイメント
  • Kubernetes + KServe によるクラウド非依存サービング

段階的な情報開示

基本から始めて段階的に複雑さを追加します:

  1. レベル 1: シンプルな線形パイプライン(データ → トレーニング → デプロイ)
  2. レベル 2: 検証と監視ステージを追加
  3. レベル 3: ハイパーパラメータ チューニングを実装
  4. レベル 4: A/B テストと段階的ロールアウトを追加
  5. レベル 5: アンサンブル戦略を使用したマルチモデル パイプライン

一般的なパターン

バッチトレーニング パイプライン

# assets/pipeline-dag.yaml.template を参照してください
stages:
  - name: data_preparation
    dependencies: []
  - name: model_training
    dependencies: [data_preparation]
  - name: model_evaluation
    dependencies: [model_training]
  - name: model_deployment
    dependencies: [model_evaluation]

リアルタイム特徴量パイプライン

# リアルタイム特徴量用のストリーム処理
# バッチ トレーニングと組み合わせる
# references/data-preparation.md を参照してください

継続的トレーニング

# スケジュールに基づいた自動再トレーニング
# データドリフト検出によってトリガー
# references/model-training.md を参照してください

トラブルシューティング

一般的な問題

  • パイプライン障害: 依存関係とデータの可用性を確認
  • トレーニング不安定性: ハイパーパラメータとデータ品質を確認
  • デプロイメント問題: モデル アーティファクトとサービング設定を検証
  • パフォーマンス低下: データドリフトとモデル メトリクスを監視

デバッグ手順

  1. 各ステージのパイプライン ログを確認
  2. 境界部分で入力/出力データを検証
  3. コンポーネントを単独でテスト
  4. 実験トラッキング メトリクスを確認
  5. モデル アーティファクトとメタデータを検査

次のステップ

パイプラインをセットアップした後:

  1. hyperparameter-tuning スキルで最適化を探索
  2. experiment-tracking-setup で MLflow/W&B を学習
  3. model-deployment-patterns でサービング戦略を確認
  4. オブザーバビリティ ツールで監視を実装

関連スキル

  • experiment-tracking-setup: MLflow と Weights & Biases 統合
  • hyperparameter-tuning: 自動ハイパーパラメータ最適化
  • model-deployment-patterns: 高度なデプロイメント戦略

ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ

詳細情報

作者
wshobson
リポジトリ
wshobson/agents
ライセンス
MIT
最終更新
不明

Source: https://github.com/wshobson/agents / ライセンス: MIT

関連スキル

OpenAILLM・AI開発⭐ リポ 6,054

agent-browser

AI エージェント向けのブラウザ自動化 CLI です。ウェブサイトとの対話が必要な場合に使用します。ページ遷移、フォーム入力、ボタンクリック、スクリーンショット取得、データ抽出、ウェブアプリのテスト、ブラウザ操作の自動化など、あらゆるブラウザタスクに対応できます。「ウェブサイトを開く」「フォームに記入する」「ボタンをクリックする」「スクリーンショットを取得する」「ページからデータを抽出する」「このウェブアプリをテストする」「サイトにログインする」「ブラウザ操作を自動化する」といった要求や、プログラマティックなウェブ操作が必要なタスクで起動します。

by JimmyLv
汎用LLM・AI開発⭐ リポ 1,982

anyskill

AnySkill — あなたのプライベート・スキルクラウド。GitHubを基盤としたリポジトリからエージェントスキルを管理、同期、動的にロードできます。自然言語でクラウドスキルを検索し、オンデマンドでプロンプトを自動ロード、カスタムスキルのアップロードと共有、スキルバンドルの一括インストールが可能です。OpenClaw、Antigravity、Claude Code、Cursorに対応しています。

by LeoYeAI
汎用LLM・AI開発⭐ リポ 1,982

engram

AIエージェント向けの永続的なメモリシステムです。バグ修正、意思決定、発見、設定変更の後はmem_saveを使用してください。ユーザーが「覚えている」「記憶している」と言及した場合、または以前のセッションと重複する作業を開始する際はmem_searchを使用します。セッション終了前にmem_session_summaryを使用して、コンテキストを保持してください。

by LeoYeAI
汎用LLM・AI開発⭐ リポ 21,584

skyvern

AI駆動のブラウザ自動化により、任意のウェブサイトを自動化できます。フォーム入力、データ抽出、ファイルダウンロード、ログイン、複数ステップのワークフロー実行など、ユーザーがウェブサイトと連携する必要があるときに使用します。Skyvernは、LLMとコンピュータビジョンを活用して、未知のサイトも自動操作可能です。Python SDK、TypeScript SDK、REST API、MCPサーバー、またはCLIを通じて統合できます。

by Skyvern-AI
汎用LLM・AI開発⭐ リポ 1,149

pinchbench

PinchBenchベンチマークを実行して、OpenClawエージェントの実世界タスクにおけるパフォーマンスを評価できます。モデルの機能テスト、モデル間の比較、ベンチマーク結果のリーダーボード提出、またはOpenClawのセットアップがカレンダー、メール、リサーチ、コーディング、複数ステップのワークフローにどの程度対応しているかを確認する際に使用します。

by pinchbench
汎用LLM・AI開発⭐ リポ 4,693

openui

OpenUIとOpenUI Langを使用してジェネレーティブUIアプリを構築できます。これらはLLM生成インターフェースのためのトークン効率的なオープン標準です。OpenUI、@openuidev、ジェネレーティブUI、LLMからのストリーミングUI、AI向けコンポーネントライブラリ、またはjson-render/A2UIの置き換えについて述べる際に使用します。スキャフォルディング、defineComponent、システムプロンプト、Renderer、およびOpenUI Lang出力のデバッグに対応しています。

by thesysdev
本サイトは GitHub 上で公開されているオープンソースの SKILL.md ファイルをクロール・インデックス化したものです。 各スキルの著作権は原作者に帰属します。掲載に問題がある場合は info@alsel.co.jp または /takedown フォームよりご連絡ください。
原作者: wshobson · wshobson/agents · ライセンス: MIT