Agent Skills by ALSEL
汎用データ・分析⭐ リポ 23品質スコア 73/100

data-version-control

DVCによるデータバージョン管理で、パイプライン追跡、リモートストレージ、実験比較、再現性のあるML ワークフローに対応し、研究開発をサポートします。

description の原文を見る

Data version control with DVC covering pipeline tracking, remote storage, experiment comparison, and reproducible ML workflows for research.

SKILL.md 本文

注意: このスキルのライセンスは NOASSERTION (未指定) です。本サイトでは本文プレビューのみを表示しています。利用前に GitHub の原本でライセンス条件をご確認ください。

データ バージョン管理 (DVC)

このスキルを使用する場合

このスキルは以下が必要な場合に使用します:

  • Git のようなセマンティクスで大規模なデータセットをコードと一緒にバージョン管理する
  • 再現可能なデータ処理パイプラインを定義し実行する
  • ML実験のパラメータ、メトリクス、成果物を追跡する
  • リモートストレージ(S3、GCS、SSH、ローカル)で大規模なデータファイルを共有およびキャッシュする
  • 実験実行を比較し最適なモデルを特定する
  • 厳密な再現性でデータ集約的な研究に協力する
  • モデル訓練と評価のためのCI/CDパイプラインを構築する

トリガーキーワード:DVC、データバージョン管理、dvc.yaml、dvc.lock、データパイプライン、実験追跡、ML再現性、モデルバージョン管理、データセットバージョン管理、リモートストレージ、dvc run、dvc repro、dvc metrics、dvc plots、MLflow、wandb、成果物追跡、Git-DVC統合、データレジストリ。

背景と主要コンセプト

DVC アーキテクチャ

DVC はデータファイルを追跡し、MD5 ハッシュを Git にコミットされた .dvc ファイルに保存しながら、実際のデータは DVC キャッシュ(ローカルまたはリモート)に保存

...

詳細情報

作者
xjtulyc
リポジトリ
xjtulyc/awesome-rosetta-skills
ライセンス
NOASSERTION
最終更新
2026/4/14

Source: https://github.com/xjtulyc/awesome-rosetta-skills / ライセンス: NOASSERTION

本サイトは GitHub 上で公開されているオープンソースの SKILL.md ファイルをクロール・インデックス化したものです。 各スキルの著作権は原作者に帰属します。掲載に問題がある場合は info@alsel.co.jp または /takedown フォームよりご連絡ください。
原作者: xjtulyc · xjtulyc/awesome-rosetta-skills · ライセンス: NOASSERTION (未指定)