汎用データ・分析⭐ リポ 23品質スコア 73/100
data-version-control
DVCによるデータバージョン管理で、パイプライン追跡、リモートストレージ、実験比較、再現性のあるML ワークフローに対応し、研究開発をサポートします。
description の原文を見る
Data version control with DVC covering pipeline tracking, remote storage, experiment comparison, and reproducible ML workflows for research.
SKILL.md 本文
注意: このスキルのライセンスは NOASSERTION (未指定) です。本サイトでは本文プレビューのみを表示しています。利用前に GitHub の原本でライセンス条件をご確認ください。
データ バージョン管理 (DVC)
このスキルを使用する場合
このスキルは以下が必要な場合に使用します:
- Git のようなセマンティクスで大規模なデータセットをコードと一緒にバージョン管理する
- 再現可能なデータ処理パイプラインを定義し実行する
- ML実験のパラメータ、メトリクス、成果物を追跡する
- リモートストレージ(S3、GCS、SSH、ローカル)で大規模なデータファイルを共有およびキャッシュする
- 実験実行を比較し最適なモデルを特定する
- 厳密な再現性でデータ集約的な研究に協力する
- モデル訓練と評価のためのCI/CDパイプラインを構築する
トリガーキーワード:DVC、データバージョン管理、dvc.yaml、dvc.lock、データパイプライン、実験追跡、ML再現性、モデルバージョン管理、データセットバージョン管理、リモートストレージ、dvc run、dvc repro、dvc metrics、dvc plots、MLflow、wandb、成果物追跡、Git-DVC統合、データレジストリ。
背景と主要コンセプト
DVC アーキテクチャ
DVC はデータファイルを追跡し、MD5 ハッシュを Git にコミットされた .dvc ファイルに保存しながら、実際のデータは DVC キャッシュ(ローカルまたはリモート)に保存
...
詳細情報
- 作者
- xjtulyc
- ライセンス
- NOASSERTION
- 最終更新
- 2026/4/14
Source: https://github.com/xjtulyc/awesome-rosetta-skills / ライセンス: NOASSERTION