data-version-control
DVCによるデータバージョン管理で、パイプライン追跡、リモートストレージ、実験比較、再現性のあるML ワークフローに対応し、研究開発をサポートします。
description の原文を見る
Data version control with DVC covering pipeline tracking, remote storage, experiment comparison, and reproducible ML workflows for research.
SKILL.md 本文
データ バージョン管理 (DVC)
このスキルを使用する場合
このスキルは以下が必要な場合に使用します:
- Git のようなセマンティクスで大規模なデータセットをコードと一緒にバージョン管理する
- 再現可能なデータ処理パイプラインを定義し実行する
- ML実験のパラメータ、メトリクス、成果物を追跡する
- リモートストレージ(S3、GCS、SSH、ローカル)で大規模なデータファイルを共有およびキャッシュする
- 実験実行を比較し最適なモデルを特定する
- 厳密な再現性でデータ集約的な研究に協力する
- モデル訓練と評価のためのCI/CDパイプラインを構築する
トリガーキーワード:DVC、データバージョン管理、dvc.yaml、dvc.lock、データパイプライン、実験追跡、ML再現性、モデルバージョン管理、データセットバージョン管理、リモートストレージ、dvc run、dvc repro、dvc metrics、dvc plots、MLflow、wandb、成果物追跡、Git-DVC統合、データレジストリ。
背景と主要コンセプト
DVC アーキテクチャ
DVC はデータファイルを追跡し、MD5 ハッシュを Git にコミットされた .dvc ファイルに保存しながら、実際のデータは DVC キャッシュ(ローカルまたはリモート)に保存
...
詳細情報
- 作者
- xjtulyc
- ライセンス
- NOASSERTION
- 最終更新
- 2026/4/14
Source: https://github.com/xjtulyc/awesome-rosetta-skills / ライセンス: NOASSERTION
関連スキル
hugging-face-trackio
Trackioを使用してMLトレーニング実験を追跡・可視化できます。トレーニング中のメトリクスログ記録(Python API)、トレーニング診断のアラート発火、ログされたメトリクスの取得・分析(CLI)が必要な場合に活用してください。リアルタイムダッシュボード表示、Webhookを使用したアラート、HF Space同期、自動化向けのJSON出力に対応しています。
btc-bottom-model
ビットコインのサイクルタイミングモデルで、加重スコアリングシステムを搭載しています。日次パルス(4指標、32ポイント)とウィークリー構造(9指標、68ポイント)の2カテゴリーにわたる13の指標を追跡し、0~100のマーケットヒートスコアを算出します。ETFフロー、ファンディングレート、ロング/ショート比率、恐怖・貪欲指数、LTH-MVRV、NUPL、SOPR(LTH+STH)、LTH供給率、移動平均倍率(365日MA、200週MA)、週次RSI、出来高トレンドに対応します。市場サイクル全体を通じて買いと売りの両方の推奨を提供します。ビットコインの底値拾い、BTCサイクルポジション、買い時・売り時、オンチェーン指標、MVRV、NUPL、SOPR、LTH動向、ETFの流出入、ファンディングレート、恐怖指数、ビットコインが過熱状態か、マイナーコスト、暗号資産市場のセンチメント、BTCのポジションサイジング、「今ビットコインを買うべきか」「BTCが天井をつけているか」「オンチェーン指標は何を示しているか」といった質問の際にこのスキルを活用します。
protein_solubility_optimization
タンパク質の溶解性最適化 - タンパク質の溶解性を最適化します。タンパク質の特性を計算し、溶解性と親水性を予測し、有効な変異を提案します。タンパク質配列の特性計算、タンパク質機能の予測、親水性計算、ゼロショット配列予測を含むタンパク質エンジニアリング業務に使用できます。3つのSCPサーバーから4つのツールを統合しています。
research-lookup
Parallel Chat APIまたはPerplexity sonar-pro-searchを使用して、最新の研究情報を検索できます。学術論文の検索にも対応しています。クエリは自動的に最適なバックエンドにルーティングされるため、論文の検索、研究データの収集、科学情報の検証に活用できます。
tree-formatting
ggtree(R)またはiTOL(ウェブ)を使用して、系統樹の可視化とフォーマットを行います。系統樹を図として描画する際、ツリーレイアウトの選択、分類学に基づく枝やラベルの色付け、クレードの折りたたみ、サポート値の表示、またはツリーへのオーバーレイ追加が必要な場合に使用してください。系統推定(protein-phylogenyスキルを使用)やドメイン注釈(今後の独立したスキル)には使用しないでください。
querying-indonesian-gov-data
インドネシア政府の50以上のAPIとデータソースに接続できます。BPJPH(ハラール認証)、BOM(食品安全)、OJK(金融適正性)、BPS(統計)、BMKG(気象・地震)、インドネシア中央銀行(為替レート)、IDX(株式)、CKAN公開データポータル、pasal.id(第三者法MCP)に対応しています。インドネシア政府データを活用したアプリ開発、.go.idウェブサイトのスクレイピング、ハラール認証の確認、企業の法的適正性の検証、金融機関ステータスの照会、またはインドネシアMCPサーバーへの接続時に使用できます。CSRF処理、CKAN API使用方法、IP制限回避など、すぐに実行可能なPythonパターンを含んでいます。