scvi-tools
scvi-toolsを使用したシングルセル解析向け深層学習スキルです。scVI/scANVIによるデータ統合・バッチ補正、PeakVIによるATAC-seq解析、totalVIによるCITE-seqマルチモーダル解析、MultiVIによるRNA+ATACマルチオーム解析、DestVIによる空間トランスクリプトミクスのデコンボリューション、scANVI/scArchesによるラベル転送・リファレンスマッピング、veloVIによるRNAベロシティなど、変分オートエンコーダー(VAE)ベースの手法が必要な場面で使用してください。scVI、totalVI、CITE-seq、latent spaceなどへの言及がトリガーとなります。
description の原文を見る
Deep learning for single-cell analysis using scvi-tools. This skill should be used when users need (1) data integration and batch correction with scVI/scANVI, (2) ATAC-seq analysis with PeakVI, (3) CITE-seq multi-modal analysis with totalVI, (4) multiome RNA+ATAC analysis with MultiVI, (5) spatial transcriptomics deconvolution with DestVI, (6) label transfer and reference mapping with scANVI/scArches, (7) RNA velocity with veloVI, or (8) any deep learning-based single-cell method. Triggers include mentions of scVI, scANVI, totalVI, PeakVI, MultiVI, DestVI, veloVI, sysVI, scArches, variational autoencoder, VAE, batch correction, data integration, multi-modal, CITE-seq, multiome, reference mapping, latent space.
SKILL.md 本文
scvi-tools ディープラーニング スキル
このスキルは、単一細胞ゲノミクスにおける確率モデルの主導的フレームワークである scvi-tools を使用した、ディープラーニングベースの単一細胞解析に関するガイダンスを提供します。
このスキルの使用方法
- 下のモデル/ワークフロー表から適切なワークフローを特定する
- 詳細なステップとコードについて、対応するリファレンスファイルを読む
scripts/のスクリプトを使用して、一般的なコードの再記述を避ける- インストールまたは GPU の問題については、
references/environment_setup.mdを参照する - デバッグについては、
references/troubleshooting.mdを参照する
このスキルを使用する場合
- scvi-tools、scVI、scANVI、または関連するモデルが言及されている場合
- ディープラーニングベースのバッチ補正または統合が必要な場合
- マルチモーダルデータ (CITE-seq、multiome) を使用する場合
- リファレンスマッピングまたはラベル転送が必要な場合
- ATAC-seq または空間トランスクリプトミクスデータを解析する場合
- 単一細胞データの潜在表現を学習する場合
モデル選択ガイド
| データ型 | モデル | 主な使用例 |
|---|---|---|
| scRNA-seq | scVI | 教師なし統合、DE、補完 |
| scRNA-seq + ラベル | scANVI | ラベル転送、半教師あり統合 |
| CITE-seq (RNA+タンパク質) | totalVI | マルチモーダル統合、タンパク質ノイズ除去 |
| scATAC-seq | PeakVI | クロマチンアクセシビリティ解析 |
| Multiome (RNA+ATAC) | MultiVI | 結合モダリティ解析 |
| 空間 + scRNA リファレンス | DestVI | 細胞型分解 |
| RNA 速度 | veloVI | 転写動力学 |
| クロス技術 | sysVI | システムレベルのバッチ補正 |
ワークフロー リファレンスファイル
| ワークフロー | リファレンスファイル | 説明 |
|---|---|---|
| 環境セットアップ | references/environment_setup.md | インストール、GPU、バージョン情報 |
| データ準備 | references/data_preparation.md | 任意のモデル用のデータフォーマッティング |
| scRNA 統合 | references/scrna_integration.md | scVI/scANVI バッチ補正 |
| ATAC-seq 解析 | references/atac_peakvi.md | アクセシビリティのための PeakVI |
| CITE-seq 解析 | references/citeseq_totalvi.md | タンパク質+RNA のための totalVI |
| Multiome 解析 | references/multiome_multivi.md | RNA+ATAC のための MultiVI |
| 空間分解 | references/spatial_deconvolution.md | DestVI 空間解析 |
| ラベル転送 | references/label_transfer.md | scANVI リファレンスマッピング |
| scArches マッピング | references/scarches_mapping.md | クエリからリファレンスへのマッピング |
| バッチ補正 | references/batch_correction_sysvi.md | 高度なバッチ手法 |
| RNA 速度 | references/rna_velocity_velovi.md | veloVI 動力学 |
| トラブルシューティング | references/troubleshooting.md | 一般的な問題と解決策 |
CLI スクリプト
一般的なワークフロー用モジュール式スクリプト。必要に応じて連結または変更できます。
パイプラインスクリプト
| スクリプト | 目的 | 使用法 |
|---|---|---|
prepare_data.py | QC、フィルタリング、HVG 選択 | python scripts/prepare_data.py raw.h5ad prepared.h5ad --batch-key batch |
train_model.py | 任意の scvi-tools モデルの訓練 | python scripts/train_model.py prepared.h5ad results/ --model scvi |
cluster_embed.py | 近傍、UMAP、Leiden | python scripts/cluster_embed.py adata.h5ad results/ |
differential_expression.py | DE 解析 | python scripts/differential_expression.py model/ adata.h5ad de.csv --groupby leiden |
transfer_labels.py | scANVI によるラベル転送 | python scripts/transfer_labels.py ref_model/ query.h5ad results/ |
integrate_datasets.py | マルチデータセット統合 | python scripts/integrate_datasets.py results/ data1.h5ad data2.h5ad |
validate_adata.py | データ互換性チェック | python scripts/validate_adata.py data.h5ad --batch-key batch |
ワークフロー例
# 1. 入力データを検証
python scripts/validate_adata.py raw.h5ad --batch-key batch --suggest
# 2. データ準備 (QC、HVG 選択)
python scripts/prepare_data.py raw.h5ad prepared.h5ad --batch-key batch --n-hvgs 2000
# 3. モデルを訓練
python scripts/train_model.py prepared.h5ad results/ --model scvi --batch-key batch
# 4. クラスタリングと可視化
python scripts/cluster_embed.py results/adata_trained.h5ad results/ --resolution 0.8
# 5. 差分発現
python scripts/differential_expression.py results/model results/adata_clustered.h5ad results/de.csv --groupby leiden
Python ユーティリティ
scripts/model_utils.py はカスタムワークフロー用のインポート可能な関数を提供します:
| 関数 | 目的 |
|---|---|
prepare_adata() | データ準備 (QC、HVG、レイヤーセットアップ) |
train_scvi() | scVI または scANVI の訓練 |
evaluate_integration() | 統合メトリクスの計算 |
get_marker_genes() | DE マーカーの抽出 |
save_results() | モデル、データ、プロットの保存 |
auto_select_model() | 最適なモデルの提案 |
quick_clustering() | 近傍 + UMAP + Leiden |
重要な要件
-
生カウント必須: scvi-tools モデルには整数カウントデータが必要です
adata.layers["counts"] = adata.X.copy() # 正規化前 scvi.model.SCVI.setup_anndata(adata, layer="counts") -
HVG 選択: 2000-4000 の高発現変動遺伝子を使用します
sc.pp.highly_variable_genes(adata, n_top_genes=2000, batch_key="batch", layer="counts", flavor="seurat_v3") adata = adata[:, adata.var['highly_variable']].copy() -
バッチ情報: 統合のために batch_key を指定します
scvi.model.SCVI.setup_anndata(adata, layer="counts", batch_key="batch")
クイック判定フロー
scRNA-seq データを統合する必要がありますか?
├── 細胞型ラベルがありますか? → scANVI (references/label_transfer.md)
└── ラベルがない? → scVI (references/scrna_integration.md)
マルチモーダルデータがありますか?
├── CITE-seq (RNA + タンパク質)? → totalVI (references/citeseq_totalvi.md)
├── Multiome (RNA + ATAC)? → MultiVI (references/multiome_multivi.md)
└── scATAC-seq のみ? → PeakVI (references/atac_peakvi.md)
空間データがありますか?
└── 細胞型分解が必要? → DestVI (references/spatial_deconvolution.md)
事前訓練されたリファレンスモデルがありますか?
└── クエリをリファレンスにマッピング? → scArches (references/scarches_mapping.md)
RNA 速度が必要ですか?
└── veloVI (references/rna_velocity_velovi.md)
強いクロス技術バッチ効果がありますか?
└── sysVI (references/batch_correction_sysvi.md)
主要リソース
ライセンス: Apache-2.0(寛容ライセンスのため全文を引用しています) · 原本リポジトリ
詳細情報
- 作者
- anthropics
- ライセンス
- Apache-2.0
- 最終更新
- 不明
Source: https://github.com/anthropics/knowledge-work-plugins / ライセンス: Apache-2.0
関連スキル
hugging-face-trackio
Trackioを使用してMLトレーニング実験を追跡・可視化できます。トレーニング中のメトリクスログ記録(Python API)、トレーニング診断のアラート発火、ログされたメトリクスの取得・分析(CLI)が必要な場合に活用してください。リアルタイムダッシュボード表示、Webhookを使用したアラート、HF Space同期、自動化向けのJSON出力に対応しています。
btc-bottom-model
ビットコインのサイクルタイミングモデルで、加重スコアリングシステムを搭載しています。日次パルス(4指標、32ポイント)とウィークリー構造(9指標、68ポイント)の2カテゴリーにわたる13の指標を追跡し、0~100のマーケットヒートスコアを算出します。ETFフロー、ファンディングレート、ロング/ショート比率、恐怖・貪欲指数、LTH-MVRV、NUPL、SOPR(LTH+STH)、LTH供給率、移動平均倍率(365日MA、200週MA)、週次RSI、出来高トレンドに対応します。市場サイクル全体を通じて買いと売りの両方の推奨を提供します。ビットコインの底値拾い、BTCサイクルポジション、買い時・売り時、オンチェーン指標、MVRV、NUPL、SOPR、LTH動向、ETFの流出入、ファンディングレート、恐怖指数、ビットコインが過熱状態か、マイナーコスト、暗号資産市場のセンチメント、BTCのポジションサイジング、「今ビットコインを買うべきか」「BTCが天井をつけているか」「オンチェーン指標は何を示しているか」といった質問の際にこのスキルを活用します。
protein_solubility_optimization
タンパク質の溶解性最適化 - タンパク質の溶解性を最適化します。タンパク質の特性を計算し、溶解性と親水性を予測し、有効な変異を提案します。タンパク質配列の特性計算、タンパク質機能の予測、親水性計算、ゼロショット配列予測を含むタンパク質エンジニアリング業務に使用できます。3つのSCPサーバーから4つのツールを統合しています。
research-lookup
Parallel Chat APIまたはPerplexity sonar-pro-searchを使用して、最新の研究情報を検索できます。学術論文の検索にも対応しています。クエリは自動的に最適なバックエンドにルーティングされるため、論文の検索、研究データの収集、科学情報の検証に活用できます。
tree-formatting
ggtree(R)またはiTOL(ウェブ)を使用して、系統樹の可視化とフォーマットを行います。系統樹を図として描画する際、ツリーレイアウトの選択、分類学に基づく枝やラベルの色付け、クレードの折りたたみ、サポート値の表示、またはツリーへのオーバーレイ追加が必要な場合に使用してください。系統推定(protein-phylogenyスキルを使用)やドメイン注釈(今後の独立したスキル)には使用しないでください。
querying-indonesian-gov-data
インドネシア政府の50以上のAPIとデータソースに接続できます。BPJPH(ハラール認証)、BOM(食品安全)、OJK(金融適正性)、BPS(統計)、BMKG(気象・地震)、インドネシア中央銀行(為替レート)、IDX(株式)、CKAN公開データポータル、pasal.id(第三者法MCP)に対応しています。インドネシア政府データを活用したアプリ開発、.go.idウェブサイトのスクレイピング、ハラール認証の確認、企業の法的適正性の検証、金融機関ステータスの照会、またはインドネシアMCPサーバーへの接続時に使用できます。CSRF処理、CKAN API使用方法、IP制限回避など、すぐに実行可能なPythonパターンを含んでいます。