simo-multiomics-integration-agent
AI駆動型の確率的アラインメントを用いて、複数のオミクスデータセットを空間的に統合し、包括的な組織アトラスの構築と細胞状態マッピングを実現します。
description の原文を見る
AI-powered spatial integration of multi-omics datasets using probabilistic alignment for comprehensive tissue atlas construction and cellular state mapping.
SKILL.md 本文
SIMO マルチオミクス統合エージェント
SIMO マルチオミクス統合エージェントは、確率的アラインメントによるマルチオミクスデータセットの空間統合を実行します。以前のツールは転写産物学に限定されていましたが、SIMOは空間転写産物学とシングルセル RNA-seq を統合し、クロマチンアクセシビリティ、DNA メチル化、およびプロテオミクスデータまで拡張します。
このスキルを使用する場合
- 空間転写産物学とシングルセルマルチオミクスデータを統合する場合
- 空間的文脈を含む包括的な組織アトラスを構築する場合
- エピゲノミック状態(ATAC-seq、メチル化)を空間座標にマッピングする場合
- 組織アーキテクチャ内のマルチモーダル細胞表現型を分析する場合
- 複数のモダリティを組み合わせた空間デコンボリューションを実行する場合
コア機能
-
空間-scRNA 統合: シングルセル RNA-seq を確率的に空間座標にアラインメントします。
-
クロマチンアクセシビリティマッピング: scATAC-seq プロファイルを空間組織位置に投影します。
-
DNA メチル化空間マッピング: シングルセルメチル化データを空間的文脈と統合します。
-
マルチモーダル融合: 転写産物学、エピゲノミック、およびプロテオミクスレイヤーを組み合わせます。
-
確率的細胞型アサインメント: 不確実性定量化を伴って空間スポットに細胞型をアサインします。
-
空間ニッチ同定: マルチオミクスシグネチャで定義される細胞ニッチを発見します。
サポートされるモダリティ
| モダリティ | 入力形式 | 空間リファレンス |
|---|---|---|
| scRNA-seq | AnnData、Seurat | Visium、MERFISH、Xenium |
| scATAC-seq | SnapATAC2、ArchR | Visium、Slide-seq |
| scMethyl | Bismark、allcools | 任意の空間モダリティ |
| CITE-seq (タンパク質) | AnnData | 空間プロテオミクス |
| Multi-ome (RNA+ATAC) | Muon、SnapATAC2 | すべてのプラットフォーム |
統合アルゴリズム
| ステップ | 方法 | 目的 |
|---|---|---|
| 特徴選択 | HVG + マーカー遺伝子 | 次元削減 |
| エンベディング | 変分オートエンコーダ | 共有潜在空間 |
| アラインメント | 最適輸送 | 確率的マッチング |
| 空間マッピング | ガウス過程 | 滑らかな空間予測 |
| 不確実性 | 事後サンプリング | 信頼区間 |
ワークフロー
-
入力: 空間転写産物学(Visium/MERFISH/Xenium)、リファレンスシングルセルマルチオミクス。
-
前処理: 両データセットの正規化、特徴選択、品質管理。
-
エンベディング: モダリティ間の結合潜在表現を学習。
-
確率的アラインメント: 細胞からスポットへのアサインメント確率を計算。
-
空間補完: モダリティを空間座標に転送。
-
ニッチ分析: マルチオミクスシグネチャで空間ドメインを識別。
-
出力: 統合空間マルチオミクスオブジェクト、ニッチアサインメント、ビジュアライゼーション。
使用例
ユーザー: 「scRNA-seq と scATAC-seq データを空間転写産物学と統合して、異なる組織領域でのクロマチン状態を理解したい。」
エージェント実行:
python3 Skills/Genomics/SIMO_Multiomics_Integration_Agent/simo_integration.py \
--spatial_data visium_data.h5ad \
--scrna_ref scrna_atlas.h5ad \
--scatac_ref scatac_atlas.h5ad \
--modalities rna,atac \
--n_spots_per_cell 5 \
--uncertainty_quantification true \
--output integrated_spatial_multiome.h5ad
出力コンポーネント
| 出力 | 説明 | 形式 |
|---|---|---|
| 統合オブジェクト | マルチモーダル空間データ | AnnData/Muon |
| 細胞型マップ | 空間細胞型アサインメント | GeoTIFF、CSV |
| クロマチンアクセシビリティマップ | 空間 ATAC パターン | BigWig、CSV |
| ニッチアサインメント | 空間ドメインラベル | CSV、Zarr |
| 不確実性マップ | スポットごとの信頼度 | GeoTIFF |
| 遺伝子活動スコア | ATAC 由来遺伝子活動 | AnnData レイヤー |
サポートされる空間プラットフォーム
| プラットフォーム | 解像度 | スポット/セル数 | 遺伝子数 |
|---|---|---|---|
| 10x Visium | 55 μm | ~5,000 | 全転写産物 |
| 10x Visium HD | 8 μm | ~300,000 | 全転写産物 |
| 10x Xenium | サブセルラー | >100,000 | 300-5,000 パネル |
| MERFISH | サブセルラー | >1M | 100-10,000 パネル |
| Slide-seq | 10 μm | ~60,000 | 全転写産物 |
| CosMx | サブセルラー | >1M | 1,000-6,000 パネル |
AI/ML コンポーネント
変分統合:
- 結合エンベディングのためのマルチモーダル VAE
- モダリティアラインメントのための対照学習
- データセット間のバッチ補正
確率的マッピング:
- エントロピー正則化による最適輸送
- ガウス過程空間平滑化
- ベイズ不確実性推定
ニッチ発見:
- マルチビュークラスタリング
- 空間自己相関(Moran's I)
- ニッチ境界のためのグラフニューラルネットワーク
前提条件
- Python 3.10+
- Scanpy、Squidpy、Muon
- scvi-tools、SnapATAC2
- POT (Python Optimal Transport)
- PyTorch、GPyTorch
関連スキル
- scGPT_Agent - ファウンデーションモデルエンベディング用
- Spatial_Epigenomics_Agent - 空間エピゲノミクス分析用
- Cell_Cell_Communication - リガンド-レセプター分析用
- Nicheformer_Spatial_Agent - 空間ニッチモデリング用
特別な考慮事項
- バッチ効果: 異なるプロトコルからのデータセットを事前にアラインメント
- スポットデコンボリューション: 低解像度プラットフォームはデコンボリューション必須
- スパース性: scATAC データは集計戦略が必要
- 計算: マルチモーダル統合はメモリ集約的
- 検証: 既知のマーカー分布で空間パターンを検証
応用
| 応用 | ユースケース |
|---|---|
| 腫瘍マイクロ環境 | 免疫浸潤細胞のクロマチン状態をマップ |
| 発生 | 系統分化クロマチンダイナミクスを空間的に追跡 |
| 神経変性 | エピジェネティック変化の空間マッピング |
| 線維化 | 空間活性化プログラムを理解 |
作成者
AI Group - 生物医学 AI プラットフォーム
ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ
詳細情報
- 作者
- majiayu000
- ライセンス
- MIT
- 最終更新
- 2026/5/9
Source: https://github.com/majiayu000/claude-skill-registry-data / ライセンス: MIT
関連スキル
hugging-face-trackio
Trackioを使用してMLトレーニング実験を追跡・可視化できます。トレーニング中のメトリクスログ記録(Python API)、トレーニング診断のアラート発火、ログされたメトリクスの取得・分析(CLI)が必要な場合に活用してください。リアルタイムダッシュボード表示、Webhookを使用したアラート、HF Space同期、自動化向けのJSON出力に対応しています。
btc-bottom-model
ビットコインのサイクルタイミングモデルで、加重スコアリングシステムを搭載しています。日次パルス(4指標、32ポイント)とウィークリー構造(9指標、68ポイント)の2カテゴリーにわたる13の指標を追跡し、0~100のマーケットヒートスコアを算出します。ETFフロー、ファンディングレート、ロング/ショート比率、恐怖・貪欲指数、LTH-MVRV、NUPL、SOPR(LTH+STH)、LTH供給率、移動平均倍率(365日MA、200週MA)、週次RSI、出来高トレンドに対応します。市場サイクル全体を通じて買いと売りの両方の推奨を提供します。ビットコインの底値拾い、BTCサイクルポジション、買い時・売り時、オンチェーン指標、MVRV、NUPL、SOPR、LTH動向、ETFの流出入、ファンディングレート、恐怖指数、ビットコインが過熱状態か、マイナーコスト、暗号資産市場のセンチメント、BTCのポジションサイジング、「今ビットコインを買うべきか」「BTCが天井をつけているか」「オンチェーン指標は何を示しているか」といった質問の際にこのスキルを活用します。
protein_solubility_optimization
タンパク質の溶解性最適化 - タンパク質の溶解性を最適化します。タンパク質の特性を計算し、溶解性と親水性を予測し、有効な変異を提案します。タンパク質配列の特性計算、タンパク質機能の予測、親水性計算、ゼロショット配列予測を含むタンパク質エンジニアリング業務に使用できます。3つのSCPサーバーから4つのツールを統合しています。
research-lookup
Parallel Chat APIまたはPerplexity sonar-pro-searchを使用して、最新の研究情報を検索できます。学術論文の検索にも対応しています。クエリは自動的に最適なバックエンドにルーティングされるため、論文の検索、研究データの収集、科学情報の検証に活用できます。
tree-formatting
ggtree(R)またはiTOL(ウェブ)を使用して、系統樹の可視化とフォーマットを行います。系統樹を図として描画する際、ツリーレイアウトの選択、分類学に基づく枝やラベルの色付け、クレードの折りたたみ、サポート値の表示、またはツリーへのオーバーレイ追加が必要な場合に使用してください。系統推定(protein-phylogenyスキルを使用)やドメイン注釈(今後の独立したスキル)には使用しないでください。
querying-indonesian-gov-data
インドネシア政府の50以上のAPIとデータソースに接続できます。BPJPH(ハラール認証)、BOM(食品安全)、OJK(金融適正性)、BPS(統計)、BMKG(気象・地震)、インドネシア中央銀行(為替レート)、IDX(株式)、CKAN公開データポータル、pasal.id(第三者法MCP)に対応しています。インドネシア政府データを活用したアプリ開発、.go.idウェブサイトのスクレイピング、ハラール認証の確認、企業の法的適正性の検証、金融機関ステータスの照会、またはインドネシアMCPサーバーへの接続時に使用できます。CSRF処理、CKAN API使用方法、IP制限回避など、すぐに実行可能なPythonパターンを含んでいます。