tooluniverse-image-analysis
顕微鏡画像の定量解析に特化した本番運用対応スキルで、コロニー形態計測・細胞カウント・蛍光定量・統計解析をカバーします。ImageJ/CellProfilerの出力データ(面積・円形度・輝度・細胞数)を処理し、Dunnett検定・Cohenのd効果量・検出力分析・Shapiro-Wilk正規性検定・二元配置ANOVA・多項式回帰・自然スプライン回帰(信頼区間付き)・比較形態計測を実行します。CSV/TSV形式の計測テーブル、多チャンネル蛍光データ、コロニー遊走アッセイ、ニューロンカウントデータセットに対応しており、顕微鏡計測データの解析・コロニー面積や円形度の評価・細胞数統計・共培養比率の最適化などの場面でご活用ください。
description の原文を見る
Production-ready microscopy image analysis and quantitative imaging data skill for colony morphometry, cell counting, fluorescence quantification, and statistical analysis of imaging-derived measurements. Processes ImageJ/CellProfiler output (area, circularity, intensity, cell counts), performs Dunnett's test, Cohen's d effect size, power analysis, Shapiro-Wilk normality tests, two-way ANOVA, polynomial regression, natural spline regression with confidence intervals, and comparative morphometry. Supports CSV/TSV measurement tables, multi-channel fluorescence data, colony swarming assays, and neuron counting datasets. Use when analyzing microscopy measurement data, colony area/circularity, cell count statistics, swarming assays, co-culture ratio optimization, or answering questions about imaging-derived quantitative data.
SKILL.md 本文
顕微鏡画像解析と定量的画像データ
pandas、numpy、scipy、statsmodels、scikit-image を使用した顕微鏡由来の計測データ解析向けの本番環境対応スキル。
推測するのではなく、調査する
科学的事実について不確実な場合は、記憶から推論するのではなく、まずデータベースを検索してください。
使用する場面
- CSV/TSV 形式の顕微鏡計測データ(面積、円形度、強度、細胞数)
- コロニー形態計測、細胞数統計、蛍光定量化
- 統計的比較(t 検定、ANOVA、Dunnett 検定、Mann-Whitney 検定、Cohen's d、検出力分析)
- 用量反応曲線またはラシオ データのための回帰モデル(多項式、スプライン)
- 画像解析ソフトウェア出力(ImageJ、CellProfiler、QuPath)
非対応: 系統学、RNA-seq DEG、シングルセルscRNA-seq、画像解析の背景がない統計解析。
コア原則
- データファースト - 解析前にすべての CSV/TSV を読み込んで検査する
- 質問駆動型 - 要求された統計量を正確に解析する
- 統計的厳密さ - 効果量、多重比較補正、モデル選択
- 画像解析の理解 - ImageJ/CellProfiler の列を理解する(Area、Circularity、Round、Intensity)
- 精密性 - 期待される回答形式に合わせる(整数、範囲、小数点以下の桁数)
必要なパッケージ
import pandas as pd, numpy as np
from scipy import stats
from scipy.interpolate import BSpline, make_interp_spline
import statsmodels.api as sm
from statsmodels.formula.api import ols
from statsmodels.stats.power import TTestIndPower
from patsy import dmatrix, bs, cr
# オプション: skimage, cv2, tifffile
ワークフロー決定木
事前定量化データ(CSV/TSV)→ 読み込み → 質問解析 → 統計解析
生画像(TIFF、PNG)→ 読み込み → セグメンテーション → 計測 → 解析(references/参照)
統計的比較:
2 グループ → t 検定または Mann-Whitney 検定
複数グループ vs コントロール → Dunnett 検定
2 つの要因 → Two-way ANOVA
効果量 → Cohen's d + 検出力分析
回帰:
用量反応 → 多項式(2 次/3 次)
ラシオ最適化 → 自然スプライン
モデル比較 → R-squared、F-statistic、AIC/BIC
解析ワークフロー
フェーズ 0: 質問解析とデータ発見
import os, glob, pandas as pd
csv_files = glob.glob(os.path.join(".", '**', '*.csv'), recursive=True)
df = pd.read_csv(csv_files[0])
print(f"Shape: {df.shape}, Columns: {list(df.columns)}")
一般的な列: Area、Circularity、Round、Genotype/Strain、Ratio、NeuN/DAPI/GFP。
フェーズ 1-3: グループ化統計 → 統計検定 → 回帰
完全な実装については、references/statistical_analysis.md を参照してください(grouped_summary、Dunnett 検定、Cohen's d、検出力分析、多項式/スプライン回帰)。
一般的な BixBench パターン
| パターン | 質問例 | ワークフロー |
|---|---|---|
| コロニー形態計測(bix-18) | 「最大面積の遺伝子型の平均円形度は?」 | 遺伝子型でグループ化 → 最大平均面積 → 円形度を報告 |
| 細胞数計数(bix-19) | 「NeuN 数の Cohen's d は?」 | フィルタ → 条件で分割 → プール SD → Cohen's d |
| マルチグループ(bix-41) | 「コントロール相当のラシオは何個?」 | Area と Circularity の Dunnett 検定 → 両方で有意でないものをカウント |
| 回帰(bix-54) | 「自然スプラインからのピーク周波数は?」 | ラシオ→周波数 → spline(df=4) → グリッドサーチピーク → CI |
生画像処理
from scripts.segment_cells import count_cells_in_image
result = count_cells_in_image(image_path="cells.tif", channel=0, min_area=50)
セグメンテーション: 核 → Otsu + ウォーターシェッド;コロニー → Otsu;位相差 → 適応的閾値。 references/segmentation.md、references/cell_counting.md、references/image_processing.md を参照してください。
R から Python への対応
- R Dunnett(
multcomp::glht)→scipy.stats.dunnett()(scipy >= 1.10) - R 自然スプライン(
ns(x, df=4))→ 明示的な分位数ノット付きpatsy.cr(x, knots=...) - R
t.test()→scipy.stats.ttest_ind() - R
aov()→statsmodels.formula.api.ols()+sm.stats.anova_lm()
回答フォーマット
- 「最も近い千の位まで」:
int(round(val, -3)) - Cohen's d: 小数点以下 3 桁
- サンプルサイズ: 整数(切り上げ)
- ラシオ: 文字列「5:1」
エビデンスグレーディング
| グレード | 基準 |
|---|---|
| 強 | p < 0.001、d > 0.8、N >= 30/グループ |
| 中程度 | p < 0.05、0.5 <= d < 0.8 |
| 弱 | p < 0.05、d < 0.5 または低 N |
| 不十分 | p >= 0.05 または N < 5/グループ |
円形度が 1.0 に近い = 丸い/健康的;< 0.5 = 不規則。事後検出力 < 0.80 = 検出力不足。
リファレンス
スクリプト: segment_cells.py、measure_fluorescence.py、batch_process.py、colony_morphometry.py、statistical_comparison.py
ドキュメント: statistical_analysis.md、cell_counting.md、segmentation.md、fluorescence_analysis.md、image_processing.md
ライセンス: Apache-2.0(寛容ライセンスのため全文を引用しています) · 原本リポジトリ
詳細情報
- 作者
- mims-harvard
- ライセンス
- Apache-2.0
- 最終更新
- 不明
Source: https://github.com/mims-harvard/tooluniverse / ライセンス: Apache-2.0
関連スキル
hugging-face-trackio
Trackioを使用してMLトレーニング実験を追跡・可視化できます。トレーニング中のメトリクスログ記録(Python API)、トレーニング診断のアラート発火、ログされたメトリクスの取得・分析(CLI)が必要な場合に活用してください。リアルタイムダッシュボード表示、Webhookを使用したアラート、HF Space同期、自動化向けのJSON出力に対応しています。
btc-bottom-model
ビットコインのサイクルタイミングモデルで、加重スコアリングシステムを搭載しています。日次パルス(4指標、32ポイント)とウィークリー構造(9指標、68ポイント)の2カテゴリーにわたる13の指標を追跡し、0~100のマーケットヒートスコアを算出します。ETFフロー、ファンディングレート、ロング/ショート比率、恐怖・貪欲指数、LTH-MVRV、NUPL、SOPR(LTH+STH)、LTH供給率、移動平均倍率(365日MA、200週MA)、週次RSI、出来高トレンドに対応します。市場サイクル全体を通じて買いと売りの両方の推奨を提供します。ビットコインの底値拾い、BTCサイクルポジション、買い時・売り時、オンチェーン指標、MVRV、NUPL、SOPR、LTH動向、ETFの流出入、ファンディングレート、恐怖指数、ビットコインが過熱状態か、マイナーコスト、暗号資産市場のセンチメント、BTCのポジションサイジング、「今ビットコインを買うべきか」「BTCが天井をつけているか」「オンチェーン指標は何を示しているか」といった質問の際にこのスキルを活用します。
protein_solubility_optimization
タンパク質の溶解性最適化 - タンパク質の溶解性を最適化します。タンパク質の特性を計算し、溶解性と親水性を予測し、有効な変異を提案します。タンパク質配列の特性計算、タンパク質機能の予測、親水性計算、ゼロショット配列予測を含むタンパク質エンジニアリング業務に使用できます。3つのSCPサーバーから4つのツールを統合しています。
research-lookup
Parallel Chat APIまたはPerplexity sonar-pro-searchを使用して、最新の研究情報を検索できます。学術論文の検索にも対応しています。クエリは自動的に最適なバックエンドにルーティングされるため、論文の検索、研究データの収集、科学情報の検証に活用できます。
tree-formatting
ggtree(R)またはiTOL(ウェブ)を使用して、系統樹の可視化とフォーマットを行います。系統樹を図として描画する際、ツリーレイアウトの選択、分類学に基づく枝やラベルの色付け、クレードの折りたたみ、サポート値の表示、またはツリーへのオーバーレイ追加が必要な場合に使用してください。系統推定(protein-phylogenyスキルを使用)やドメイン注釈(今後の独立したスキル)には使用しないでください。
querying-indonesian-gov-data
インドネシア政府の50以上のAPIとデータソースに接続できます。BPJPH(ハラール認証)、BOM(食品安全)、OJK(金融適正性)、BPS(統計)、BMKG(気象・地震)、インドネシア中央銀行(為替レート)、IDX(株式)、CKAN公開データポータル、pasal.id(第三者法MCP)に対応しています。インドネシア政府データを活用したアプリ開発、.go.idウェブサイトのスクレイピング、ハラール認証の確認、企業の法的適正性の検証、金融機関ステータスの照会、またはインドネシアMCPサーバーへの接続時に使用できます。CSRF処理、CKAN API使用方法、IP制限回避など、すぐに実行可能なPythonパターンを含んでいます。