Anthropic ClaudeLLM・AI開発⭐ リポ 0品質スコア 50/100

instrument-data-to-allotrope

Name: instrument-data-to-allotrope
Author: anthropics

実験機器の出力ファイル（PDF、CSV、Excel、TXT）をAllotrope Simple Model（ASM）JSON形式またはフラット化した2D CSVに変換します。LIMSシステム・データレイク・下流解析向けにデータを標準化したい研究者向けのスキルで、機器の種類を自動検出し、完全なASM JSON・インポート用フラットCSV・データエンジニア向けのPythonコードを出力します。機器ファイルの変換、ラボデータの標準化、LIMS/ELNへのアップロード準備、本番パイプライン用パーサーコードの生成などの場面で活用できます。

description の原文を見る

Convert laboratory instrument output files (PDF, CSV, Excel, TXT) to Allotrope Simple Model (ASM) JSON format or flattened 2D CSV. Use this skill when scientists need to standardize instrument data for LIMS systems, data lakes, or downstream analysis. Supports auto-detection of instrument types. Outputs include full ASM JSON, flattened CSV for easy import, and exportable Python code for data engineers. Common triggers include converting instrument files, standardizing lab data, preparing data for upload to LIMS/ELN systems, or generating parser code for production pipelines.

SKILL.md 本文

計測機器データ to Allotrope コンバーター

計測機器ファイルを標準化された Allotrope Simple Model (ASM) 形式に変換します。LIMS アップロード、データレイク、またはデータエンジニアリングチームへのハンドオフに対応します。

注記：これはスキルの例です

このスキルは、スキルがデータエンジニアリングタスク（スキーマ変換の自動化、計測機器出力の解析、本番対応コードの生成）をどのようにサポートできるかを示しています。

組織に合わせてカスタマイズするには：

references/ ファイルを変更して、企業固有のスキーマまたはオントロジーマッピングを含める

MCP サーバーを使用して、スキーマを定義するシステムに接続する（例：LIMS、データカタログ、スキーマレジストリ）

scripts/ を拡張して、独自形式の計測機器や社内データ標準に対応させる

このパターンは、形式間の変換や組織標準との検証が必要なあらゆるデータ変換ワークフローに適用できます。

ワークフロー概要

計測機器タイプを検出 ファイルコンテンツから（自動検出またはユーザー指定）
ファイルを解析 allotropy ライブラリ（ネイティブ）または柔軟なフォールバックパーサーを使用
出力を生成：
- ASM JSON（完全なセマンティック構造）
- フラット化CSV（2D表形式）
- Python パーサーコード（データエンジニアへのハンドオフ用）
ファイルを配信 概要と使用方法の説明付き

不確定な場合： ASM へのフィールドマッピングに確信が持てない場合（例：これは生データか計算済みか？デバイス設定か環境条件か？）、ユーザーに説明を求めてください。references/field_classification_guide.md を参考にしてください。曖昧さが残る場合は、推測するのではなくユーザーに確認してください。

クイックスタート

# 最初に必要パッケージをインストール
pip install allotropy pandas openpyxl pdfplumber --break-system-packages

# コアの変換処理
from allotropy.parser_factory import Vendor
from allotropy.to_allotrope import allotrope_from_file

# allotropy で変換
asm = allotrope_from_file("instrument_data.csv", Vendor.BECKMAN_VI_CELL_BLU)

出力形式の選択

ASM JSON（デフォルト） - オントロジー URI 付きの完全なセマンティック構造

用途：ASM が必要な LIMS システム、データレイク、長期保存
Allotrope スキーマに対して検証

フラット化CSV - 2D表形式

用途：クイック分析、Excel ユーザー、JSON をサポートしていないシステム
各測定値が1行となり、メタデータが繰り返される

両方 - 最大限の柔軟性のため両形式を生成

計算済みデータの処理

重要： 生測定値から計算済み/導出値を分離してください。

生データ → measurement-document（直接的な計測機器の読み取り値）
計算済みデータ → calculated-data-aggregate-document（導出値）

計算済み値は data-source-aggregate-document 経由でのトレーサビリティを含める必要があります：

"calculated-data-aggregate-document": {
  "calculated-data-document": [{
    "calculated-data-identifier": "SAMPLE_B1_DIN_001",
    "calculated-data-name": "DNA integrity number",
    "calculated-result": {"value": 9.5, "unit": "(unitless)"},
    "data-source-aggregate-document": {
      "data-source-document": [{
        "data-source-identifier": "SAMPLE_B1_MEASUREMENT",
        "data-source-feature": "electrophoresis trace"
      }]
    }
  }]
}

計測機器タイプ別の一般的な計算フィールド：

計測機器	計算フィールド
セルカウンター	Viability %、セル密度、希釈調整値
分光光度計	濃度（吸光度から）、260/280 比
プレートリーダー	標準曲線からの濃度、%CV
電気泳動	DIN/RIN、領域濃度、平均サイズ
qPCR	相対定量、変動倍率

生 vs 計算の分類について詳細なガイダンスは references/field_classification_guide.md を参照してください。

検証

ユーザーに配信する前に必ず ASM 出力を検証してください：

python scripts/validate_asm.py output.json
python scripts/validate_asm.py output.json --reference known_good.json  # 参照と比較
python scripts/validate_asm.py output.json --strict  # 警告をエラーとして扱う

検証ルール：

Allotrope ASM 仕様に基づく（2024年12月）
最終更新：2026-01-07
ソース：https://gitlab.com/allotrope-public/asm

ソフト検証アプローチ： 不明な技術、単位、またはサンプルロールは警告（エラーではなく）を生成し、前方互換性を許容します。2024年12月以降に Allotrope が新しい値を追加した場合、バリデーターはそれをブロックしません。手動確認用にフラグを立てます。厳密な検証が必要な場合は --strict モードを使用して警告をエラーとして扱ってください。

チェック内容：

正しいテクニックの選択（例：多成分プロファイリング vs プレートリーダー）
フィールド命名規約（スペース区切り、ハイフンなし）
計算済みデータにトレーサビリティあり（data-source-aggregate-document）
測定値と計算済み値の一意の識別子が存在
必須メタデータの存在
有効な単位とサンプルロール（不明な値に対してはソフト検証）

サポートされている計測機器

完全なリストは references/supported_instruments.md を参照してください。主な計測機器：

カテゴリ	計測機器
セルカウント	Vi-CELL BLU、Vi-CELL XR、NucleoCounter
分光光度測定	NanoDrop One/Eight/8000、Lunatic
プレートリーダー	SoftMax Pro、EnVision、Gen5、CLARIOstar
ELISA	SoftMax Pro、BMG MARS、MSD Workbench
qPCR	QuantStudio、Bio-Rad CFX
クロマトグラフィー	Empower、Chromeleon

検出と解析戦略

Tier 1：ネイティブ allotropy 解析（推奨）

常に allotropy を最初に試してください。 利用可能なベンダーを直接確認：

from allotropy.parser_factory import Vendor

# サポートされているすべてのベンダーをリスト表示
for v in Vendor:
    print(f"{v.name}")

# 一般的なベンダー：
# AGILENT_TAPESTATION_ANALYSIS  (TapeStation XML 用)
# BECKMAN_VI_CELL_BLU
# THERMO_FISHER_NANODROP_EIGHT
# MOLDEV_SOFTMAX_PRO
# APPBIO_QUANTSTUDIO
# ... その他多数

ユーザーがファイルを提供したら、フォールバック解析に落とす前に allotropy がそれをサポートしているか確認してください。 scripts/convert_to_asm.py の自動検出は allotropy ベンダーのサブセットのみをカバーしています。

Tier 2：柔軟なフォールバック解析

allotropy が計測機器をサポートしていない場合のみ使用してください。 このフォールバック：

calculated-data-aggregate-document を生成しない
完全なトレーサビリティを含まない
簡略化された ASM 構造を生成

柔軟パーサーを使用：

カラム名のあいまいマッチング
ヘッダーからの単位抽出
ファイル構造からのメタデータ抽出

Tier 3：PDF 抽出

PDF のみのファイルの場合、pdfplumber を使用してテーブルを抽出し、Tier 2 解析を適用します。

解析前チェックリスト

カスタムパーサーを作成する前に、必ず以下を実施してください：

allotropy がサポートしているかチェック - サポート済みの場合はネイティブパーサーを使用
参照 ASM ファイルを探す - references/examples/ をチェックするか、ユーザーに依頼
計測機器固有ガイドを確認 - references/instrument_guides/ をチェック
参照に対して検証 - validate_asm.py --reference <file> を実行

避けるべき一般的なミス

ミス	正しいアプローチ
Manifest をオブジェクトとして記述	URL 文字列を使用
小文字の検出タイプ	"absorbance" ではなく "Absorbance" を使用
"emission wavelength setting"	発光用には "detector wavelength setting" を使用
すべての測定を1つのドキュメントに	ウェル/サンプルロケーション別にグループ化
手順メタデータの欠落	測定ごとに ALL デバイス設定を抽出

データエンジニア向けコード出力

科学者が引き継ぎできるスタンドアロン Python スクリプトを生成：

# パーサーコードをエクスポート
python scripts/export_parser.py --input "data.csv" --vendor "VI_CELL_BLU" --output "parser_script.py"

エクスポートされたスクリプト：

pandas/allotropy を超える外部依存なし
インラインドキュメント付き
Jupyter ノートブックで実行可能
データパイプライン用の本番対応

ファイル構造

instrument-data-to-allotrope/
├── SKILL.md                          # このファイル
├── scripts/
│   ├── convert_to_asm.py            # メイン変換スクリプト
│   ├── flatten_asm.py               # ASM → 2D CSV 変換
│   ├── export_parser.py             # スタンドアロンパーサーコード生成
│   └── validate_asm.py              # ASM 出力品質を検証
└── references/
    ├── supported_instruments.md     # Vendor enum 付きの完全な計測機器リスト
    ├── asm_schema_overview.md       # ASM 構造のリファレンス
    ├── field_classification_guide.md # 異なるフィールドタイプの配置場所
    └── flattening_guide.md          # フラット化の仕組み

使用例

例1：Vi-CELL BLU ファイル

ユーザー：「このセルカウントデータを Allotrope 形式に変換してください」
[viCell_Results.xlsx をアップロード]

Claude：
1. Vi-CELL BLU を検出（信頼度95%）
2. allotropy ネイティブパーサーを使用して変換
3. 出力：
   - viCell_Results_asm.json（完全な ASM）
   - viCell_Results_flat.csv（2D 形式）
   - viCell_parser.py（エクスポート可能なコード）

例2：コードハンドオフのリクエスト

ユーザー：「NanoDrop ファイルを解析するコードをデータエンジニアに提供する必要があります」

Claude：
1. 自己完結型の Python スクリプトを生成
2. サンプル入出力を含める
3. すべての前提条件を文書化
4. Jupyter ノートブック版を提供

例3：LIMS 対応フラット化出力

ユーザー：「この ELISA データを LIMS にアップロードできる CSV に変換してください」

Claude：
1. プレートリーダーデータを解析
2. 以下のカラムを含むフラット化CSV を生成：
   - sample_identifier、well_position、measurement_value、measurement_unit
   - instrument_serial_number、analysis_datetime、assay_type
3. 一般的な LIMS インポート要件に対して検証

実装メモ

allotropy のインストール

pip install allotropy --break-system-packages

解析失敗の処理

allotropy ネイティブ解析が失敗した場合：

デバッグ用にエラーをログ出力
柔軟パーサーにフォールバック
メタデータ完全性の低下をユーザーに報告
計測機器から別の形式でエクスポートすることを提案

ASM スキーマ検証

利用可能な場合、Allotrope スキーマに対して出力を検証：

import jsonschema
# スキーマ URL は references/asm_schema_overview.md にあります

ライセンス: Apache-2.0(寛容ライセンスのため全文を引用しています) · 原本リポジトリ

詳細情報

作者: anthropics
リポジトリ: anthropics/knowledge-work-plugins
ライセンス: Apache-2.0
最終更新: 不明

GitHubで原本を見る →フィードバックを送る

Source: https://github.com/anthropics/knowledge-work-plugins / ライセンス: Apache-2.0