Agent Skills by ALSEL
Anthropic ClaudeLLM・AI開発⭐ リポ 0品質スコア 50/100

instrument-data-to-allotrope

実験機器の出力ファイル(PDF、CSV、Excel、TXT)をAllotrope Simple Model(ASM)JSON形式またはフラット化した2D CSVに変換します。LIMSシステム・データレイク・下流解析向けにデータを標準化したい研究者向けのスキルで、機器の種類を自動検出し、完全なASM JSON・インポート用フラットCSV・データエンジニア向けのPythonコードを出力します。機器ファイルの変換、ラボデータの標準化、LIMS/ELNへのアップロード準備、本番パイプライン用パーサーコードの生成などの場面で活用できます。

description の原文を見る

Convert laboratory instrument output files (PDF, CSV, Excel, TXT) to Allotrope Simple Model (ASM) JSON format or flattened 2D CSV. Use this skill when scientists need to standardize instrument data for LIMS systems, data lakes, or downstream analysis. Supports auto-detection of instrument types. Outputs include full ASM JSON, flattened CSV for easy import, and exportable Python code for data engineers. Common triggers include converting instrument files, standardizing lab data, preparing data for upload to LIMS/ELN systems, or generating parser code for production pipelines.

SKILL.md 本文

計測機器データ to Allotrope コンバーター

計測機器ファイルを標準化された Allotrope Simple Model (ASM) 形式に変換します。LIMS アップロード、データレイク、またはデータエンジニアリングチームへのハンドオフに対応します。

注記:これはスキルの例です

このスキルは、スキルがデータエンジニアリングタスク(スキーマ変換の自動化、計測機器出力の解析、本番対応コードの生成)をどのようにサポートできるかを示しています。

組織に合わせてカスタマイズするには:

  • references/ ファイルを変更して、企業固有のスキーマまたはオントロジーマッピングを含める
  • MCP サーバーを使用して、スキーマを定義するシステムに接続する(例:LIMS、データカタログ、スキーマレジストリ)
  • scripts/ を拡張して、独自形式の計測機器や社内データ標準に対応させる

このパターンは、形式間の変換や組織標準との検証が必要なあらゆるデータ変換ワークフローに適用できます。

ワークフロー概要

  1. 計測機器タイプを検出 ファイルコンテンツから(自動検出またはユーザー指定)
  2. ファイルを解析 allotropy ライブラリ(ネイティブ)または柔軟なフォールバックパーサーを使用
  3. 出力を生成
    • ASM JSON(完全なセマンティック構造)
    • フラット化CSV(2D表形式)
    • Python パーサーコード(データエンジニアへのハンドオフ用)
  4. ファイルを配信 概要と使用方法の説明付き

不確定な場合: ASM へのフィールドマッピングに確信が持てない場合(例:これは生データか計算済みか?デバイス設定か環境条件か?)、ユーザーに説明を求めてください。references/field_classification_guide.md を参考にしてください。曖昧さが残る場合は、推測するのではなくユーザーに確認してください。

クイックスタート

# 最初に必要パッケージをインストール
pip install allotropy pandas openpyxl pdfplumber --break-system-packages

# コアの変換処理
from allotropy.parser_factory import Vendor
from allotropy.to_allotrope import allotrope_from_file

# allotropy で変換
asm = allotrope_from_file("instrument_data.csv", Vendor.BECKMAN_VI_CELL_BLU)

出力形式の選択

ASM JSON(デフォルト) - オントロジー URI 付きの完全なセマンティック構造

  • 用途:ASM が必要な LIMS システム、データレイク、長期保存
  • Allotrope スキーマに対して検証

フラット化CSV - 2D表形式

  • 用途:クイック分析、Excel ユーザー、JSON をサポートしていないシステム
  • 各測定値が1行となり、メタデータが繰り返される

両方 - 最大限の柔軟性のため両形式を生成

計算済みデータの処理

重要: 生測定値から計算済み/導出値を分離してください。

  • 生データmeasurement-document(直接的な計測機器の読み取り値)
  • 計算済みデータcalculated-data-aggregate-document(導出値)

計算済み値は data-source-aggregate-document 経由でのトレーサビリティを含める必要があります:

"calculated-data-aggregate-document": {
  "calculated-data-document": [{
    "calculated-data-identifier": "SAMPLE_B1_DIN_001",
    "calculated-data-name": "DNA integrity number",
    "calculated-result": {"value": 9.5, "unit": "(unitless)"},
    "data-source-aggregate-document": {
      "data-source-document": [{
        "data-source-identifier": "SAMPLE_B1_MEASUREMENT",
        "data-source-feature": "electrophoresis trace"
      }]
    }
  }]
}

計測機器タイプ別の一般的な計算フィールド:

計測機器計算フィールド
セルカウンターViability %、セル密度、希釈調整値
分光光度計濃度(吸光度から)、260/280 比
プレートリーダー標準曲線からの濃度、%CV
電気泳動DIN/RIN、領域濃度、平均サイズ
qPCR相対定量、変動倍率

生 vs 計算の分類について詳細なガイダンスは references/field_classification_guide.md を参照してください。

検証

ユーザーに配信する前に必ず ASM 出力を検証してください:

python scripts/validate_asm.py output.json
python scripts/validate_asm.py output.json --reference known_good.json  # 参照と比較
python scripts/validate_asm.py output.json --strict  # 警告をエラーとして扱う

検証ルール:

ソフト検証アプローチ: 不明な技術、単位、またはサンプルロールは警告(エラーではなく)を生成し、前方互換性を許容します。2024年12月以降に Allotrope が新しい値を追加した場合、バリデーターはそれをブロックしません。手動確認用にフラグを立てます。厳密な検証が必要な場合は --strict モードを使用して警告をエラーとして扱ってください。

チェック内容:

  • 正しいテクニックの選択(例:多成分プロファイリング vs プレートリーダー)
  • フィールド命名規約(スペース区切り、ハイフンなし)
  • 計算済みデータにトレーサビリティあり(data-source-aggregate-document
  • 測定値と計算済み値の一意の識別子が存在
  • 必須メタデータの存在
  • 有効な単位とサンプルロール(不明な値に対してはソフト検証)

サポートされている計測機器

完全なリストは references/supported_instruments.md を参照してください。主な計測機器:

カテゴリ計測機器
セルカウントVi-CELL BLU、Vi-CELL XR、NucleoCounter
分光光度測定NanoDrop One/Eight/8000、Lunatic
プレートリーダーSoftMax Pro、EnVision、Gen5、CLARIOstar
ELISASoftMax Pro、BMG MARS、MSD Workbench
qPCRQuantStudio、Bio-Rad CFX
クロマトグラフィーEmpower、Chromeleon

検出と解析戦略

Tier 1:ネイティブ allotropy 解析(推奨)

常に allotropy を最初に試してください。 利用可能なベンダーを直接確認:

from allotropy.parser_factory import Vendor

# サポートされているすべてのベンダーをリスト表示
for v in Vendor:
    print(f"{v.name}")

# 一般的なベンダー:
# AGILENT_TAPESTATION_ANALYSIS  (TapeStation XML 用)
# BECKMAN_VI_CELL_BLU
# THERMO_FISHER_NANODROP_EIGHT
# MOLDEV_SOFTMAX_PRO
# APPBIO_QUANTSTUDIO
# ... その他多数

ユーザーがファイルを提供したら、フォールバック解析に落とす前に allotropy がそれをサポートしているか確認してください。 scripts/convert_to_asm.py の自動検出は allotropy ベンダーのサブセットのみをカバーしています。

Tier 2:柔軟なフォールバック解析

allotropy が計測機器をサポートしていない場合のみ使用してください。 このフォールバック:

  • calculated-data-aggregate-document を生成しない
  • 完全なトレーサビリティを含まない
  • 簡略化された ASM 構造を生成

柔軟パーサーを使用:

  • カラム名のあいまいマッチング
  • ヘッダーからの単位抽出
  • ファイル構造からのメタデータ抽出

Tier 3:PDF 抽出

PDF のみのファイルの場合、pdfplumber を使用してテーブルを抽出し、Tier 2 解析を適用します。

解析前チェックリスト

カスタムパーサーを作成する前に、必ず以下を実施してください:

  1. allotropy がサポートしているかチェック - サポート済みの場合はネイティブパーサーを使用
  2. 参照 ASM ファイルを探す - references/examples/ をチェックするか、ユーザーに依頼
  3. 計測機器固有ガイドを確認 - references/instrument_guides/ をチェック
  4. 参照に対して検証 - validate_asm.py --reference <file> を実行

避けるべき一般的なミス

ミス正しいアプローチ
Manifest をオブジェクトとして記述URL 文字列を使用
小文字の検出タイプ"absorbance" ではなく "Absorbance" を使用
"emission wavelength setting"発光用には "detector wavelength setting" を使用
すべての測定を1つのドキュメントにウェル/サンプルロケーション別にグループ化
手順メタデータの欠落測定ごとに ALL デバイス設定を抽出

データエンジニア向けコード出力

科学者が引き継ぎできるスタンドアロン Python スクリプトを生成:

# パーサーコードをエクスポート
python scripts/export_parser.py --input "data.csv" --vendor "VI_CELL_BLU" --output "parser_script.py"

エクスポートされたスクリプト:

  • pandas/allotropy を超える外部依存なし
  • インラインドキュメント付き
  • Jupyter ノートブックで実行可能
  • データパイプライン用の本番対応

ファイル構造

instrument-data-to-allotrope/
├── SKILL.md                          # このファイル
├── scripts/
│   ├── convert_to_asm.py            # メイン変換スクリプト
│   ├── flatten_asm.py               # ASM → 2D CSV 変換
│   ├── export_parser.py             # スタンドアロンパーサーコード生成
│   └── validate_asm.py              # ASM 出力品質を検証
└── references/
    ├── supported_instruments.md     # Vendor enum 付きの完全な計測機器リスト
    ├── asm_schema_overview.md       # ASM 構造のリファレンス
    ├── field_classification_guide.md # 異なるフィールドタイプの配置場所
    └── flattening_guide.md          # フラット化の仕組み

使用例

例1:Vi-CELL BLU ファイル

ユーザー:「このセルカウントデータを Allotrope 形式に変換してください」
[viCell_Results.xlsx をアップロード]

Claude:
1. Vi-CELL BLU を検出(信頼度95%)
2. allotropy ネイティブパーサーを使用して変換
3. 出力:
   - viCell_Results_asm.json(完全な ASM)
   - viCell_Results_flat.csv(2D 形式)
   - viCell_parser.py(エクスポート可能なコード)

例2:コードハンドオフのリクエスト

ユーザー:「NanoDrop ファイルを解析するコードをデータエンジニアに提供する必要があります」

Claude:
1. 自己完結型の Python スクリプトを生成
2. サンプル入出力を含める
3. すべての前提条件を文書化
4. Jupyter ノートブック版を提供

例3:LIMS 対応フラット化出力

ユーザー:「この ELISA データを LIMS にアップロードできる CSV に変換してください」

Claude:
1. プレートリーダーデータを解析
2. 以下のカラムを含むフラット化CSV を生成:
   - sample_identifier、well_position、measurement_value、measurement_unit
   - instrument_serial_number、analysis_datetime、assay_type
3. 一般的な LIMS インポート要件に対して検証

実装メモ

allotropy のインストール

pip install allotropy --break-system-packages

解析失敗の処理

allotropy ネイティブ解析が失敗した場合:

  1. デバッグ用にエラーをログ出力
  2. 柔軟パーサーにフォールバック
  3. メタデータ完全性の低下をユーザーに報告
  4. 計測機器から別の形式でエクスポートすることを提案

ASM スキーマ検証

利用可能な場合、Allotrope スキーマに対して出力を検証:

import jsonschema
# スキーマ URL は references/asm_schema_overview.md にあります

ライセンス: Apache-2.0(寛容ライセンスのため全文を引用しています) · 原本リポジトリ

詳細情報

作者
anthropics
リポジトリ
anthropics/knowledge-work-plugins
ライセンス
Apache-2.0
最終更新
不明

Source: https://github.com/anthropics/knowledge-work-plugins / ライセンス: Apache-2.0

関連スキル

OpenAILLM・AI開発⭐ リポ 6,054

agent-browser

AI エージェント向けのブラウザ自動化 CLI です。ウェブサイトとの対話が必要な場合に使用します。ページ遷移、フォーム入力、ボタンクリック、スクリーンショット取得、データ抽出、ウェブアプリのテスト、ブラウザ操作の自動化など、あらゆるブラウザタスクに対応できます。「ウェブサイトを開く」「フォームに記入する」「ボタンをクリックする」「スクリーンショットを取得する」「ページからデータを抽出する」「このウェブアプリをテストする」「サイトにログインする」「ブラウザ操作を自動化する」といった要求や、プログラマティックなウェブ操作が必要なタスクで起動します。

by JimmyLv
汎用LLM・AI開発⭐ リポ 1,982

anyskill

AnySkill — あなたのプライベート・スキルクラウド。GitHubを基盤としたリポジトリからエージェントスキルを管理、同期、動的にロードできます。自然言語でクラウドスキルを検索し、オンデマンドでプロンプトを自動ロード、カスタムスキルのアップロードと共有、スキルバンドルの一括インストールが可能です。OpenClaw、Antigravity、Claude Code、Cursorに対応しています。

by LeoYeAI
汎用LLM・AI開発⭐ リポ 1,982

engram

AIエージェント向けの永続的なメモリシステムです。バグ修正、意思決定、発見、設定変更の後はmem_saveを使用してください。ユーザーが「覚えている」「記憶している」と言及した場合、または以前のセッションと重複する作業を開始する際はmem_searchを使用します。セッション終了前にmem_session_summaryを使用して、コンテキストを保持してください。

by LeoYeAI
汎用LLM・AI開発⭐ リポ 21,584

skyvern

AI駆動のブラウザ自動化により、任意のウェブサイトを自動化できます。フォーム入力、データ抽出、ファイルダウンロード、ログイン、複数ステップのワークフロー実行など、ユーザーがウェブサイトと連携する必要があるときに使用します。Skyvernは、LLMとコンピュータビジョンを活用して、未知のサイトも自動操作可能です。Python SDK、TypeScript SDK、REST API、MCPサーバー、またはCLIを通じて統合できます。

by Skyvern-AI
汎用LLM・AI開発⭐ リポ 1,149

pinchbench

PinchBenchベンチマークを実行して、OpenClawエージェントの実世界タスクにおけるパフォーマンスを評価できます。モデルの機能テスト、モデル間の比較、ベンチマーク結果のリーダーボード提出、またはOpenClawのセットアップがカレンダー、メール、リサーチ、コーディング、複数ステップのワークフローにどの程度対応しているかを確認する際に使用します。

by pinchbench
汎用LLM・AI開発⭐ リポ 4,693

openui

OpenUIとOpenUI Langを使用してジェネレーティブUIアプリを構築できます。これらはLLM生成インターフェースのためのトークン効率的なオープン標準です。OpenUI、@openuidev、ジェネレーティブUI、LLMからのストリーミングUI、AI向けコンポーネントライブラリ、またはjson-render/A2UIの置き換えについて述べる際に使用します。スキャフォルディング、defineComponent、システムプロンプト、Renderer、およびOpenUI Lang出力のデバッグに対応しています。

by thesysdev
本サイトは GitHub 上で公開されているオープンソースの SKILL.md ファイルをクロール・インデックス化したものです。 各スキルの著作権は原作者に帰属します。掲載に問題がある場合は info@alsel.co.jp または /takedown フォームよりご連絡ください。
原作者: anthropics · anthropics/knowledge-work-plugins · ライセンス: Apache-2.0