Agent Skills by ALSEL
Anthropic ClaudeLLM・AI開発⭐ リポ 0品質スコア 50/100

excel-data-analyzer

Excelファイルのデータ品質問題を特定し、フォーマットの不整合や欠損値を検出して、包括的な分析レポートを生成します。`.xlsx`・`.xls`形式のファイルに対してデータ品質の評価や構造分析を行う際、またユーザーがデータの監査・クリーニング提案・統計サマリーを必要とする場合に使用します。

description の原文を見る

Analyze messy and unstructured Excel files to identify data quality issues, detect format inconsistencies, find missing values, and generate comprehensive analysis reports. Use when Claude needs to work with Excel files (.xlsx, .xls) for data quality assessment, structure analysis, or when users request data auditing, cleaning recommendations, or statistical summaries of spreadsheet data.

SKILL.md 本文

Excel データアナライザー

概要

Excel ファイルを分析して、データ構造、品質問題、形式の不整合、統計パターンを識別します。データクリーニングと改善のための実行可能なインサイトを含む包括的なマークダウンレポートを生成します。

クイックスタート

1つのコマンドで任意の Excel ファイルを分析します:

cd /path/to/skill/scripts
bun install  # 初回のみ
bun run analyze_excel.ts /path/to/data.xlsx

出力: 完全な分析を含むマークダウンレポート (data_analysis.md)

主な機能

1. データ構造検出

以下を自動的に識別します:

  • 列名とデータ型 (整数、浮動小数点、文字列、日付、メール、ブール値、混合)
  • シートごとの行数と列数
  • 個別値のカウント
  • クイック確認用のサンプル値

2. データ品質分析

品質問題を検出します:

  • 欠損値: 列ごとの null の割合とカウント
  • 高欠損列: 50% を超える欠損データを持つ列にフラグを付与
  • 混合データ型: 型が不整合な列を識別
  • 形式問題: 先頭/末尾の空白、大文字小文字の不整合、数値文字列を検出

3. 統計サマリー

数値列の統計を生成:

  • 最小値、最大値、平均値、中央値、標準偏差
  • 外れ値検出: 3 標準偏差を超える値
  • 値の分布: 最頻出の上位 10 値とカウント

テキスト列の場合:

  • 最小/最大/平均長
  • 値の頻度分布

4. 品質スコアリング

以下に基づいて品質スコア (0-100) を割り当てます:

  • ヘッダーの欠損: -10 ポイント
  • 高欠損率の列: -15 ポイント
  • 形式の不整合: -10 ポイント
  • 重複する列名: -15 ポイント

5. マルチシートサポート

ワークブック内のすべてのシートを分析します:

  • シートごとの品質スコア
  • シート単位の列分析
  • ワークブック全体の品質スコア

使用方法

基本分析

bun run analyze_excel.ts data.xlsx

生成: data_analysis.md

カスタム出力パス

bun run analyze_excel.ts data.xlsx --output reports/audit.md

初回セットアップ

分析スクリプトを実行する前に:

cd /path/to/excel-data-analyzer/scripts
bun install

これにより必要な依存関係 (xlsx ライブラリ) がインストールされます。

ワークフロー

ユーザーが分析用に Excel ファイルを提供する場合:

  1. 分析スクリプトを実行 して提供されたファイルを処理
  2. 生成されたレポートを読む ことで調査結果を把握
  3. 主要な問題をサマリー してユーザーに提示:
    • 全体的な品質スコア
    • 最も重大な問題 (欠損値、形式の問題)
    • 注意が必要な列
  4. 分析に基づいた推奨事項を提供:
    • 調査すべき列
    • 推奨されるクリーニング戦略
    • 修正の優先度 (高/中/低)

レポート構造

生成されるマークダウンレポートに含まれます:

エグゼクティブサマリー

  • ファイルメタデータ (名前、サイズ、シート)
  • 全体的な品質スコア
  • 高レベルの調査結果

シート別分析

  • 寸法 (行 × 列)
  • 品質スコア
  • 検出された問題の一覧
  • 列分析テーブル (型、個別値、欠損 %、問題)

詳細列情報

各列について:

  • データ型の分類
  • 欠損値の統計
  • サンプル値
  • 形式問題 (存在する場合)
  • 統計サマリー (数値列)
  • 値の分布

一般的なデータの問題

高優先度の問題

混合データ型:

  • 列に数値、文字列、日付が混在
  • 適切な分析を阻止
  • 例: 123"abc"2023-01-15

高欠損率 (50% 以上):

  • 列に不十分なデータ
  • 削除または補完を検討

重複する列名:

  • 分析で曖昧性が生じる
  • 名前変更が必要

中優先度の問題

数値文字列:

  • テキストとして保存された数値: "123" の代わりに 123
  • 計算を阻止

形式の不整合:

  • 先頭/末尾の空白: " value "
  • 大文字小文字の不整合: "john""JOHN""John"
  • 混合日付形式: "2023-01-15""01/15/2023"

外れ値:

  • 3 標準偏差を超える値
  • エラーまたは特殊なケースを示す可能性
  • 調査が必要

低優先度の問題

ヘッダーの欠損:

  • 空の列名
  • システムの名前を生成 (Column_1、Column_2)

テキスト長の変動:

  • 文字列長の広い範囲
  • データ入力の不整合を示す可能性

高度なパターン

データ品質パターンと検出方法の詳細については、以下を参照してください:

references/analysis-patterns.md - 以下を含む包括的なガイド:

  • データ型の問題 (混合型、数値文字列、日付形式)
  • 欠損データパターン (高欠損 %、スパースデータ、プレースホルダー)
  • 形式の不整合 (空白、大文字小文字、区切り文字)
  • 統計的異常 (外れ値、歪んだ分布)
  • 構造的問題 (重複名、空行/列)
  • ドメイン固有パターン (メール、電話番号、日付)
  • エンコーディングの問題 (文字エンコーディング、Unicode)

珍しいパターンに遭遇する場合や、より深い分析戦略が必要な場合は、このリファレンスを参照してください。

出力の解釈

品質スコアの範囲

  • 90-100: 優秀 - 最小限の問題
  • 70-89: 良好 - 軽微な形式の問題
  • 50-69: 普通 - 重大な品質上の懸念
  • 50 未満: 不可 - 大きなデータの問題

修正の優先順位付け

  1. 最初: 構造的な問題に対処 (重複列、欠損ヘッダー)
  2. 次に: 高欠損値列を修正 (50% 以上)
  3. その次: 混合データ型を解決
  4. その後: 形式の不整合をクリーニング
  5. 最後: 外れ値を調査

パフォーマンス

大規模ファイルに最適化:

  • Bun ランタイム: 高速な JavaScript 実行
  • ストリーミング対応: 大規模データセットのためのメモリ効率
  • xlsx ライブラリ: 業界標準の Excel パース

典型的なパフォーマンス:

  • 小規模ファイル (<1MB): 1 秒未満
  • 中規模ファイル (1-100MB): 1-10 秒
  • 大規模ファイル (>100MB): 10-60 秒

制限事項

  • 分析レポートのみを生成 (データクリーニングは実行しません)
  • テキストベースの分析 (ビジネスコンテキストは解釈しません)
  • 統計手法は定量分析用の数値データを想定
  • 外れ値検出は単純な 3-シグマ規則を使用 (堅牢性の高い手法ではありません)

リソース

scripts/

analyze_excel.ts - メイン分析スクリプト (Bun/TypeScript)

  • xlsx ライブラリを使用した Excel ファイルのパース
  • データ型と品質問題の検出
  • 統計サマリーの生成
  • マークダウンレポートの作成

package.json - Bun 依存関係

  • xlsx: Excel ファイルパース

references/

analysis-patterns.md - データ品質パターンの包括的ガイド

  • 詳細な検出方法
  • 影響評価
  • 各問題タイプの推奨事項

assets/

report-template.md - マークダウンレポートテンプレート構造

  • 期待される出力形式を表示
  • レポートセクション理解のためのリファレンス

ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ

詳細情報

作者
mineru98
リポジトリ
mineru98/skills-store
ライセンス
MIT
最終更新
不明

Source: https://github.com/mineru98/skills-store / ライセンス: MIT

関連スキル

OpenAILLM・AI開発⭐ リポ 6,054

agent-browser

AI エージェント向けのブラウザ自動化 CLI です。ウェブサイトとの対話が必要な場合に使用します。ページ遷移、フォーム入力、ボタンクリック、スクリーンショット取得、データ抽出、ウェブアプリのテスト、ブラウザ操作の自動化など、あらゆるブラウザタスクに対応できます。「ウェブサイトを開く」「フォームに記入する」「ボタンをクリックする」「スクリーンショットを取得する」「ページからデータを抽出する」「このウェブアプリをテストする」「サイトにログインする」「ブラウザ操作を自動化する」といった要求や、プログラマティックなウェブ操作が必要なタスクで起動します。

by JimmyLv
汎用LLM・AI開発⭐ リポ 1,982

anyskill

AnySkill — あなたのプライベート・スキルクラウド。GitHubを基盤としたリポジトリからエージェントスキルを管理、同期、動的にロードできます。自然言語でクラウドスキルを検索し、オンデマンドでプロンプトを自動ロード、カスタムスキルのアップロードと共有、スキルバンドルの一括インストールが可能です。OpenClaw、Antigravity、Claude Code、Cursorに対応しています。

by LeoYeAI
汎用LLM・AI開発⭐ リポ 1,982

engram

AIエージェント向けの永続的なメモリシステムです。バグ修正、意思決定、発見、設定変更の後はmem_saveを使用してください。ユーザーが「覚えている」「記憶している」と言及した場合、または以前のセッションと重複する作業を開始する際はmem_searchを使用します。セッション終了前にmem_session_summaryを使用して、コンテキストを保持してください。

by LeoYeAI
汎用LLM・AI開発⭐ リポ 21,584

skyvern

AI駆動のブラウザ自動化により、任意のウェブサイトを自動化できます。フォーム入力、データ抽出、ファイルダウンロード、ログイン、複数ステップのワークフロー実行など、ユーザーがウェブサイトと連携する必要があるときに使用します。Skyvernは、LLMとコンピュータビジョンを活用して、未知のサイトも自動操作可能です。Python SDK、TypeScript SDK、REST API、MCPサーバー、またはCLIを通じて統合できます。

by Skyvern-AI
汎用LLM・AI開発⭐ リポ 1,149

pinchbench

PinchBenchベンチマークを実行して、OpenClawエージェントの実世界タスクにおけるパフォーマンスを評価できます。モデルの機能テスト、モデル間の比較、ベンチマーク結果のリーダーボード提出、またはOpenClawのセットアップがカレンダー、メール、リサーチ、コーディング、複数ステップのワークフローにどの程度対応しているかを確認する際に使用します。

by pinchbench
汎用LLM・AI開発⭐ リポ 4,693

openui

OpenUIとOpenUI Langを使用してジェネレーティブUIアプリを構築できます。これらはLLM生成インターフェースのためのトークン効率的なオープン標準です。OpenUI、@openuidev、ジェネレーティブUI、LLMからのストリーミングUI、AI向けコンポーネントライブラリ、またはjson-render/A2UIの置き換えについて述べる際に使用します。スキャフォルディング、defineComponent、システムプロンプト、Renderer、およびOpenUI Lang出力のデバッグに対応しています。

by thesysdev
本サイトは GitHub 上で公開されているオープンソースの SKILL.md ファイルをクロール・インデックス化したものです。 各スキルの著作権は原作者に帰属します。掲載に問題がある場合は info@alsel.co.jp または /takedown フォームよりご連絡ください。
原作者: mineru98 · mineru98/skills-store · ライセンス: MIT