Anthropic Claudeデータ・分析⭐ リポ 0品質スコア 50/100

csv-data-visualizer

Name: csv-data-visualizer
Author: ailabs-393

CSVファイルを読み込み、インタラクティブなグラフの作成、統計プロットの生成、データ分布の分析、ダッシュボードの構築、自動データプロファイリングを行う際に使用するスキルです。Plotlyを活用した探索的データ分析のための包括的なツールを提供します。

description の原文を見る

This skill should be used when working with CSV files to create interactive data visualizations, generate statistical plots, analyze data distributions, create dashboards, or perform automatic data profiling. It provides comprehensive tools for exploratory data analysis using Plotly for interactive visualizations.

SKILL.md 本文

CSV Data Visualizer

Overview

このスキルは CSV ファイルの包括的なデータ可視化と分析を実現します。主な機能は 3 つです：(1) Plotly を使用した個別のインタラクティブな可視化の作成、(2) 統計的サマリーを含む自動データプロファイリング、(3) マルチプロットダッシュボードの生成。このスキルは探索的データ分析、統計レポート、およびプレゼンテーション対応の可視化の作成に最適化されています。

When to Use This Skill

以下のリクエストがある場合にこのスキルを使用してください：

「この CSV データを可視化してください」
「このデータからヒストグラム/散布図/箱ひげ図を作成してください」
「[列名] の分布を表示してください」
「このデータセット用のダッシュボードを生成してください」
「この CSV ファイルをプロファイリング/分析してください」
「相関ヒートマップを作成してください」
「時系列トレンドを表示してください」
「[変数] を [カテゴリ] で比較してください」

Core Capabilities

1. Individual Visualizations

visualize_csv.py スクリプトを使用して、詳細な分析用に特定のチャートタイプを作成します。

Available Chart Types:

Statistical Plots:

# Histogram - 数値データの分布
python3 scripts/visualize_csv.py data.csv --histogram column_name --bins 30

# Box plot - 四分位数と外れ値を表示
python3 scripts/visualize_csv.py data.csv --boxplot column_name

# カテゴリでグループ化した箱ひげ図
python3 scripts/visualize_csv.py data.csv --boxplot salary --group-by department

# Violin plot - 確率密度を含む分布
python3 scripts/visualize_csv.py data.csv --violin column_name --group-by category

Relationship Analysis:

# 自動トレンドライン付き散布図
python3 scripts/visualize_csv.py data.csv --scatter height weight

# 色とサイズでエンコードされた散布図
python3 scripts/visualize_csv.py data.csv --scatter x y --color category --size value

# すべての数値列の相関ヒートマップ
python3 scripts/visualize_csv.py data.csv --correlation

Time Series:

# 単一変数の折れ線グラフ
python3 scripts/visualize_csv.py data.csv --line date sales

# 同じチャート上の複数変数
python3 scripts/visualize_csv.py data.csv --line date "sales,revenue,profit"

Categorical Data:

# 棒グラフ (自動的にカテゴリをカウント)
python3 scripts/visualize_csv.py data.csv --bar category

# 円グラフ (構成)
python3 scripts/visualize_csv.py data.csv --pie region

Output Formats: 出力ファイルを希望する形式の拡張子で指定：

# インタラクティブ HTML (デフォルト)
python3 scripts/visualize_csv.py data.csv --histogram age -o output.html

# 静止画形式
python3 scripts/visualize_csv.py data.csv --scatter x y -o plot.png
python3 scripts/visualize_csv.py data.csv --correlation -o heatmap.pdf
python3 scripts/visualize_csv.py data.csv --bar category -o chart.svg

2. Automatic Data Profiling

data_profile.py スクリプトを使用して、包括的なデータ品質と統計レポートを生成します。

Text Report (デフォルト):

python3 scripts/data_profile.py data.csv

HTML Report:

python3 scripts/data_profile.py data.csv -f html -o report.html

JSON Report:

python3 scripts/data_profile.py data.csv -f json -o profile.json

What the Profiler Provides:

ファイル情報 (サイズ、寸法)
データセット概要 (形状、メモリ使用量、重複)
列ごとの分析 (型、欠落データ、ユニーク値)
欠落データパターンと完全性
数値列の統計サマリー (平均、標準偏差、四分位数、歪度、尖度)
カテゴリ列の分析 (頻度カウント、最頻値・最小頻値)
データ品質チェック (高い欠落率、重複行、定数列、高いカーディナリティ)

When to Use Profiling: 以下の場合、可視化を作成する前に常にデータプロファイリングを実行することを推奨してください：

ユーザーがデータセットに不慣れな場合
データ品質が不明な場合
適切な可視化タイプを特定する必要がある場合
初めてデータセットを探索する場合

3. Multi-Plot Dashboards

create_dashboard.py スクリプトを使用して、複数の可視化を含む包括的なダッシュボードを作成します。

Automatic Dashboard: データ型を分析し、自動的に適切な可視化を作成：

python3 scripts/create_dashboard.py data.csv

カスタム出力ロケーション：

python3 scripts/create_dashboard.py data.csv -o my_dashboard.html

プロット数を制御：

python3 scripts/create_dashboard.py data.csv --max-plots 9

Custom Dashboard from Config: 正確なプロットを指定する JSON 設定ファイルを作成：

python3 scripts/create_dashboard.py data.csv --config config.json

Dashboard Config Format:

{
  "title": "Sales Analysis Dashboard",
  "plots": [
    {"type": "histogram", "column": "revenue"},
    {"type": "box", "column": "revenue", "group_by": "region"},
    {"type": "scatter", "column": "advertising", "group_by": "revenue"},
    {"type": "bar", "column": "product_category"},
    {"type": "correlation"}
  ]
}

Dashboard Plot Types:

histogram: 数値列の分布
box: 箱ひげ図、オプションでカテゴリでグループ化
scatter: 2 つの数値列の関係
bar: カテゴリ値のカウント
correlation: 数値相関のヒートマップ

Workflow Decision Tree

以下のデシジョンツリーを使用して、適切なアプローチを決定します：

ユーザーが CSV ファイルを提供
│
├─ 「このデータをプロファイリング」 / 「このデータを分析」 / 不慣れなデータセット
│  └─> まず data_profile.py を実行
│     その後、調査結果に基づいて可視化オプションを提供
│
├─ 「ダッシュボードを作成」 / 「データの概要」 / 複数の可視化が必要
│  ├─ ユーザーが希望するプロットが明確
│  │  └─> JSON 設定を作成 → 設定付きで create_dashboard.py を実行
│  └─ ユーザーが自動ダッシュボードを望む
│     └─> create_dashboard.py を実行 (自動モード)
│
└─ 特定の可視化をリクエスト (「ヒストグラム」「散布図」など)
   └─> 適切なフラグを使用して visualize_csv.py を実行

Best Practices

Starting Analysis

不慣れなデータセットの場合は常にプロファイリングを実行: python3 scripts/data_profile.py data.csv
プロファイリング出力を確認して以下を把握：
- 列のデータ型と範囲
- 欠落データパターン
- データ品質の問題
- 統計分布

Choosing Visualizations

詳細なガイダンスは references/visualization_guide.md を参照してください。クイックリファレンス：

Distribution: ヒストグラム、箱ひげ図、バイオリンプロット
Relationship: 散布図、相関ヒートマップ
Time series: 折れ線グラフ
Categories: 棒グラフ (推奨) または円グラフ (控えめに使用)
Comparison: カテゴリでグループ化された箱ひげ図

Creating Dashboards

自動ダッシュボード: 初期探索に最適
カスタムダッシュボード: プレゼンテーションまたは特定の分析目標に適している
プロット数を制限: 可読性のために 6～9 個に限定
論理的グループ化: 関連する可視化を一緒にグループ化

Output Considerations

HTML: インタラクティブな探索に最適 (ズーム、パン、ホバーツールチップ)
PNG/PDF: レポートとプレゼンテーションに最適
SVG: ベクトルグラフィックスを必要とする出版物に最適

Dependencies

スクリプトには以下の Python パッケージが必要です：

pip install pandas plotly numpy

静止画エクスポート (PNG、PDF、SVG) を使用する場合は、以下もインストールしてください：

pip install kaleido

Example Workflows

Exploratory Data Analysis

# 1. データをプロファイリング
python3 scripts/data_profile.py sales_data.csv -f html -o profile.html

# 2. 自動ダッシュボードを作成
python3 scripts/create_dashboard.py sales_data.csv -o dashboard.html

# 3. 特定のプロットでより深く掘り下げる
python3 scripts/visualize_csv.py sales_data.csv --scatter price sales --color region
python3 scripts/visualize_csv.py sales_data.csv --boxplot revenue --group-by product

Report Generation

# レポート用の特定の可視化を作成
python3 scripts/visualize_csv.py data.csv --histogram age -o fig1_distribution.png
python3 scripts/visualize_csv.py data.csv --scatter income age -o fig2_correlation.png
python3 scripts/visualize_csv.py data.csv --bar category -o fig3_categories.png

# データサマリーを生成
python3 scripts/data_profile.py data.csv -f html -o data_summary.html

Interactive Dashboard

# プレゼンテーション用のカスタムダッシュボードを作成
# 1. 最初に、希望するプロットを含む config.json を作成
# 2. ダッシュボードを生成
python3 scripts/create_dashboard.py data.csv --config config.json -o presentation_dashboard.html

Troubleshooting

「Column not found」エラー:

データプロファイリングを実行して正確な列名を確認
CSV 列は大文字と小文字を区別
列名の前後のスペースを確認

空またはインコレクトな可視化:

データ型を確認 (数値 vs カテゴリ)
プロット列の欠落データを確認
十分なnon-null値が存在することを確認

スクリプト実行エラー:

依存関係がインストールされていることを確認: pip list | grep plotly
Python バージョンを確認: Python 3.6 以上が必要
画像エクスポート問題の場合は kaleido をインストール: pip install kaleido

Resources

scripts/

visualize_csv.py: すべてのチャートタイプを備えたメイン可視化スクリプト
data_profile.py: 自動データプロファイリングと品質分析
create_dashboard.py: マルチプロットダッシュボードジェネレータ

references/

visualization_guide.md: 適切なチャートタイプの選択、ベストプラクティス、一般的なパターンの包括的なガイド

ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ

詳細情報

作者: ailabs-393
リポジトリ: ailabs-393/ai-labs-claude-skills
ライセンス: MIT
最終更新: 不明

GitHubで原本を見る →フィードバックを送る

Source: https://github.com/ailabs-393/ai-labs-claude-skills / ライセンス: MIT