csv-data-visualizer
CSVファイルを読み込み、インタラクティブなグラフの作成、統計プロットの生成、データ分布の分析、ダッシュボードの構築、自動データプロファイリングを行う際に使用するスキルです。Plotlyを活用した探索的データ分析のための包括的なツールを提供します。
description の原文を見る
This skill should be used when working with CSV files to create interactive data visualizations, generate statistical plots, analyze data distributions, create dashboards, or perform automatic data profiling. It provides comprehensive tools for exploratory data analysis using Plotly for interactive visualizations.
SKILL.md 本文
CSV Data Visualizer
Overview
このスキルは CSV ファイルの包括的なデータ可視化と分析を実現します。主な機能は 3 つです:(1) Plotly を使用した個別のインタラクティブな可視化の作成、(2) 統計的サマリーを含む自動データプロファイリング、(3) マルチプロット ダッシュボードの生成。このスキルは探索的データ分析、統計レポート、およびプレゼンテーション対応の可視化の作成に最適化されています。
When to Use This Skill
以下のリクエストがある場合にこのスキルを使用してください:
- 「この CSV データを可視化してください」
- 「このデータからヒストグラム/散布図/箱ひげ図を作成してください」
- 「[列名] の分布を表示してください」
- 「このデータセット用のダッシュボードを生成してください」
- 「この CSV ファイルをプロファイリング/分析してください」
- 「相関ヒートマップを作成してください」
- 「時系列トレンドを表示してください」
- 「[変数] を [カテゴリ] で比較してください」
Core Capabilities
1. Individual Visualizations
visualize_csv.py スクリプトを使用して、詳細な分析用に特定のチャートタイプを作成します。
Available Chart Types:
Statistical Plots:
# Histogram - 数値データの分布
python3 scripts/visualize_csv.py data.csv --histogram column_name --bins 30
# Box plot - 四分位数と外れ値を表示
python3 scripts/visualize_csv.py data.csv --boxplot column_name
# カテゴリでグループ化した箱ひげ図
python3 scripts/visualize_csv.py data.csv --boxplot salary --group-by department
# Violin plot - 確率密度を含む分布
python3 scripts/visualize_csv.py data.csv --violin column_name --group-by category
Relationship Analysis:
# 自動トレンドライン付き散布図
python3 scripts/visualize_csv.py data.csv --scatter height weight
# 色とサイズでエンコードされた散布図
python3 scripts/visualize_csv.py data.csv --scatter x y --color category --size value
# すべての数値列の相関ヒートマップ
python3 scripts/visualize_csv.py data.csv --correlation
Time Series:
# 単一変数の折れ線グラフ
python3 scripts/visualize_csv.py data.csv --line date sales
# 同じチャート上の複数変数
python3 scripts/visualize_csv.py data.csv --line date "sales,revenue,profit"
Categorical Data:
# 棒グラフ (自動的にカテゴリをカウント)
python3 scripts/visualize_csv.py data.csv --bar category
# 円グラフ (構成)
python3 scripts/visualize_csv.py data.csv --pie region
Output Formats: 出力ファイルを希望する形式の拡張子で指定:
# インタラクティブ HTML (デフォルト)
python3 scripts/visualize_csv.py data.csv --histogram age -o output.html
# 静止画形式
python3 scripts/visualize_csv.py data.csv --scatter x y -o plot.png
python3 scripts/visualize_csv.py data.csv --correlation -o heatmap.pdf
python3 scripts/visualize_csv.py data.csv --bar category -o chart.svg
2. Automatic Data Profiling
data_profile.py スクリプトを使用して、包括的なデータ品質と統計レポートを生成します。
Text Report (デフォルト):
python3 scripts/data_profile.py data.csv
HTML Report:
python3 scripts/data_profile.py data.csv -f html -o report.html
JSON Report:
python3 scripts/data_profile.py data.csv -f json -o profile.json
What the Profiler Provides:
- ファイル情報 (サイズ、寸法)
- データセット概要 (形状、メモリ使用量、重複)
- 列ごとの分析 (型、欠落データ、ユニーク値)
- 欠落データパターンと完全性
- 数値列の統計サマリー (平均、標準偏差、四分位数、歪度、尖度)
- カテゴリ列の分析 (頻度カウント、最頻値・最小頻値)
- データ品質チェック (高い欠落率、重複行、定数列、高いカーディナリティ)
When to Use Profiling: 以下の場合、可視化を作成する前に常にデータプロファイリングを実行することを推奨してください:
- ユーザーがデータセットに不慣れな場合
- データ品質が不明な場合
- 適切な可視化タイプを特定する必要がある場合
- 初めてデータセットを探索する場合
3. Multi-Plot Dashboards
create_dashboard.py スクリプトを使用して、複数の可視化を含む包括的なダッシュボードを作成します。
Automatic Dashboard: データ型を分析し、自動的に適切な可視化を作成:
python3 scripts/create_dashboard.py data.csv
カスタム出力ロケーション:
python3 scripts/create_dashboard.py data.csv -o my_dashboard.html
プロット数を制御:
python3 scripts/create_dashboard.py data.csv --max-plots 9
Custom Dashboard from Config: 正確なプロットを指定する JSON 設定ファイルを作成:
python3 scripts/create_dashboard.py data.csv --config config.json
Dashboard Config Format:
{
"title": "Sales Analysis Dashboard",
"plots": [
{"type": "histogram", "column": "revenue"},
{"type": "box", "column": "revenue", "group_by": "region"},
{"type": "scatter", "column": "advertising", "group_by": "revenue"},
{"type": "bar", "column": "product_category"},
{"type": "correlation"}
]
}
Dashboard Plot Types:
histogram: 数値列の分布box: 箱ひげ図、オプションでカテゴリでグループ化scatter: 2 つの数値列の関係bar: カテゴリ値のカウントcorrelation: 数値相関のヒートマップ
Workflow Decision Tree
以下のデシジョンツリーを使用して、適切なアプローチを決定します:
ユーザーが CSV ファイルを提供
│
├─ 「このデータをプロファイリング」 / 「このデータを分析」 / 不慣れなデータセット
│ └─> まず data_profile.py を実行
│ その後、調査結果に基づいて可視化オプションを提供
│
├─ 「ダッシュボードを作成」 / 「データの概要」 / 複数の可視化が必要
│ ├─ ユーザーが希望するプロットが明確
│ │ └─> JSON 設定を作成 → 設定付きで create_dashboard.py を実行
│ └─ ユーザーが自動ダッシュボードを望む
│ └─> create_dashboard.py を実行 (自動モード)
│
└─ 特定の可視化をリクエスト (「ヒストグラム」「散布図」など)
└─> 適切なフラグを使用して visualize_csv.py を実行
Best Practices
Starting Analysis
- 不慣れなデータセットの場合は常にプロファイリングを実行:
python3 scripts/data_profile.py data.csv - プロファイリング出力を確認して以下を把握:
- 列のデータ型と範囲
- 欠落データパターン
- データ品質の問題
- 統計分布
Choosing Visualizations
詳細なガイダンスは references/visualization_guide.md を参照してください。クイックリファレンス:
- Distribution: ヒストグラム、箱ひげ図、バイオリンプロット
- Relationship: 散布図、相関ヒートマップ
- Time series: 折れ線グラフ
- Categories: 棒グラフ (推奨) または円グラフ (控えめに使用)
- Comparison: カテゴリでグループ化された箱ひげ図
Creating Dashboards
- 自動ダッシュボード: 初期探索に最適
- カスタムダッシュボード: プレゼンテーションまたは特定の分析目標に適している
- プロット数を制限: 可読性のために 6~9 個に限定
- 論理的グループ化: 関連する可視化を一緒にグループ化
Output Considerations
- HTML: インタラクティブな探索に最適 (ズーム、パン、ホバーツールチップ)
- PNG/PDF: レポートとプレゼンテーションに最適
- SVG: ベクトルグラフィックスを必要とする出版物に最適
Dependencies
スクリプトには以下の Python パッケージが必要です:
pip install pandas plotly numpy
静止画エクスポート (PNG、PDF、SVG) を使用する場合は、以下もインストールしてください:
pip install kaleido
Example Workflows
Exploratory Data Analysis
# 1. データをプロファイリング
python3 scripts/data_profile.py sales_data.csv -f html -o profile.html
# 2. 自動ダッシュボードを作成
python3 scripts/create_dashboard.py sales_data.csv -o dashboard.html
# 3. 特定のプロットでより深く掘り下げる
python3 scripts/visualize_csv.py sales_data.csv --scatter price sales --color region
python3 scripts/visualize_csv.py sales_data.csv --boxplot revenue --group-by product
Report Generation
# レポート用の特定の可視化を作成
python3 scripts/visualize_csv.py data.csv --histogram age -o fig1_distribution.png
python3 scripts/visualize_csv.py data.csv --scatter income age -o fig2_correlation.png
python3 scripts/visualize_csv.py data.csv --bar category -o fig3_categories.png
# データサマリーを生成
python3 scripts/data_profile.py data.csv -f html -o data_summary.html
Interactive Dashboard
# プレゼンテーション用のカスタムダッシュボードを作成
# 1. 最初に、希望するプロットを含む config.json を作成
# 2. ダッシュボードを生成
python3 scripts/create_dashboard.py data.csv --config config.json -o presentation_dashboard.html
Troubleshooting
「Column not found」エラー:
- データプロファイリングを実行して正確な列名を確認
- CSV 列は大文字と小文字を区別
- 列名の前後のスペースを確認
空またはインコレクトな可視化:
- データ型を確認 (数値 vs カテゴリ)
- プロット列の欠落データを確認
- 十分なnon-null値が存在することを確認
スクリプト実行エラー:
- 依存関係がインストールされていることを確認:
pip list | grep plotly - Python バージョンを確認: Python 3.6 以上が必要
- 画像エクスポート問題の場合は kaleido をインストール:
pip install kaleido
Resources
scripts/
visualize_csv.py: すべてのチャートタイプを備えたメイン可視化スクリプトdata_profile.py: 自動データプロファイリングと品質分析create_dashboard.py: マルチプロット ダッシュボード ジェネレータ
references/
visualization_guide.md: 適切なチャートタイプの選択、ベストプラクティス、一般的なパターンの包括的なガイド
ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ
詳細情報
- 作者
- ailabs-393
- ライセンス
- MIT
- 最終更新
- 不明
Source: https://github.com/ailabs-393/ai-labs-claude-skills / ライセンス: MIT
関連スキル
hugging-face-trackio
Trackioを使用してMLトレーニング実験を追跡・可視化できます。トレーニング中のメトリクスログ記録(Python API)、トレーニング診断のアラート発火、ログされたメトリクスの取得・分析(CLI)が必要な場合に活用してください。リアルタイムダッシュボード表示、Webhookを使用したアラート、HF Space同期、自動化向けのJSON出力に対応しています。
btc-bottom-model
ビットコインのサイクルタイミングモデルで、加重スコアリングシステムを搭載しています。日次パルス(4指標、32ポイント)とウィークリー構造(9指標、68ポイント)の2カテゴリーにわたる13の指標を追跡し、0~100のマーケットヒートスコアを算出します。ETFフロー、ファンディングレート、ロング/ショート比率、恐怖・貪欲指数、LTH-MVRV、NUPL、SOPR(LTH+STH)、LTH供給率、移動平均倍率(365日MA、200週MA)、週次RSI、出来高トレンドに対応します。市場サイクル全体を通じて買いと売りの両方の推奨を提供します。ビットコインの底値拾い、BTCサイクルポジション、買い時・売り時、オンチェーン指標、MVRV、NUPL、SOPR、LTH動向、ETFの流出入、ファンディングレート、恐怖指数、ビットコインが過熱状態か、マイナーコスト、暗号資産市場のセンチメント、BTCのポジションサイジング、「今ビットコインを買うべきか」「BTCが天井をつけているか」「オンチェーン指標は何を示しているか」といった質問の際にこのスキルを活用します。
protein_solubility_optimization
タンパク質の溶解性最適化 - タンパク質の溶解性を最適化します。タンパク質の特性を計算し、溶解性と親水性を予測し、有効な変異を提案します。タンパク質配列の特性計算、タンパク質機能の予測、親水性計算、ゼロショット配列予測を含むタンパク質エンジニアリング業務に使用できます。3つのSCPサーバーから4つのツールを統合しています。
research-lookup
Parallel Chat APIまたはPerplexity sonar-pro-searchを使用して、最新の研究情報を検索できます。学術論文の検索にも対応しています。クエリは自動的に最適なバックエンドにルーティングされるため、論文の検索、研究データの収集、科学情報の検証に活用できます。
tree-formatting
ggtree(R)またはiTOL(ウェブ)を使用して、系統樹の可視化とフォーマットを行います。系統樹を図として描画する際、ツリーレイアウトの選択、分類学に基づく枝やラベルの色付け、クレードの折りたたみ、サポート値の表示、またはツリーへのオーバーレイ追加が必要な場合に使用してください。系統推定(protein-phylogenyスキルを使用)やドメイン注釈(今後の独立したスキル)には使用しないでください。
querying-indonesian-gov-data
インドネシア政府の50以上のAPIとデータソースに接続できます。BPJPH(ハラール認証)、BOM(食品安全)、OJK(金融適正性)、BPS(統計)、BMKG(気象・地震)、インドネシア中央銀行(為替レート)、IDX(株式)、CKAN公開データポータル、pasal.id(第三者法MCP)に対応しています。インドネシア政府データを活用したアプリ開発、.go.idウェブサイトのスクレイピング、ハラール認証の確認、企業の法的適正性の検証、金融機関ステータスの照会、またはインドネシアMCPサーバーへの接続時に使用できます。CSRF処理、CKAN API使用方法、IP制限回避など、すぐに実行可能なPythonパターンを含んでいます。