Anthropic Claudeデータ・分析⭐ リポ 0品質スコア 50/100

clean-data-xls

Name: clean-data-xls
Author: anthropics

スプレッドシートの乱れたデータを整形するスキルです。空白のトリミング、大文字・小文字の統一、テキストとして保存された数値の変換、日付の標準化、重複行の削除、型が混在する列の検出などを自動で処理します。「このデータをクリーンにして」「重複を削除して」「この列を標準化して」「データが汚い」といった指示をトリガーに、分析前のデータ前処理が必要な場面で活用できます。

description の原文を見る

Clean up messy spreadsheet data — trim whitespace, fix inconsistent casing, convert numbers-stored-as-text, standardize dates, remove duplicates, and flag mixed-type columns. Use when data is messy, inconsistent, or needs prep before analysis. Triggers on "clean this data", "clean up this sheet", "normalize this data", "fix formatting", "dedupe", "standardize this column", "this data is messy".

SKILL.md 本文

データのクリーニング

アクティブシートまたは指定範囲内の汚いデータをクリーニングします。

環境

Excel 内で実行している場合 (Office Add-in / Office JS): Office JS を直接使用します (Excel.run(async (context) => {...}))。range.values で読み込み、ヘルパー列に数式を書き込みます (range.formulas = [["=TRIM(A2)"]])。インプレース処理またはヘルパー列処理の選択は依然として適用されます。
スタンドアロンの .xlsx ファイルを処理する場合: Python/openpyxl を使用します。

ワークフロー

ステップ 1: スコープ決定

範囲が指定されている場合 (例: A1:F200)、それを使用します
そうでない場合は、アクティブシートの全使用範囲を使用します
各列をプロファイリング：主要型 (テキスト / 数値 / 日付) を検出し、外れ値を特定します

ステップ 2: 問題の検出

問題	確認項目
空白文字	先頭/末尾の空白、ダブルスペース
大文字小文字	カテゴリ列での一貫性のない大文字小文字 (`usa` / `USA` / `Usa`)
テキストとして保存された数値	テキストとして保存された数値、数値セル内の余分な `$`、`,`、`%`
日付	同じ列内の混在形式 (`3/8/26`、`2026-03-08`、`March 8 2026`)
重複	完全に重複する行と部分的に重複する行 (大文字小文字/空白の違い)
空白	その他が入力されている列内の空のセル
混合型	98% が数値だが 3 つのテキスト項目がある列
エンコーディング	文字化け (`Ã©`、`â€™`)、制御文字
エラー	`#REF!`、`#N/A`、`#VALUE!`、`#DIV/0!`

ステップ 3: 修正案の提示

何も変更する前に概要テーブルを表示します：

列	問題	件数	提案される修正

ステップ 4: 適用

ハードコードされたクリーニング値よりも数式を優先します — クリーニングされた出力が数式で表現できる場合 (例: =TRIM(A2)、=VALUE(SUBSTITUTE(B2,"$",""))、=UPPER(C2)、=DATEVALUE(D2))、Python で結果を計算して元を上書きするのではなく、隣接するヘルパー列に数式を書き込みます。これにより変換が透明で監査可能になります。
ユーザーが明示的に要求した場合、または適切な数式が存在しない場合 (例: エンコーディング/文字化け修復) のみ、計算値でインプレース上書きします
破壊的な操作 (重複削除、空白埋め、元データ上書き) の場合は、実施前にユーザーに確認します
各修正カテゴリ (空白文字 → 大文字小文字 → 数値変換 → 日付 → 重複削除) の後、変更内容のサンプルをユーザーに表示し、次のカテゴリに進む前に確認を得ます
変更内容の修正前/修正後の概要をレポートします

ライセンス: Apache-2.0(寛容ライセンスのため全文を引用しています) · 原本リポジトリ

詳細情報

作者: anthropics
リポジトリ: anthropics/financial-services-plugins
ライセンス: Apache-2.0
最終更新: 不明

GitHubで原本を見る →フィードバックを送る

Source: https://github.com/anthropics/financial-services-plugins / ライセンス: Apache-2.0

clean-data-xls

SKILL.md 本文

データのクリーニング

環境

ワークフロー

ステップ 1: スコープ決定

ステップ 2: 問題の検出

ステップ 3: 修正案の提示

ステップ 4: 適用

詳細情報

関連スキル

hugging-face-trackio

btc-bottom-model

protein_solubility_optimization

research-lookup

tree-formatting

querying-indonesian-gov-data