data-quality-checker
マーケット分析レポートやブログ記事の公開前に、データ品質を検証します。ETFと先物の価格スケールの不整合、銘柄表記のエラー、日付と曜日のミスマッチ、配分合計の誤り、単位の不一致などを確認する際に使用してください。英語・日本語コンテンツに対応しており、検出した問題はブロッカーとしてではなく警告として人間のレビュー向けにフラグを立てるアドバイザリーモードで動作します。
description の原文を見る
Validate data quality in market analysis documents and blog articles before publication. Use when checking for price scale inconsistencies (ETF vs futures), instrument notation errors, date/day-of-week mismatches, allocation total errors, and unit mismatches. Supports English and Japanese content. Advisory mode -- flags issues as warnings for human review, not as blockers.
SKILL.md 本文
概要
公開前に市場分析ドキュメントの一般的なデータ品質問題を検出します。チェッカーは5つのカテゴリを検証します:価格スケール一貫性、インストルメント記法、日付/曜日の正確性、配分合計、および単位の使用。すべての検出結果は助言的なものです。公開をブロックするのではなく、人間によるレビューの対象として潜在的な問題にフラグを立てます。
使用時期
- 週次戦略ブログまたは市場分析レポートを公開する前
- 自動生成された市場サマリー後
- 翻訳されたドキュメント (英語/日本語) のデータ精度をレビューするとき
- 複数のソース (FRED、FMP、FINVIZ) からのデータを1つのレポートに組み合わせるとき
- 金融データを含む任意のドキュメントの事前確認チェックとして
前提条件
- Python 3.9以上
- 外部 API キーは不要
- サードパーティの Python パッケージは不要 (標準ライブラリのみ使用)
ワークフロー
ステップ1: 入力ドキュメント受け取り
対象のマークダウンファイルパスとオプションパラメータを受け取ります:
--file: 検証するマークダウンドキュメントへのパス (必須)--checks: 実行するチェックをカンマ区切りで指定 (オプション;デフォルト: 全て)--as-of: 年推測用の参照日付 YYYY-MM-DD 形式 (オプション)--output-dir: レポート出力ディレクトリ (オプション;デフォルト:reports/)
ステップ2: 検証スクリプト実行
データ品質チェッカースクリプトを実行します:
python3 skills/data-quality-checker/scripts/check_data_quality.py \
--file path/to/document.md \
--output-dir reports/
特定のチェックのみを実行する場合:
python3 skills/data-quality-checker/scripts/check_data_quality.py \
--file path/to/document.md \
--checks price_scale,dates,allocations
年推測用の参照日付を指定する場合 (ドキュメントに明示的な年がない日付の場合に有用):
python3 skills/data-quality-checker/scripts/check_data_quality.py \
--file path/to/document.md \
--as-of 2026-02-28
ステップ3: 参照基準の読み込み
検出結果の文脈化のため、関連する参照ドキュメントを読み込みます:
references/instrument_notation_standard.md-- 標準ティッカー記法、各インストルメントクラスの桁数ヒント、命名規約references/common_data_errors.md-- 頻繁に観察されるエラーのカタログ。FRED データの遅延、ETF/先物スケール混乱、祝日の見落とし、配分合計の落とし穴、単位混乱パターンを含む
検出結果の説明と修正提案に、これらの参照を使用します。
ステップ4: 検出結果をレビュー
出力の各検出結果を確認します:
- ERROR -- 高信度の問題 (例:カレンダー計算で検証された日付-曜日のミスマッチ)。修正を強く推奨します。
- WARNING -- 人間の判断が必要な可能性の高い問題 (例:価格スケール異常、記法不一貫性、配分合計が 0.5% を超えてずれている)。
- INFO -- 情報提供のみ (例:混在する bp/% 使用法は意図的かもしれない)。
ステップ5: 品質レポート生成
スクリプトは2つの出力ファイルを生成します:
- JSON レポート (
data_quality_YYYY-MM-DD_HHMMSS.json): 重要度、カテゴリ、メッセージ、行番号、文脈を含む機械可読の検出結果リスト。 - Markdown レポート (
data_quality_YYYY-MM-DD_HHMMSS.md): 重要度レベルでグループ化された人間が読みやすいレポート。
ナレッジベースを参照する説明とともに検出結果をユーザーに提示します。各問題について具体的な修正を提案します。
出力形式
JSON 検出結果の構造
{
"severity": "WARNING",
"category": "price_scale",
"message": "GLD: $2,800 has 4 digits (expected 2-3 digits)",
"line_number": 5,
"context": "GLD: $2,800"
}
Markdown レポートの構造
# Data Quality Report
**Source:** path/to/document.md
**Generated:** 2026-02-28 14:30:00
**Total findings:** 3
## ERROR (1)
- **[dates]** (line 12): Date-weekday mismatch: January 1, 2026 (Monday) -- actual weekday is Thursday
## WARNING (2)
- **[price_scale]** (line 5): GLD: $2,800 has 4 digits (expected 2-3 digits)
> `GLD: $2,800`
- **[allocations]**: Allocation total: 110.0% (expected ~100%)
リソース
scripts/check_data_quality.py-- メイン検証スクリプトreferences/instrument_notation_standard.md-- 記法と価格スケールの参照references/common_data_errors.md-- 一般的なエラーパターンと予防
主要な原則
-
助言モード: すべての検出結果は人間によるレビューのための警告です。スクリプトは検出結果が存在する場合でも、実行成功時に常に終了コード 0 で終了します。終了コード 1 はスクリプト失敗 (ファイルが見つからない、パースエラー) のために予約されています。
-
セクション対応の配分チェック: "配分"、"Allocation" などのような見出しまたは "ウェイト"、"目安比率" などの表列で識別される配分セクション内のパーセンテージのみがチェックされます。本文内のランダムなパーセンテージ (確率、RSI、年度変化) は無視されます。
-
バイリンガルサポート: 英語と日本語の日付形式、曜日名、セクション見出しの両方に対応します。全角文字 (%、〜、エンダッシュ) は処理前に正規化されます。
-
年推測: 明示的な年を持たない日付については、チェッカーが (優先順) 以下を使用して年を推測します:
--as-ofオプション、ドキュメントのタイトル/メタデータで見つかった YYYY パターン、または 6か月の年越しヒューリスティックを用いた現在の年。 -
桁数ヒューリスティック: 価格スケール検証は絶対的な価格範囲ではなく桁数 (小数点前の桁数) を使用します。このアプローチは時間経過に伴う価格変化に強固ですが、ETF/先物混乱エラーをキャッチします。
ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ
詳細情報
- 作者
- tradermonty
- ライセンス
- MIT
- 最終更新
- 不明
Source: https://github.com/tradermonty/claude-trading-skills / ライセンス: MIT
関連スキル
hugging-face-trackio
Trackioを使用してMLトレーニング実験を追跡・可視化できます。トレーニング中のメトリクスログ記録(Python API)、トレーニング診断のアラート発火、ログされたメトリクスの取得・分析(CLI)が必要な場合に活用してください。リアルタイムダッシュボード表示、Webhookを使用したアラート、HF Space同期、自動化向けのJSON出力に対応しています。
btc-bottom-model
ビットコインのサイクルタイミングモデルで、加重スコアリングシステムを搭載しています。日次パルス(4指標、32ポイント)とウィークリー構造(9指標、68ポイント)の2カテゴリーにわたる13の指標を追跡し、0~100のマーケットヒートスコアを算出します。ETFフロー、ファンディングレート、ロング/ショート比率、恐怖・貪欲指数、LTH-MVRV、NUPL、SOPR(LTH+STH)、LTH供給率、移動平均倍率(365日MA、200週MA)、週次RSI、出来高トレンドに対応します。市場サイクル全体を通じて買いと売りの両方の推奨を提供します。ビットコインの底値拾い、BTCサイクルポジション、買い時・売り時、オンチェーン指標、MVRV、NUPL、SOPR、LTH動向、ETFの流出入、ファンディングレート、恐怖指数、ビットコインが過熱状態か、マイナーコスト、暗号資産市場のセンチメント、BTCのポジションサイジング、「今ビットコインを買うべきか」「BTCが天井をつけているか」「オンチェーン指標は何を示しているか」といった質問の際にこのスキルを活用します。
protein_solubility_optimization
タンパク質の溶解性最適化 - タンパク質の溶解性を最適化します。タンパク質の特性を計算し、溶解性と親水性を予測し、有効な変異を提案します。タンパク質配列の特性計算、タンパク質機能の予測、親水性計算、ゼロショット配列予測を含むタンパク質エンジニアリング業務に使用できます。3つのSCPサーバーから4つのツールを統合しています。
research-lookup
Parallel Chat APIまたはPerplexity sonar-pro-searchを使用して、最新の研究情報を検索できます。学術論文の検索にも対応しています。クエリは自動的に最適なバックエンドにルーティングされるため、論文の検索、研究データの収集、科学情報の検証に活用できます。
tree-formatting
ggtree(R)またはiTOL(ウェブ)を使用して、系統樹の可視化とフォーマットを行います。系統樹を図として描画する際、ツリーレイアウトの選択、分類学に基づく枝やラベルの色付け、クレードの折りたたみ、サポート値の表示、またはツリーへのオーバーレイ追加が必要な場合に使用してください。系統推定(protein-phylogenyスキルを使用)やドメイン注釈(今後の独立したスキル)には使用しないでください。
querying-indonesian-gov-data
インドネシア政府の50以上のAPIとデータソースに接続できます。BPJPH(ハラール認証)、BOM(食品安全)、OJK(金融適正性)、BPS(統計)、BMKG(気象・地震)、インドネシア中央銀行(為替レート)、IDX(株式)、CKAN公開データポータル、pasal.id(第三者法MCP)に対応しています。インドネシア政府データを活用したアプリ開発、.go.idウェブサイトのスクレイピング、ハラール認証の確認、企業の法的適正性の検証、金融機関ステータスの照会、またはインドネシアMCPサーバーへの接続時に使用できます。CSRF処理、CKAN API使用方法、IP制限回避など、すぐに実行可能なPythonパターンを含んでいます。