Agent Skills by ALSEL
Anthropic Claudeデータ・分析⭐ リポ 1品質スコア 53/100

preprocessing-data-with-automated-pipelines

データの前処理、変換、検証をML業務に向けて自動化します。「データの前処理」「データのクリーニング」「ETLパイプライン」「データ変換」といった依頼の際に使用してください。スキルの目的に応じた関連フレーズをトリガーとして機能します。

description の原文を見る

Process automate data cleaning, transformation, and validation for ML tasks. Use when requesting "preprocess data", "clean data", "ETL pipeline", or "data transformation". Trigger with relevant phrases based on skill purpose.

SKILL.md 本文

データ前処理パイプライン

このスキルはデータ前処理パイプラインタスクの自動化支援を提供します。

概要

このスキルにより、Claudeは機械学習用のデータの品質と準備状態を確保する自動データ前処理パイプラインを構築・実行できます。データクリーニング、変換、バリデーションなどの一般的なタスクを自動化することで、データ準備プロセスを効率化します。

仕組み

  1. 要件分析: Claudeはユーザーのリクエストを分析し、データソース、目標形式、必要な変換を含む、特定のデータ前処理ニーズを理解します。
  2. パイプラインコード生成: 要件に基づいて、Claudeは関連するライブラリとベストプラクティスを使用した自動データ前処理パイプラインのPythonコードを生成します。これにはデータバリデーションとエラーハンドリングが含まれます。
  3. パイプライン実行: 生成されたコードが実行され、データ前処理ステップが実行されます。
  4. メトリクスとインサイト提供: Claudeはパイプライン実行に関するパフォーマンスメトリクスとインサイト(データ品質レポートと発生した潜在的な問題を含む)を提供します。

このスキルを使用する場合

このスキルは以下が必要な場合に有効になります。

  • 機械学習モデル用の生データを準備する
  • データクリーニングと変換プロセスを自動化する
  • 堅牢なETL(抽出・変換・ロード)パイプラインを実装する

例1: 顧客データのクリーニング

ユーザーリクエスト: 「CSVファイルの顧客データを前処理して、重複を削除し、欠損値を処理してください。」

スキルは以下を実行します。

  1. CSVファイルを読み込み、重複エントリを削除し、適切なテクニック(例:平均値補完)を使用して欠損値を補完するPythonスクリプトを生成します。
  2. スクリプトを実行し、削除された重複の数と補完された欠損値の数を含む、実施された変更のサマリーを提供します。

例2: センサーデータの変換

ユーザーリクエスト: 「センサーデータをデータベースから時系列分析に適した形式に変換するETLパイプラインを作成してください。」

スキルは以下を実行します。

  1. データベースからセンサーデータを抽出し、時系列形式(例:固定周波数へのリサンプリング)に変換し、適切なストレージの場所にロードするPythonスクリプトを生成します。
  2. スクリプトを実行し、パイプラインの各ステップにかかった時間や変換されたデータのサイズなどのパフォーマンスメトリクスを提供します。

ベストプラクティス

  • データバリデーション: データ品質を確保し、潜在的なエラーをパイプラインの早い段階で検出するため、常にデータバリデーションステップを含めます。
  • エラーハンドリング: パイプライン実行中の予期しない問題を適切に処理するため、堅牢なエラーハンドリングを実装します。
  • パフォーマンス最適化: 効率的なアルゴリズムとデータ構造を使用してパイプラインのパフォーマンスを最適化します。

統合

このスキルはデータ分析、モデル訓練、デプロイメント用の他のClaudeコードスキルと統合できます。これらのタスク用にデータを準備する標準化された方法を提供し、一貫性と信頼性を確保します。

前提条件

  • 適切なファイルアクセス権限
  • 必要な依存関係がインストールされていること

手順

  1. トリガー条件を満たすときにこのスキルを実行します
  2. 必要なコンテキストとパラメータを提供します
  3. 生成された出力を確認します
  4. 必要に応じて変更を適用します

出力

スキルはタスクに関連する構造化された出力を生成します。

エラーハンドリング

  • 無効な入力: 修正をプロンプトで要求します
  • 依存関係の不足: 必要なコンポーネントをリストアップします
  • パーミッションエラー: 修復ステップを提案します

リソース

  • プロジェクトドキュメント
  • 関連スキルとコマンド

ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ

詳細情報

作者
Brmbobo
リポジトリ
Brmbobo/Web2podcast
ライセンス
MIT
最終更新
2026/1/26

Source: https://github.com/Brmbobo/Web2podcast / ライセンス: MIT

関連スキル

OpenAIデータ・分析⭐ リポ 1,451

hugging-face-trackio

Trackioを使用してMLトレーニング実験を追跡・可視化できます。トレーニング中のメトリクスログ記録(Python API)、トレーニング診断のアラート発火、ログされたメトリクスの取得・分析(CLI)が必要な場合に活用してください。リアルタイムダッシュボード表示、Webhookを使用したアラート、HF Space同期、自動化向けのJSON出力に対応しています。

by gradio-app
汎用データ・分析⭐ リポ 855

btc-bottom-model

ビットコインのサイクルタイミングモデルで、加重スコアリングシステムを搭載しています。日次パルス(4指標、32ポイント)とウィークリー構造(9指標、68ポイント)の2カテゴリーにわたる13の指標を追跡し、0~100のマーケットヒートスコアを算出します。ETFフロー、ファンディングレート、ロング/ショート比率、恐怖・貪欲指数、LTH-MVRV、NUPL、SOPR(LTH+STH)、LTH供給率、移動平均倍率(365日MA、200週MA)、週次RSI、出来高トレンドに対応します。市場サイクル全体を通じて買いと売りの両方の推奨を提供します。ビットコインの底値拾い、BTCサイクルポジション、買い時・売り時、オンチェーン指標、MVRV、NUPL、SOPR、LTH動向、ETFの流出入、ファンディングレート、恐怖指数、ビットコインが過熱状態か、マイナーコスト、暗号資産市場のセンチメント、BTCのポジションサイジング、「今ビットコインを買うべきか」「BTCが天井をつけているか」「オンチェーン指標は何を示しているか」といった質問の際にこのスキルを活用します。

by star23
Anthropic Claudeデータ・分析⭐ リポ 380

protein_solubility_optimization

タンパク質の溶解性最適化 - タンパク質の溶解性を最適化します。タンパク質の特性を計算し、溶解性と親水性を予測し、有効な変異を提案します。タンパク質配列の特性計算、タンパク質機能の予測、親水性計算、ゼロショット配列予測を含むタンパク質エンジニアリング業務に使用できます。3つのSCPサーバーから4つのツールを統合しています。

by SpectrAI-Initiative
Anthropic Claudeデータ・分析⭐ リポ 1,743

research-lookup

Parallel Chat APIまたはPerplexity sonar-pro-searchを使用して、最新の研究情報を検索できます。学術論文の検索にも対応しています。クエリは自動的に最適なバックエンドにルーティングされるため、論文の検索、研究データの収集、科学情報の検証に活用できます。

by K-Dense-AI
Anthropic Claudeデータ・分析⭐ リポ 299

tree-formatting

ggtree(R)またはiTOL(ウェブ)を使用して、系統樹の可視化とフォーマットを行います。系統樹を図として描画する際、ツリーレイアウトの選択、分類学に基づく枝やラベルの色付け、クレードの折りたたみ、サポート値の表示、またはツリーへのオーバーレイ追加が必要な場合に使用してください。系統推定(protein-phylogenyスキルを使用)やドメイン注釈(今後の独立したスキル)には使用しないでください。

by majiayu000
汎用データ・分析⭐ リポ 145

querying-indonesian-gov-data

インドネシア政府の50以上のAPIとデータソースに接続できます。BPJPH(ハラール認証)、BOM(食品安全)、OJK(金融適正性)、BPS(統計)、BMKG(気象・地震)、インドネシア中央銀行(為替レート)、IDX(株式)、CKAN公開データポータル、pasal.id(第三者法MCP)に対応しています。インドネシア政府データを活用したアプリ開発、.go.idウェブサイトのスクレイピング、ハラール認証の確認、企業の法的適正性の検証、金融機関ステータスの照会、またはインドネシアMCPサーバーへの接続時に使用できます。CSRF処理、CKAN API使用方法、IP制限回避など、すぐに実行可能なPythonパターンを含んでいます。

by suryast
本サイトは GitHub 上で公開されているオープンソースの SKILL.md ファイルをクロール・インデックス化したものです。 各スキルの著作権は原作者に帰属します。掲載に問題がある場合は info@alsel.co.jp または /takedown フォームよりご連絡ください。
原作者: Brmbobo · Brmbobo/Web2podcast · ライセンス: MIT