engineering-features-for-machine-learning
機械学習モデルのパフォーマンス向上を目的として、特徴量の作成、選択、変換を実行します。特徴量のスケーリング、エンコーディング、重要度分析に対応しています。「特徴量エンジニアリング」や「特徴量選択」の実施を求められた際に利用できます。スキルの目的に基づいた関連フレーズでトリガーされます。
description の原文を見る
Execute create, select, and transform features to improve machine learning model performance. Handles feature scaling, encoding, and importance analysis. Use when asked to "engineer features" or "select features". Trigger with relevant phrases based on skill purpose.
SKILL.md 本文
フィーチャーエンジニアリングツールキット
このスキルは、フィーチャーエンジニアリングツールキットのタスクに対する自動化された支援を提供します。
概要
このスキルは、フィーチャーエンジニアリングツールキットのタスクに対する自動化された支援を提供します。 このスキルにより、Claudeはフィーチャーエンジニアリングツールキットプラグインを活用して機械学習モデルを強化できます。新しいフィーチャーの作成、最も関連性の高いフィーチャーの選択、およびモデルのニーズに合わせた既存フィーチャーの変換プロセスを自動化します。このスキルを使用して、機械学習モデルの精度、効率性、および解釈可能性を向上させます。
動作方法
- 要件の分析: Claudeはユーザーのリクエストを分析し、必要なフィーチャーエンジニアリングタスクを特定します。
- コード生成: Claudeはフィーチャーエンジニアリングツールキットプラグインを使用してPythonコードを生成し、リクエストされたタスクを実行します。これにはデータ検証とエラーハンドリングが含まれます。
- タスク実行: 生成されたコードが実行され、要求に応じてフィーチャーが作成、選択、または変換されます。
- インサイトの提供: Claudeは、新しく作成されたフィーチャーの重要性やモデルパフォーマンスに対する変換の影響など、フィーチャーエンジニアリングプロセスに関連するパフォーマンスメトリクスとインサイトを提供します。
このスキルを使用する場合
このスキルは、以下の場合にアクティブになります:
- モデルの精度を向上させるために既存データから新しいフィーチャーを作成する。
- データセットから最も関連性の高いフィーチャーを選択して、モデルの複雑さを低減し効率性を向上させる。
- 機械学習モデルの仮定に合わせてフィーチャーを変換する(例:スケーリング、正規化、エンコーディング)。
例
例1: モデルの精度向上
ユーザーリクエスト: 「既存の'age'と'income'列から新しいフィーチャーを作成して、顧客チャーン予測モデルの精度を向上させてください。」
スキルは以下を実行します:
- 'age'と'income'の間のインタラクション項(例:age * income、age / income)を作成するコードを生成します。
- コードを実行し、新しいフィーチャーがモデルパフォーマンスに与える影響を評価します。
例2: モデルの複雑さの低減
ユーザーリクエスト: 「不正検出モデルの複雑さを低減するために、データセットから最も重要な上位10個のフィーチャーを選択してください。」
スキルは以下を実行します:
- 適切な方法(例:Random Forest、SelectKBest)を使用してフィーチャーの重要性を計算するコードを生成します。
- コードを実行し、重要性スコアに基づいて上位10個のフィーチャーを選択します。
ベストプラクティス
- データ検証: フィーチャーエンジニアリングを実行する前に、入力データが清潔で一貫性があることを常に確認してください。
- フィーチャースケーリング: より大きな範囲を持つフィーチャーがモデルを支配するのを防ぐために、数値フィーチャーをスケーリングします。
- カテゴリカルフィーチャーのエンコーディング: カテゴリカルフィーチャーを適切にエンコード(例:ワンホットエンコーディング、ラベルエンコーディング)して、機械学習モデルに適したものにします。
統合
このスキルはフィーチャーエンジニアリングツールキットプラグインと統合され、機械学習モデルのフィーチャーを作成、選択、および変換するためのシームレスな方法を提供します。他のClaudeコードスキルと組み合わせて使用し、完全な機械学習パイプラインを構築できます。
前提条件
- 適切なファイルアクセス権限
- 必要な依存関係がインストール済み
手順
- トリガー条件が満たされたときにこのスキルを呼び出す
- 必要なコンテキストとパラメータを提供する
- 生成された出力をレビューする
- 必要に応じて変更を適用する
出力
スキルはタスクに関連した構造化された出力を生成します。
エラーハンドリング
- 無効な入力: 修正を促す
- 欠落している依存関係: 必要なコンポーネントをリストアップ
- パーミッションエラー: 修復手順を提案
リソース
- プロジェクトドキュメント
- 関連スキルとコマンド
ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ
詳細情報
- 作者
- Brmbobo
- リポジトリ
- Brmbobo/Web2podcast
- ライセンス
- MIT
- 最終更新
- 2026/1/26
Source: https://github.com/Brmbobo/Web2podcast / ライセンス: MIT
関連スキル
hugging-face-trackio
Trackioを使用してMLトレーニング実験を追跡・可視化できます。トレーニング中のメトリクスログ記録(Python API)、トレーニング診断のアラート発火、ログされたメトリクスの取得・分析(CLI)が必要な場合に活用してください。リアルタイムダッシュボード表示、Webhookを使用したアラート、HF Space同期、自動化向けのJSON出力に対応しています。
btc-bottom-model
ビットコインのサイクルタイミングモデルで、加重スコアリングシステムを搭載しています。日次パルス(4指標、32ポイント)とウィークリー構造(9指標、68ポイント)の2カテゴリーにわたる13の指標を追跡し、0~100のマーケットヒートスコアを算出します。ETFフロー、ファンディングレート、ロング/ショート比率、恐怖・貪欲指数、LTH-MVRV、NUPL、SOPR(LTH+STH)、LTH供給率、移動平均倍率(365日MA、200週MA)、週次RSI、出来高トレンドに対応します。市場サイクル全体を通じて買いと売りの両方の推奨を提供します。ビットコインの底値拾い、BTCサイクルポジション、買い時・売り時、オンチェーン指標、MVRV、NUPL、SOPR、LTH動向、ETFの流出入、ファンディングレート、恐怖指数、ビットコインが過熱状態か、マイナーコスト、暗号資産市場のセンチメント、BTCのポジションサイジング、「今ビットコインを買うべきか」「BTCが天井をつけているか」「オンチェーン指標は何を示しているか」といった質問の際にこのスキルを活用します。
protein_solubility_optimization
タンパク質の溶解性最適化 - タンパク質の溶解性を最適化します。タンパク質の特性を計算し、溶解性と親水性を予測し、有効な変異を提案します。タンパク質配列の特性計算、タンパク質機能の予測、親水性計算、ゼロショット配列予測を含むタンパク質エンジニアリング業務に使用できます。3つのSCPサーバーから4つのツールを統合しています。
research-lookup
Parallel Chat APIまたはPerplexity sonar-pro-searchを使用して、最新の研究情報を検索できます。学術論文の検索にも対応しています。クエリは自動的に最適なバックエンドにルーティングされるため、論文の検索、研究データの収集、科学情報の検証に活用できます。
tree-formatting
ggtree(R)またはiTOL(ウェブ)を使用して、系統樹の可視化とフォーマットを行います。系統樹を図として描画する際、ツリーレイアウトの選択、分類学に基づく枝やラベルの色付け、クレードの折りたたみ、サポート値の表示、またはツリーへのオーバーレイ追加が必要な場合に使用してください。系統推定(protein-phylogenyスキルを使用)やドメイン注釈(今後の独立したスキル)には使用しないでください。
querying-indonesian-gov-data
インドネシア政府の50以上のAPIとデータソースに接続できます。BPJPH(ハラール認証)、BOM(食品安全)、OJK(金融適正性)、BPS(統計)、BMKG(気象・地震)、インドネシア中央銀行(為替レート)、IDX(株式)、CKAN公開データポータル、pasal.id(第三者法MCP)に対応しています。インドネシア政府データを活用したアプリ開発、.go.idウェブサイトのスクレイピング、ハラール認証の確認、企業の法的適正性の検証、金融機関ステータスの照会、またはインドネシアMCPサーバーへの接続時に使用できます。CSRF処理、CKAN API使用方法、IP制限回避など、すぐに実行可能なPythonパターンを含んでいます。