Anthropic Claudeデータ・分析⭐ リポ 1品質スコア 53/100

splitting-datasets

Name: splitting-datasets
Author: Brmbobo

MLモデル開発用に、データセットを訓練用、検証用、テスト用に分割します。「データセット分割」「訓練・テスト分割」「データ分割」といった要望がある際に使用できます。スキルの目的に応じた関連フレーズでトリガーされます。

description の原文を見る

Process split datasets into training, validation, and testing sets for ML model development. Use when requesting "split dataset", "train-test split", or "data partitioning". Trigger with relevant phrases based on skill purpose.

SKILL.md 本文

データセット分割器

このスキルはデータセット分割タスクの自動化された支援を提供します。

概要

このスキルは、機械学習モデルの訓練、検証、テスト用にデータセットをサブセットに分割するプロセスを自動化します。適切なデータ準備を確保し、堅牢なモデル評価を促進します。

動作方法

リクエストの分析: スキルはユーザーのリクエストを分析して、分割するデータセットと各サブセットの希望する比率を決定します。
コードの生成: リクエストに基づいて、標準MLライブラリを使用してデータ分割を実行するPythonコードを生成します。
分割の実行: コードを実行して、指定された比率に従ってデータセットを訓練、検証、テストセットに分割します。

このスキルの使用時期

このスキルは以下の場合に有効化されます:

機械学習モデルの訓練用にデータセットを準備する必要がある場合
訓練、検証、テストセットを作成する場合
モデルのパフォーマンスを評価するためにデータを分割する場合

例

例1: CSVファイルの分割

ユーザーリクエスト: 「'my_data.csv'のデータを70%訓練、15%検証、15%テストセットに分割してください」

スキルは以下を実行します:

'my_data.csv'ファイルを読み込むPythonコードを生成します。
コードを実行して、指定された比率に従ってデータを分割し、'train.csv'、'validation.csv'、'test.csv'ファイルを作成します。

例2: 訓練テスト分割の作成

ユーザーリクエスト: 「'large_dataset.csv'を80/20の比率で訓練テスト分割を作成してください」

スキルは以下を実行します:

'large_dataset.csv'を読み込むPythonコードを生成します。
コードを実行してデータセットを80%訓練、20%テストセットに分割し、'train.csv'と'test.csv'として保存します。

ベストプラクティス

データ整合性: 分割プロセスがデータの整合性を維持し、データ損失や破損がないことを確認します。
層別化: クラス分布を各サブセットで維持するために、不均衡なデータセットの分割時に層別化を検討します。
ランダム化: 結果として得られるデータセットのバイアスを避けるため、分割プロセスがランダム化されていることを確認します。

統合

このスキルは、Claude Codeエコシステム内の他のデータ処理およびモデル訓練ツールと統合して、完全な機械学習ワークフローを作成できます。

前提条件

適切なファイルアクセス権限
必要な依存関係がインストールされていること

手順

トリガー条件が満たされた場合にこのスキルを呼び出します
必要なコンテキストとパラメータを提供します
生成された出力を確認します
必要に応じて修正を適用します

出力

スキルはタスクに関連した構造化された出力を生成します。

エラーハンドリング

無効な入力: 修正を求めるプロンプトを表示
依存関係の欠落: 必要なコンポーネントをリストアップ
権限エラー: 修復ステップを提案

リソース

プロジェクトドキュメント
関連スキルおよびコマンド

ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ

詳細情報

作者: Brmbobo
リポジトリ: Brmbobo/Web2podcast
ライセンス: MIT
最終更新: 2026/1/26

GitHubで原本を見る →フィードバックを送る

Source: https://github.com/Brmbobo/Web2podcast / ライセンス: MIT

splitting-datasets

SKILL.md 本文

データセット分割器

概要

動作方法

このスキルの使用時期

例

例1: CSVファイルの分割

例2: 訓練テスト分割の作成

ベストプラクティス

統合

前提条件

手順

出力

エラーハンドリング

リソース

詳細情報

関連スキル

hugging-face-trackio

btc-bottom-model

protein_solubility_optimization

research-lookup

tree-formatting

querying-indonesian-gov-data