senior-data-scientist
統計モデリング、実験設計、因果推論、予測分析を専門とするデータサイエンティストのスキルです。A/Bテスト(サンプルサイズ設計、二項比率のz検定、ボンフェローニ補正)、差分の差分法、特徴量エンジニアリングパイプライン(Scikit-learn、XGBoost)、クロスバリデーション付きモデル評価(AUC-ROC、AUC-PR、SHAP)、MLflowによる実験追跡に対応しています。Python(NumPy、Pandas、Scikit-learn)、R、SQLを使用します。統制実験の設計・分析、分類・回帰モデルの構築と評価、観測データの因果分析、構造化表形式データの特徴量エンジニアリング、統計的知見をデータドリブンなビジネス意思決定に変換する際に活用できます。
description の原文を見る
World-class senior data scientist skill specialising in statistical modeling, experiment design, causal inference, and predictive analytics. Covers A/B testing (sample sizing, two-proportion z-tests, Bonferroni correction), difference-in-differences, feature engineering pipelines (Scikit-learn, XGBoost), cross-validated model evaluation (AUC-ROC, AUC-PR, SHAP), and MLflow experiment tracking — using Python (NumPy, Pandas, Scikit-learn), R, and SQL. Use when designing or analysing controlled experiments, building and evaluating classification or regression models, performing causal analysis on observational data, engineering features for structured tabular datasets, or translating statistical findings into data-driven business decisions.
SKILL.md 本文
シニアデータサイエンティスト
本番環境グレードのAI/ML/データシステム向けワールドクラスのシニアデータサイエンティストスキル。
コアワークフロー
1. A/Bテストの設計
import numpy as np
from scipy import stats
def calculate_sample_size(baseline_rate, mde, alpha=0.05, power=0.8):
"""
Calculate required sample size per variant.
baseline_rate: current conversion rate (e.g. 0.10)
mde: minimum detectable effect (relative, e.g. 0.05 = 5% lift)
"""
p1 = baseline_rate
p2 = baseline_rate * (1 + mde)
effect_size = abs(p2 - p1) / np.sqrt((p1 * (1 - p1) + p2 * (1 - p2)) / 2)
z_alpha = stats.norm.ppf(1 - alpha / 2)
z_bet
...
詳細情報
- 作者
- Boboegg
- リポジトリ
- Boboegg/ai-resources
- ライセンス
- 不明
- 最終更新
- 2026/4/3
Source: https://github.com/Boboegg/ai-resources / ライセンス: 未指定