Anthropic Claudeデータ・分析⭐ リポ 0品質スコア 50/100

ab-test-analysis

Name: ab-test-analysis
Author: phuryn

A/Bテストの結果を統計的有意性・サンプルサイズの妥当性・信頼区間の観点から分析し、機能をリリース・延長・停止すべきかの推奨判断を提示します。実験結果の評価、有意差の確認、スプリットテストデータの解釈、バリアントのリリース判断を行う際に活用してください。

description の原文を見る

Analyze A/B test results with statistical significance, sample size validation, confidence intervals, and ship/extend/stop recommendations. Use when evaluating experiment results, checking if a test reached significance, interpreting split test data, or deciding whether to ship a variant.

SKILL.md 本文

A/B テスト分析

統計的厳密性を持って A/B テスト結果を評価し、得られた知見を明確なプロダクト判断に変換します。

コンテキスト

$ARGUMENTS の A/B テスト結果を分析しています。

ユーザーがデータファイル (CSV、Excel、分析エクスポート) を提供する場合は、それらを直接読み込んで分析してください。必要に応じて統計計算用の Python スクリプトを生成してください。

指示

実験を理解する:
- 仮説は何だったか？
- 何が変更されたのか (バリアント)？
- 主要メトリクスは何か？ガードレールメトリクスはあるか？
- テストはどのくらいの期間実施されたか？
- トラフィック分割は何か？
テスト設定を検証する:
- サンプルサイズ: 期待される効果サイズに対して十分なサンプル数があるか？
  - 式を使用: n = (Z²α/2 × 2 × p × (1-p)) / MDE²
  - テストがアンダーパワー (<80% power) の場合はフラグを立てる
- 期間: テストは最低 1～2 営業サイクル分実施されたか？
- ランダム化: サンプル比率の不一致 (SRM) の証拠はあるか？
- 新規性/初期効果: 初期の行動変化を洗い流すのに十分な時間があったか？
統計的有意性を計算する:
- コンバージョン率: コントロール群とバリアント群
- 相対的なリフト: (バリアント - コントロール) / コントロール × 100
- p 値: 両側 z 検定またはカイ二乗検定を使用
- 信頼区間: 差分の 95% CI
- 統計的有意性: p < 0.05 か？
- 実務的有意性: ビジネスにとってリフトは意味があるか？
ユーザーが生データを提供する場合、統計計算用の Python スクリプトを生成して実行してください。
ガードレールメトリクスを確認する:
- ガードレールメトリクス (売上、エンゲージメント、ページロード時間) に悪化が見られたか？
- 主要メトリクスが向上していてもガードレールが悪化している場合は、真の勝利ではない可能性がある

結果を解釈する:

結果	推奨
有意な正のリフト、ガードレール問題なし	リリースする — 100% に展開する
有意な正のリフト、ガードレール懸念あり	調査する — リリース前にトレードオフを理解する
有意でない、正の傾向	テストを延長する — より多くのデータまたはより大きな効果が必要
有意でない、フラット	テストを停止する — 意味のある差は検出されなかった
有意な負のリフト	リリースしない — コントロールに戻す、理由を分析する

分析サマリーを提供する:

## A/B テスト結果: [テスト名]

**仮説**: [予想していたこと]
**期間**: [X 日間] | **サンプル**: [N コントロール / M バリアント]

| メトリクス | コントロール | バリアント | リフト | p 値 | 有意か？ |
|---|---|---|---|---|---|
| [主要] | X% | Y% | +Z% | 0.0X | はい/いいえ |
| [ガードレール] | ... | ... | ... | ... | ... |

**推奨**: [リリース / 延長 / 停止 / 調査]
**理由**: [なぜか]
**次のステップ**: [何をするか]

段階的に考えてください。Markdown として保存してください。生データが提供される場合は計算用の Python スクリプトを生成してください。

さらに詳しく

ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ

詳細情報

作者: phuryn
リポジトリ: phuryn/pm-skills
ライセンス: MIT
最終更新: 不明

GitHubで原本を見る →フィードバックを送る

Source: https://github.com/phuryn/pm-skills / ライセンス: MIT

ab-test-analysis

SKILL.md 本文

A/B テスト分析

コンテキスト

指示

さらに詳しく

詳細情報

関連スキル

hugging-face-trackio

btc-bottom-model

protein_solubility_optimization

research-lookup

tree-formatting

querying-indonesian-gov-data