content-experimentation-best-practices
コンテンツの実験設計やA/Bテストに関するガイダンスを提供するスキルで、仮説の立て方・指標の選定・サンプルサイズ・統計的基礎・CMSによるバリアント管理・分析上の落とし穴を網羅します。実験の計画立案、バリアントのセットアップ、成功指標の選択、統計結果の解釈、またはCMSやフロントエンドスタック上での実験ワークフロー構築を行う際にこのスキルを活用してください。
description の原文を見る
Content experimentation and A/B testing guidance covering experiment design, hypotheses, metrics, sample size, statistical foundations, CMS-managed variants, and common analysis pitfalls. Use this skill when planning experiments, setting up variants, choosing success metrics, interpreting statistical results, or building experimentation workflows in a CMS or frontend stack.
SKILL.md 本文
コンテンツ実験のベストプラクティス
コンバージョン率、エンゲージメント、ユーザー体験を改善するための効果的なコンテンツ実験を実施するための原則とパターン。
適用する時機
以下の場合は、これらのガイドラインを参照してください:
- A/B テストまたは多変量テスト インフラストラクチャのセットアップ
- コンテンツ変更の実験設計
- テスト結果の分析と解釈
- 実験用の CMS 統合の構築
- 何をテストするか、どのようにテストするかの決定
コアコンセプト
A/B テスト
2つのバリアント (A vs B) を比較して、どちらがより良い成績を上げるかを判定します。
多変量テスト
複数の変数を同時にテストして、最適な組み合わせを見つけます。
統計的有意性
結果がランダムな偶然ではないという信頼レベル。
実験文化
意見ではなくデータに基づいて意思決定を行う (HiPPO回避)。
リファレンス
現在の問題に合致するリファレンスから開始してください。例えば、設計、統計、CMS 統合、または落とし穴などです。詳細なガイダンスについては references/ を参照してください:
references/experiment-design.md— 仮説フレームワーク、メトリクス、サンプルサイズ、テスト対象の決定references/statistical-foundations.md— p 値、信頼区間、検出力分析、ベイズ手法references/cms-integration.md— CMS 管理バリアント、フィールドレベルバリアント、外部プラットフォームreferences/common-pitfalls.md— 統計、設計、実行、解釈全体における 17 の一般的なミス
ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ
詳細情報
- 作者
- sanity-io
- ライセンス
- MIT
- 最終更新
- 不明
Source: https://github.com/sanity-io/agent-toolkit / ライセンス: MIT
関連スキル
doubt-driven-development
重要な判断はすべて、本番環境への展開前に新しい視点から対抗的レビューを実施します。速度より正確性が重要な場合、不慣れなコードを扱う場合、本番環境・セキュリティに関わるロジック・取り消し不可の操作など影響度が高い場合、または後でバグを修正するよりも今検証する方が効率的な場合に活用してください。
apprun-skills
TypeScriptを使用したAppRunアプリケーションのMVU設計に関する総合的なガイダンスが得られます。コンポーネントパターン、イベントハンドリング、状態管理(非同期ジェネレータを含む)、パラメータと保護機能を備えたルーティング・ナビゲーション、vistestを使用したテストに対応しています。AppRunコンポーネントの設計・レビュー、ルートの配線、状態フローの管理、AppRunテストの作成時に活用してください。
desloppify
コードベースのヘルスチェックと技術負債の追跡ツールです。コード品質、技術負債、デッドコード、大規模ファイル、ゴッドクラス、重複関数、コードスメル、命名規則の問題、インポートサイクル、結合度の問題についてユーザーが質問した場合に使用してください。また、ヘルススコアの確認、次の改善項目の提案、クリーンアップ計画の作成をリクエストされた際にも対応します。29言語に対応しています。
debugging-and-error-recovery
テストが失敗したり、ビルドが壊れたり、動作が期待と異なったり、予期しないエラーが発生したりした場合に、体系的な根本原因デバッグをガイドします。推測ではなく、根本原因を見つけて修正するための体系的なアプローチが必要な場合に使用してください。
test-driven-development
テスト駆動開発により実装を進めます。ロジックの実装、バグの修正、動作の変更など、あらゆる場面で活用できます。コードが正常に動作することを証明する必要がある場合、バグ報告を受けた場合、既存機能を修正する予定がある場合に使用してください。
incremental-implementation
変更を段階的に実施します。複数のファイルに影響する機能や変更を実装する場合に使用してください。大量のコードを一度に書こうとしている場合や、タスクが一度では完結できないほど大きい場合に活用します。