sf-ai-agentforce-testing
Agentforceエージェントのテストを、デュアルトラックワークフローと100点満点のスコアリングで実施するスキルです。ユーザーがAgentforceエージェントのテスト、`sf agent test`コマンドの実行、テストスペックの作成、トピックルーティングの検証、またはエージェントのテストカバレッジ分析を行う際にトリガーされます。Apexユニットテスト(`sf-testing`を使用)、エージェントの構築(`sf-ai-agentforce`を使用)、またはAgent Script DSL(`sf-ai-agentscript`を使用)の場合はトリガーされません。
description の原文を見る
> Agentforce agent testing with dual-track workflow and 100-point scoring. TRIGGER when: user tests Agentforce agents, runs sf agent test commands, creates test specs, validates topic routing, or analyzes agent test coverage. DO NOT TRIGGER when: Apex unit tests (use sf-testing), building agents (use sf-ai-agentforce), or Agent Script DSL (use sf-ai-agentscript).
SKILL.md 本文
sf-ai-agentforce-testing: Agentforce テスト実行とカバレッジ分析
ユーザーが公式な Agentforce テストを必要とする場合に、このスキルを使用します。マルチターン会話検証、CLI Testing Center スペック、トピック/アクションカバレッジ分析、プレビューチェック、または公開後の構造化されたテスト修正ループなど。
このスキルがタスクを所有する場合
以下の作業が含まれる場合、sf-ai-agentforce-testing を使用します:
sf agent testワークフロー- マルチターン Agent Runtime API テスト
- トピックルーティング、アクション呼び出し、コンテキスト保存、ガードレール、またはエスカレーション検証
- テストスペック生成とカバレッジ分析
- 公開後/有効化後のテスト修正ループ
ユーザーが以下を行っている場合は他にデリゲートします:
- エージェント自体の構築または編集 →
sf-ai-agentforceまたはsf-ai-agentscript - Apex ユニットテストを実行 →
sf-testing - アクション用のシードデータを作成 →
sf-data - セッションテレメトリ / STDM トレースを分析 →
sf-ai-agentforce-observability
コア運用ルール
- テストはデプロイ/公開/有効化の後に実行します。
- 会話の継続性が重要な場合、マルチターン API テストをプライマリパスとして使用します。
- 単一発話とorg サポートのテストセンターワークフローの場合、CLI Testing Center をセカンダリパスとして使用します。
- インタラクティブおよびプログラムの CLI プレビューは標準
sf org login web認証を使用します。ECA は Agent Runtime API テストにのみ必要であり、ライブプレビューには不要です。 - Agent Script 変更が必要な場合、エージェントへの修正は
sf-ai-agentscriptにデリゲートします。 - ECA フローの OAuth トークン検証に生の
curlを使用しません。提供されている認証情報ツーリングを使用します。
スクリプトパスルール
以下の既存スクリプトを使用します:
~/.claude/skills/sf-ai-agentforce-testing/hooks/scripts/
これらのスクリプトは事前承認されています。再作成しないでください。
<a id="phase-0-prerequisites--agent-discovery"></a>
最初に収集する必要なコンテキスト
以下について質問するか推測します:
- エージェント API 名/デベロッパー名
- ターゲット org エイリアス
- テストの目標:スモークテスト、リグレッション、カバレッジ拡大、またはバグ再現
- エージェントが既に公開され有効化されているか
- org にAgent Testing Center が利用可能か
- ECA 認証情報が Agent Runtime API テストに利用可能か
プリフライトチェック:
- エージェントを検出する
- 公開/有効化状態を確認する
- 依存関係(Flow、Apex、データ)を確認する
- テストトラックを選択する
デュアルトラックワークフロー
トラック A — マルチターン API テスト(プライマリ)
以下が必要な場合に使用します:
- マルチターン会話テスト
- トピック再マッチング検証
- コンテキスト保存チェック
- ターン全体でのエスカレーションまたはアクションチェーン分析
必須:
- ECA/認証セットアップ
- エージェントランタイムアクセス
トラック B — CLI Testing Center(セカンダリ)
以下が必要な場合に使用します:
- org ネイティブ
sf agent testワークフロー - テストスペック YAML 実行
- クイック単一発話検証
- Testing Center が利用可能な CLI 中心の CI/CD 使用
クイック手動パス
完全な公式テストなしで手動検証する場合、最初にプレビューワークフローを使用してから、必要に応じてトラック A または B にエスカレートします。
推奨ワークフロー
1. 検出と検証
- ターゲット org でエージェントを配置する
- 公開され有効化されていることを確認する
- 必要なアクション/Flow/Apex が存在することを確認する
- トラック A または B がリクエストに適しているかを判断する
2. テストを計画する
以下を少なくともカバーします:
- メイントピック
- 期待されるアクション
- ガードレール/オフトピック処理
- エスカレーション動作
- 表現のバリエーション
3. 正しいトラックを実行する
トラック A
- 提供されているツーリングで ECA 認証情報を検証する
- シナリオ生成に必要なメタデータを取得する
- 提供されている Python スクリプトでマルチターンシナリオを実行する
- ターンごとの失敗とカバレッジを分析する
トラック B
- フラット YAML テストスペックを生成または改善する
sf agent testコマンドを実行する- 構造化結果と詳細なアクション出力を検査する
4. 失敗を分類する
典型的な失敗バケット:
- トピックがマッチしない
- 間違ったトピックがマッチした
- アクションが呼び出されない
- 間違ったアクションが選択された
- アクション呼び出しが失敗した
- コンテキスト保存失敗
- ガードレール失敗
- エスカレーション失敗
5. 修正ループを実行する
失敗がエージェント作成の問題を示唆する場合:
sf-ai-agentscriptに修正をデリゲートする- 必要に応じて再公開/再有効化する
- フルリグレッション前にフォーカスされたテストを再実行する
テストガードレール
これらをスキップしないでください:
- 公開/有効化後のみテストする
- 有害/オフトピック/拒否シナリオを含める
- 重要なトピックごとに複数の表現を使用する
- API テスト後にセッションをクリーンアップする
- スワーム実行を小さく制御された状態に保つ
これらのアンチパターンを避けます:
- 未公開エージェントをテストする
- 1つのハッピーパス発話をカバレッジとして扱う
- ECA シークレットをリポジトリファイルに保存する
- もろい shell 拡張
curlコマンドで認証をデバッグする - 原因を分離せずに同時にテストとエージェントの両方を変更する
出力フォーマット
実行が終了したら、この順序でレポートします:
- 使用されたテストトラック
- 何が実行されたか
- 成功/失敗サマリー
- カバレッジギャップ
- 根本原因のテーマ
- 推奨される修正ループ/次のテストステップ
提案されるシェイプ:
Agent: <name>
Track: Multi-turn API | CLI Testing Center | Preview
Executed: <specs / scenarios / turns>
Result: <passed / partial / failed>
Coverage: <topics, actions, guardrails, context>
Issues: <highest-signal failures>
Next step: <fix, republish, rerun, or expand coverage>
クロススキル統合
| ニーズ | デリゲート先 | 理由 |
|---|---|---|
| Agent Script ロジックを修正する | sf-ai-agentscript | 作成と決定論的な修正ループ |
| テストデータを作成する | sf-data | アクション対応データセットアップ |
| Flow 支援のアクションを修正する | sf-flow | Flow 修復 |
| Apex 支援のアクションを修正する | sf-apex | Apex 修復 |
| Agent Runtime API 用の ECA/OAuth をセットアップする | sf-connected-apps | 認証とアプリ設定 |
| セッションテレメトリを分析する | sf-ai-agentforce-observability | STDM/トレース分析 |
リファレンスマップ
ここから開始
references/interview-wizard.mdreferences/multi-turn-testing.mdreferences/cli-commands.mdreferences/test-spec-reference.md
実行/認証
references/execution-protocol.mdreferences/multi-turn-execution.mdreferences/eca-setup-guide.mdreferences/credential-convention.mdreferences/connected-app-setup.md
カバレッジ/修正ループ
references/coverage-analysis.mdreferences/agentic-fix-loops.mdreferences/results-scoring.mdreferences/known-issues.md
高度な/特殊化
references/agentscript-agents.mdreferences/agentscript-testing-patterns.mdreferences/cli-testing-details.mdreferences/deep-conversation-history-patterns.mdreferences/swarm-execution.mdreferences/trace-analysis.mdreferences/agent-api-reference.md
テンプレート/アセット
references/test-templates.mdreferences/test-plan-format.mdassets/
スコアガイド
| スコア | 意味 |
|---|---|
| 90+ | 本番環境対応テスト信頼性 |
| 80–89 | マイナーなギャップを持つ強いカバレッジ |
| 70–79 | 許容可能だがカバレッジ拡大を推奨 |
| 60–69 | 部分的な検証のみ |
| < 60 | 不十分な信頼性、リリースをブロック |
ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ
詳細情報
- 作者
- jaganpro
- リポジトリ
- jaganpro/sf-skills
- ライセンス
- MIT
- 最終更新
- 不明
Source: https://github.com/jaganpro/sf-skills / ライセンス: MIT
関連スキル
agent-browser
AI エージェント向けのブラウザ自動化 CLI です。ウェブサイトとの対話が必要な場合に使用します。ページ遷移、フォーム入力、ボタンクリック、スクリーンショット取得、データ抽出、ウェブアプリのテスト、ブラウザ操作の自動化など、あらゆるブラウザタスクに対応できます。「ウェブサイトを開く」「フォームに記入する」「ボタンをクリックする」「スクリーンショットを取得する」「ページからデータを抽出する」「このウェブアプリをテストする」「サイトにログインする」「ブラウザ操作を自動化する」といった要求や、プログラマティックなウェブ操作が必要なタスクで起動します。
anyskill
AnySkill — あなたのプライベート・スキルクラウド。GitHubを基盤としたリポジトリからエージェントスキルを管理、同期、動的にロードできます。自然言語でクラウドスキルを検索し、オンデマンドでプロンプトを自動ロード、カスタムスキルのアップロードと共有、スキルバンドルの一括インストールが可能です。OpenClaw、Antigravity、Claude Code、Cursorに対応しています。
engram
AIエージェント向けの永続的なメモリシステムです。バグ修正、意思決定、発見、設定変更の後はmem_saveを使用してください。ユーザーが「覚えている」「記憶している」と言及した場合、または以前のセッションと重複する作業を開始する際はmem_searchを使用します。セッション終了前にmem_session_summaryを使用して、コンテキストを保持してください。
skyvern
AI駆動のブラウザ自動化により、任意のウェブサイトを自動化できます。フォーム入力、データ抽出、ファイルダウンロード、ログイン、複数ステップのワークフロー実行など、ユーザーがウェブサイトと連携する必要があるときに使用します。Skyvernは、LLMとコンピュータビジョンを活用して、未知のサイトも自動操作可能です。Python SDK、TypeScript SDK、REST API、MCPサーバー、またはCLIを通じて統合できます。
pinchbench
PinchBenchベンチマークを実行して、OpenClawエージェントの実世界タスクにおけるパフォーマンスを評価できます。モデルの機能テスト、モデル間の比較、ベンチマーク結果のリーダーボード提出、またはOpenClawのセットアップがカレンダー、メール、リサーチ、コーディング、複数ステップのワークフローにどの程度対応しているかを確認する際に使用します。
openui
OpenUIとOpenUI Langを使用してジェネレーティブUIアプリを構築できます。これらはLLM生成インターフェースのためのトークン効率的なオープン標準です。OpenUI、@openuidev、ジェネレーティブUI、LLMからのストリーミングUI、AI向けコンポーネントライブラリ、またはjson-render/A2UIの置き換えについて述べる際に使用します。スキャフォルディング、defineComponent、システムプロンプト、Renderer、およびOpenUI Lang出力のデバッグに対応しています。