Anthropic Claudeソフトウェア開発⭐ リポ 7品質スコア 59/100
investigate-golden-flake
GitHub Actionsのログからfailingしているgolden testをデバッグし、非決定性を隠すことなく根本原因を修正します。
description の原文を見る
Debug a failing golden test from GitHub Actions logs and fix the root cause without papering over nondeterminism.
SKILL.md 本文
注意: このスキルのライセンスは ライセンス未確認 です。本サイトでは本文プレビューのみを表示しています。利用前に GitHub の原本でライセンス条件をご確認ください。
ゴールデンフレークの調査
CI ログからゴールデンテストの失敗をデバッグし、根本原因を特定して修正します。
入力: ユーザーは失敗したゴールデンテストの GitHub Actions URL(実行またはジョブリンク)を提供します。
ステップ 1: CI 失敗の詳細を取得
URL から実行 ID とジョブ ID を抽出し、失敗したログを取得します:
gh run view <run_id> --job <job_id> --log-failed
ユーザーがジョブ ID なしの実行 URL を指定した場合は、まずジョブをリストアップします:
gh run view <run_id> --json jobs --jq '.jobs[] | "\(.databaseId) \(.name) \(.conclusion)"'
ログから以下を特定します:
- どのゴールデンテストが失敗したか(例:
test_golden_dark_depths_combo) - 差分出力 — 期待値と実際の値を示す
_json_diff行 - どのフェーズが失敗したか — プロンプト比較(
assert_golden_prompt)またはエクスポート比較(`assert_golden_e
...
詳細情報
- 作者
- majiayu000
- ライセンス
- 不明
- 最終更新
- 2026/5/9
Source: https://github.com/majiayu000/claude-skill-registry-data / ライセンス: 未指定