dual-axis-skill-reviewer
コードベースの静的検査(構造・スクリプト・テスト・実行安全性)とLLMによる深層レビューの2軸でスキルの品質を評価します。`skills/*/SKILL.md` に対して再現性のある品質スコアを算出したい場合、スコア閾値(例:90点以上)によるマージ制御を行いたい場合、または低スコアスキルの具体的な改善点を洗い出したい場合に活用してください。`--project-root` オプションにより、複数プロジェクトをまたいで利用できます。
description の原文を見る
Review skills in any project using a dual-axis method: (1) deterministic code-based checks (structure, scripts, tests, execution safety) and (2) LLM deep review findings. Use when you need reproducible quality scoring for `skills/*/SKILL.md`, want to gate merges with a score threshold (for example 90+), or need concrete improvement items for low-scoring skills. Works across projects via --project-root.
SKILL.md 本文
デュアルアクシス・スキルレビュアー
デュアルアクシスレビュアースクリプトを実行し、レポートを reports/ に保存します。
スクリプトは以下をサポートしています:
- ランダムまたは固定のスキル選択
- オプションでテスト実行を含む自動アクシススコアリング
- LLMプロンプト生成
- LLM JSON レビューマージと加重最終スコア
--project-rootによる複数プロジェクト間のレビュー
利用場面
skills/*/SKILL.mdの1つのスキルに対して再現可能なスコアリングが必要な場合。- 最終スコアが90未満の場合に改善項目が必要な場合。
- 決定論的なチェックと定性的なLLMコード/コンテンツレビューの両方が必要な場合。
- 別のプロジェクト のスキルをコマンドラインからレビューする必要がある場合。
前提条件
- Python 3.9+
uv(推奨 — インラインメタデータ経由でpyyaml依存関係を自動解決)- テスト用:ターゲットプロジェクトで
uv sync --extra devまたは同等の処理 - LLMアクシスマージ用:LLMレビュースキーマに従うJSONファイル(リソースを参照)
ワークフロー
コンテキストに基づいて正しいスクリプトパスを決定します:
- 同じプロジェクト:
skills/dual-axis-skill-reviewer/scripts/run_dual_axis_review.py - グローバルインストール:
~/.claude/skills/dual-axis-skill-reviewer/scripts/run_dual_axis_review.py
以下の例では REVIEWER をプレースホルダーとして使用しています。一度設定してください:
# 同じプロジェクトからレビューする場合:
REVIEWER=skills/dual-axis-skill-reviewer/scripts/run_dual_axis_review.py
# 別のプロジェクトをレビューする場合(グローバルインストール):
REVIEWER=~/.claude/skills/dual-axis-skill-reviewer/scripts/run_dual_axis_review.py
ステップ1:自動アクシスを実行してLLMプロンプトを生成
uv run "$REVIEWER" \
--project-root . \
--emit-llm-prompt \
--output-dir reports/
別のプロジェクトをレビューする場合は、--project-root をそれに指定してください:
uv run "$REVIEWER" \
--project-root /path/to/other/project \
--emit-llm-prompt \
--output-dir reports/
ステップ2:LLMレビューを実行
reports/skill_review_prompt_<skill>_<timestamp>.mdに生成されたプロンプトファイルを使用します。- LLMに厳密なJSON出力を返すよう指示します。
- Claude Code内で実行する場合は、Claudeをオーケストレーターとして機能させます:生成されたプロンプトを読み、LLMレビュー JSONを生成し、マージステップ用に保存します。
ステップ3:自動アクシスとLLMアクシスをマージ
uv run "$REVIEWER" \
--project-root . \
--skill <skill-name> \
--llm-review-json <path-to-llm-review.json> \
--auto-weight 0.5 \
--llm-weight 0.5 \
--output-dir reports/
ステップ4:オプション制御
- 再現性のための固定選択:
--skill <name>または--seed <int> - すべてのスキルを一度にレビュー:
--all - クイックトリアージのためテストをスキップ:
--skip-tests - レポートの場所を変更:
--output-dir <dir> - より厳密な決定論的ゲーティングのため
--auto-weightを増加。 - 定性的/コードレビューの深さが優先される場合、
--llm-weightを増加。
出力
reports/skill_review_<skill>_<timestamp>.jsonreports/skill_review_<skill>_<timestamp>.mdreports/skill_review_prompt_<skill>_<timestamp>.md(--emit-llm-promptが有効な場合)
インストール(グローバル)
このスキルを任意のプロジェクトから使用するには、~/.claude/skills/ にシンボリックリンクを作成します:
ln -sfn /path/to/claude-trading-skills/skills/dual-axis-skill-reviewer \
~/.claude/skills/dual-axis-skill-reviewer
その後、Claude Code はすべてのプロジェクトでスキルを検出し、スクリプトは ~/.claude/skills/dual-axis-skill-reviewer/scripts/run_dual_axis_review.py でアクセス可能になります。
リソース
- 自動アクシスは、メタデータ、ワークフローカバレッジ、実行の安全性、アーティファクトの存在、テストヘルスをスコアリングします。
- 自動アクシスは
knowledge_onlyスキルを検出し、スクリプト/テスト期待値を調整して不公正なペナルティを回避します。 - LLMアクシスは深いコンテンツ品質(正確性、リスク、欠落ロジック、保守性)をスコアリングします。
- 最終スコアは加重平均です。
- 最終スコアが90未満の場合、改善項目が必要であり、マークダウンレポートにリストされます。
- スクリプト:
skills/dual-axis-skill-reviewer/scripts/run_dual_axis_review.py - LLMスキーマ:
references/llm_review_schema.md - ルーブリック詳細:
references/scoring_rubric.md
ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ
詳細情報
- 作者
- tradermonty
- ライセンス
- MIT
- 最終更新
- 不明
Source: https://github.com/tradermonty/claude-trading-skills / ライセンス: MIT
関連スキル
agent-browser
AI エージェント向けのブラウザ自動化 CLI です。ウェブサイトとの対話が必要な場合に使用します。ページ遷移、フォーム入力、ボタンクリック、スクリーンショット取得、データ抽出、ウェブアプリのテスト、ブラウザ操作の自動化など、あらゆるブラウザタスクに対応できます。「ウェブサイトを開く」「フォームに記入する」「ボタンをクリックする」「スクリーンショットを取得する」「ページからデータを抽出する」「このウェブアプリをテストする」「サイトにログインする」「ブラウザ操作を自動化する」といった要求や、プログラマティックなウェブ操作が必要なタスクで起動します。
anyskill
AnySkill — あなたのプライベート・スキルクラウド。GitHubを基盤としたリポジトリからエージェントスキルを管理、同期、動的にロードできます。自然言語でクラウドスキルを検索し、オンデマンドでプロンプトを自動ロード、カスタムスキルのアップロードと共有、スキルバンドルの一括インストールが可能です。OpenClaw、Antigravity、Claude Code、Cursorに対応しています。
engram
AIエージェント向けの永続的なメモリシステムです。バグ修正、意思決定、発見、設定変更の後はmem_saveを使用してください。ユーザーが「覚えている」「記憶している」と言及した場合、または以前のセッションと重複する作業を開始する際はmem_searchを使用します。セッション終了前にmem_session_summaryを使用して、コンテキストを保持してください。
skyvern
AI駆動のブラウザ自動化により、任意のウェブサイトを自動化できます。フォーム入力、データ抽出、ファイルダウンロード、ログイン、複数ステップのワークフロー実行など、ユーザーがウェブサイトと連携する必要があるときに使用します。Skyvernは、LLMとコンピュータビジョンを活用して、未知のサイトも自動操作可能です。Python SDK、TypeScript SDK、REST API、MCPサーバー、またはCLIを通じて統合できます。
pinchbench
PinchBenchベンチマークを実行して、OpenClawエージェントの実世界タスクにおけるパフォーマンスを評価できます。モデルの機能テスト、モデル間の比較、ベンチマーク結果のリーダーボード提出、またはOpenClawのセットアップがカレンダー、メール、リサーチ、コーディング、複数ステップのワークフローにどの程度対応しているかを確認する際に使用します。
openui
OpenUIとOpenUI Langを使用してジェネレーティブUIアプリを構築できます。これらはLLM生成インターフェースのためのトークン効率的なオープン標準です。OpenUI、@openuidev、ジェネレーティブUI、LLMからのストリーミングUI、AI向けコンポーネントライブラリ、またはjson-render/A2UIの置き換えについて述べる際に使用します。スキャフォルディング、defineComponent、システムプロンプト、Renderer、およびOpenUI Lang出力のデバッグに対応しています。