Anthropic ClaudeLLM・AI開発⭐ リポ 1品質スコア 58/100
agentic-engineering
eval-first executionとタスク分解、費用効率的なモデルルーティングを活用して、エージェンティックエンジニアとして動作します。
description の原文を見る
Operate as an agentic engineer using eval-first execution, decomposition, and cost-aware model routing.
SKILL.md 本文
エージェンティック・エンジニアリング
AIエージェントがほとんどの実装作業を行い、人間が品質とリスク管理を監視するエンジニアリングワークフロー向けのスキルです。
運用原則
- 実行前に完了基準を定義します。
- 作業をエージェント規模のユニットに分解します。
- タスクの複雑さに応じてモデルティアをルーティングします。
- 評価とリグレッションチェックで測定します。
評価ファースト・ループ
- 機能評価とリグレッション評価を定義します。
- ベースラインを実行して失敗パターンをキャプチャします。
- 実装を実行します。
- 評価を再実行して差分を比較します。
タスク分解
15分ユニット・ルールを適用します:
- 各ユニットは独立して検証可能である必要があります
- 各ユニットは単一の支配的なリスクを持つ必要があります
- 各ユニットは明確な完了条件を示す必要があります
モデル・ルーティング
- Haiku:分類、ボイラープレート変換、限定的な編集
- Sonnet:実装とリファクタリング
- Opus:アーキテクチャ、根本原因分析、複数ファイル間の不変量
セッション戦略
- 密結合なユニットはセッションを継続します。
- 主要なフェーズ遷移後に新しいセッションを開始します。
- アクティブなデバッグ中ではなく、マイルストーン完了後にコンパクト化します。
AI生成コードのレビュー重点
優先順位:
- 不変量と境界ケース
- エラー境界
- セキュリティと認証の仮定
- 隠れた結合とロールアウトリスク
自動フォーマット/リントで既に実施されているスタイル専用の意見相違にレビューサイクルを浪費しないでください。
コスト規律
タスクごとに追跡します:
- モデル
- トークン推定値
- 再試行回数
- 実経過時間
- 成功/失敗
下位ティアが明確な推論ギャップで失敗した場合にのみ、モデルティアをエスカレートします。
ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ
詳細情報
- 作者
- ahippelainen
- ライセンス
- MIT
- 最終更新
- 2026/5/8
Source: https://github.com/ahippelainen/claude-loadout / ライセンス: MIT