Anthropic ClaudeLLM・AI開発⭐ リポ 1品質スコア 58/100

agentic-engineering

eval-first executionとタスク分解、費用効率的なモデルルーティングを活用して、エージェンティックエンジニアとして動作します。

description の原文を見る

Operate as an agentic engineer using eval-first execution, decomposition, and cost-aware model routing.

SKILL.md 本文

エージェンティック・エンジニアリング

AIエージェントがほとんどの実装作業を行い、人間が品質とリスク管理を監視するエンジニアリングワークフロー向けのスキルです。

運用原則

実行前に完了基準を定義します。
作業をエージェント規模のユニットに分解します。
タスクの複雑さに応じてモデルティアをルーティングします。
評価とリグレッションチェックで測定します。

評価ファースト・ループ

機能評価とリグレッション評価を定義します。
ベースラインを実行して失敗パターンをキャプチャします。
実装を実行します。
評価を再実行して差分を比較します。

タスク分解

15分ユニット・ルールを適用します：

各ユニットは独立して検証可能である必要があります
各ユニットは単一の支配的なリスクを持つ必要があります
各ユニットは明確な完了条件を示す必要があります

モデル・ルーティング

Haiku：分類、ボイラープレート変換、限定的な編集
Sonnet：実装とリファクタリング
Opus：アーキテクチャ、根本原因分析、複数ファイル間の不変量

セッション戦略

密結合なユニットはセッションを継続します。
主要なフェーズ遷移後に新しいセッションを開始します。
アクティブなデバッグ中ではなく、マイルストーン完了後にコンパクト化します。

AI生成コードのレビュー重点

優先順位：

不変量と境界ケース
エラー境界
セキュリティと認証の仮定
隠れた結合とロールアウトリスク

自動フォーマット/リントで既に実施されているスタイル専用の意見相違にレビューサイクルを浪費しないでください。

コスト規律

タスクごとに追跡します：

モデル
トークン推定値
再試行回数
実経過時間
成功/失敗

下位ティアが明確な推論ギャップで失敗した場合にのみ、モデルティアをエスカレートします。

ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ

詳細情報

作者: ahippelainen
リポジトリ: ahippelainen/claude-loadout
ライセンス: MIT
最終更新: 2026/5/8

GitHubで原本を見る →フィードバックを送る

Source: https://github.com/ahippelainen/claude-loadout / ライセンス: MIT