Anthropic ClaudeLLM・AI開発⭐ リポ 0品質スコア 50/100

agentic-engineering

Name: agentic-engineering
Author: affaan-m

AIエージェントが実装作業の大部分を担う開発環境において、評価駆動の実行・タスク分解・コスト意識を持つモデルルーティングを組み合わせてエンジニアリングを行うスキル。人間が品質管理とリスク管理を担う役割を果たす場面で使用する。

description の原文を見る

> Operate as an agentic engineer using eval-first execution, decomposition, and cost-aware model routing. Use when AI agents perform most implementation work and humans enforce quality and risk controls.

SKILL.md 本文

Agentic Engineering

AI エージェントがほとんどの実装作業を行い、人間が品質とリスク管理を行うエンジニアリングワークフローにこのスキルを使用します。

運用原則

実行前に完了基準を定義します。
作業をエージェント単位に分解します。
タスク複雑性に応じてモデルティアをルーティングします。
eval と回帰チェックで測定します。

Eval-First ループ

機能 eval と回帰 eval を定義します。
ベースラインを実行して失敗シグネチャをキャプチャします。
実装を実行します。
eval を再実行し、差分を比較します。

ワークフロー例：

1. 目的のふるまいをキャプチャするテストを作成する (eval)
2. テストを実行 → ベースラインの失敗をキャプチャ
3. 機能を実装する
4. テストを再実行 → 改善を確認
5. 他のテストで回帰がないかチェック

タスク分解

15分単位ルールを適用します：

各ユニットは独立して検証可能である必要があります
各ユニットは単一の支配的なリスクを持つ必要があります
各ユニットは明確な完了条件を示す必要があります

良い分解：

タスク: ユーザー認証を追加
├─ ユニット 1: パスワードハッシング追加 (15分、セキュリティリスク)
├─ ユニット 2: ログインエンドポイント作成 (15分、API契約リスク)
├─ ユニット 3: セッション管理を追加 (15分、状態リスク)
└─ ユニット 4: ミドルウェアでルートを保護 (15分、認証ロジックリスク)

悪い分解：

タスク: ユーザー認証を追加 (2時間、複数のリスク)

モデルルーティング

タスク複雑性に基づいてモデルティアを選択します：

Haiku: 分類、ボイラープレート変換、狭い範囲の編集
- 例：変数名の変更、型注釈の追加、コードフォーマット
Sonnet: 実装とリファクタリング
- 例：機能の実装、モジュールのリファクタリング、テスト作成
Opus: アーキテクチャ、根本原因分析、複数ファイルにまたがる不変条件
- 例：システム設計、複雑な問題のデバッグ、アーキテクチャレビュー

コスト規律： 下位のティアが明確な推論ギャップで失敗した場合にのみ、モデルティアを昇格させます。

セッション戦略

セッションを続行 する (密結合ユニット)
- 例：同じモジュール内の関連関数を実装する
メジャーフェーズ遷移後に新規セッションを開始 する
- 例：実装からテストへ移行する
マイルストーン完了後にコンパクト化 する (アクティブなデバッグ中ではなく)
- 例：機能完成後、次の機能開始前

AI 生成コードのレビュー重点

優先順位：

不変条件とエッジケース
エラー境界
セキュリティと認証の前提条件
隠れた結合とロールアウトリスク

自動フォーマット/lint がすでにスタイルを適用している場合、スタイルのみの不一致にレビューサイクルを費やさないでください。

レビューチェックリスト：

エッジケースを処理している (null、空、境界値)
エラーハンドリングが包括的である
セキュリティ前提条件が検証されている
モジュール間に隠れた結合がない
ロールアウトリスクが評価されている (破壊的変更、マイグレーション)

コスト規律

タスクごとに追跡します：

使用モデルティア
トークン予測
必要な再試行
ウォールクロック時間
成功/失敗の結果

追跡例：

タスク: ユーザーログイン実装
モデル: Sonnet
トークン: 約 5k 入力、約 2k 出力
再試行: 1回 (初期実装に認証バグ)
時間: 8分
結果: 成功

このスキルを使用する場合

AI 駆動開発ワークフローを管理する
エージェントタスク分解を計画する
モデルティア選択を最適化する
評価ファースト開発を実装する
AI 生成コードをレビューする
開発コストを追跡する

他のスキルとの統合

tdd-workflow: テスト駆動開発のため eval-first ループと組み合わせます
verification-loop: 実装中の継続的な検証に使用します
search-first: 実装前に既存ソリューションを検索するために適用します
coding-standards: コードレビューフェーズ中に参照します

ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ

詳細情報

作者: affaan-m
リポジトリ: affaan-m/everything-claude-code
ライセンス: MIT
最終更新: 不明

GitHubで原本を見る →フィードバックを送る

Source: https://github.com/affaan-m/everything-claude-code / ライセンス: MIT

agentic-engineering

SKILL.md 本文

Agentic Engineering

運用原則

Eval-First ループ

タスク分解

モデルルーティング

セッション戦略

AI 生成コードのレビュー重点

コスト規律

このスキルを使用する場合

他のスキルとの統合

詳細情報

関連スキル

agent-browser

anyskill

engram

skyvern

pinchbench

openui