agentic-engineering
エージェント・エンジニアとして、評価優先実行、タスク分解、コスト効率的なモデルルーティングを活用して動作します。
description の原文を見る
Operate as an agentic engineer using eval-first execution, decomposition, and cost-aware model routing.
SKILL.md 本文
エージェンティック・エンジニアリング
AIエージェントが実装作業の大部分を実行し、人間が品質とリスク管理を強化するエンジニアリングワークフローで、このスキルを使用します。
運用原則
- 実行前に完了基準を定義する
- 作業をエージェント単位に分解する
- タスク複雑性によってモデルティアをルーティングする
- 評価とリグレッション検査で測定する
評価ファースト・ループ
- 機能評価とリグレッション評価を定義する
- ベースラインを実行して失敗シグネチャを記録する
- 実装を実行する
- 評価を再実行して差分を比較する
タスク分解
15分単位ルールを適用します:
- 各単位は独立して検証可能である必要がある
- 各単位は単一の主要なリスクを持つ必要がある
- 各単位は明確な完了条件を表示する必要がある
モデルルーティング
- Haiku: 分類、テンプレート変換、限定的な編集
- Sonnet: 実装とリファクタリング
- Opus: アーキテクチャ、根本原因分析、マルチファイル不変性
セッション戦略
- 密結合された単位についてはセッションを継続する
- 主要なフェーズ移行後に新しいセッションを開始する
- マイルストーン完了後に圧縮し、アクティブなデバッグ中は行わない
AIが生成したコードのレビュー重点
優先順位をつけて確認する項目:
- 不変性とエッジケース
- エラー境界
- セキュリティと認証の前提
- 隠れたカップリングとロールアウトリスク
自動フォーマット/lintが既にスタイルを適用している場合、スタイルのみの差異に対するレビューサイクルを浪費しない
コスト規律
タスクごとに追跡する:
- モデル
- トークン推定
- 再試行回数
- ウォールクロック時間
- 成功/失敗
下位のティアが明確な推論ギャップで失敗した場合にのみ、モデルティアをエスカレートする
原文
英語版の原文
ナビゲーション
日本語ドキュメント一覧skills/README.md貢献ガイド
ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ
詳細情報
- 作者
- loulanyue
- ライセンス
- MIT
- 最終更新
- 2026/5/3
Source: https://github.com/loulanyue/awesome-claude-notes / ライセンス: MIT
関連スキル
agent-browser
AI エージェント向けのブラウザ自動化 CLI です。ウェブサイトとの対話が必要な場合に使用します。ページ遷移、フォーム入力、ボタンクリック、スクリーンショット取得、データ抽出、ウェブアプリのテスト、ブラウザ操作の自動化など、あらゆるブラウザタスクに対応できます。「ウェブサイトを開く」「フォームに記入する」「ボタンをクリックする」「スクリーンショットを取得する」「ページからデータを抽出する」「このウェブアプリをテストする」「サイトにログインする」「ブラウザ操作を自動化する」といった要求や、プログラマティックなウェブ操作が必要なタスクで起動します。
anyskill
AnySkill — あなたのプライベート・スキルクラウド。GitHubを基盤としたリポジトリからエージェントスキルを管理、同期、動的にロードできます。自然言語でクラウドスキルを検索し、オンデマンドでプロンプトを自動ロード、カスタムスキルのアップロードと共有、スキルバンドルの一括インストールが可能です。OpenClaw、Antigravity、Claude Code、Cursorに対応しています。
engram
AIエージェント向けの永続的なメモリシステムです。バグ修正、意思決定、発見、設定変更の後はmem_saveを使用してください。ユーザーが「覚えている」「記憶している」と言及した場合、または以前のセッションと重複する作業を開始する際はmem_searchを使用します。セッション終了前にmem_session_summaryを使用して、コンテキストを保持してください。
skyvern
AI駆動のブラウザ自動化により、任意のウェブサイトを自動化できます。フォーム入力、データ抽出、ファイルダウンロード、ログイン、複数ステップのワークフロー実行など、ユーザーがウェブサイトと連携する必要があるときに使用します。Skyvernは、LLMとコンピュータビジョンを活用して、未知のサイトも自動操作可能です。Python SDK、TypeScript SDK、REST API、MCPサーバー、またはCLIを通じて統合できます。
pinchbench
PinchBenchベンチマークを実行して、OpenClawエージェントの実世界タスクにおけるパフォーマンスを評価できます。モデルの機能テスト、モデル間の比較、ベンチマーク結果のリーダーボード提出、またはOpenClawのセットアップがカレンダー、メール、リサーチ、コーディング、複数ステップのワークフローにどの程度対応しているかを確認する際に使用します。
openui
OpenUIとOpenUI Langを使用してジェネレーティブUIアプリを構築できます。これらはLLM生成インターフェースのためのトークン効率的なオープン標準です。OpenUI、@openuidev、ジェネレーティブUI、LLMからのストリーミングUI、AI向けコンポーネントライブラリ、またはjson-render/A2UIの置き換えについて述べる際に使用します。スキャフォルディング、defineComponent、システムプロンプト、Renderer、およびOpenUI Lang出力のデバッグに対応しています。