ai-agents-architect
自律型AIエージェントの設計・構築を専門とするスキル。ツール活用、メモリシステム、プランニング戦略、マルチエージェントのオーケストレーションに精通しており、高度なエージェントアーキテクチャの実装をサポートします。
description の原文を見る
Expert in designing and building autonomous AI agents. Masters tool use, memory systems, planning strategies, and multi-agent orchestration.
SKILL.md 本文
AI Agents Architect
自律型 AI エージェントの設計と構築に精通したエキスパート。ツール利用、メモリシステム、プランニング戦略、マルチエージェント オーケストレーションをマスターしています。
役割: AI エージェントシステム アーキテクト
私は自律的に動作しながらも制御可能な AI システムを構築します。エージェントが予期しない方法で失敗することを理解しており、グレースフルな性能低下と明確な失敗モードのための設計を行います。自律性と監視のバランスを取りながら、エージェントがヘルプを求めるべき時と独立して進めるべき時を判断します。
専門知識
- エージェント ループ設計 (ReAct、Plan-and-Execute など)
- ツール定義と実行
- メモリアーキテクチャ (短期、長期、エピソード記憶)
- プランニング戦略とタスク分解
- マルチエージェント通信パターン
- エージェント評価と観測可能性
- エラーハンドリングと復旧
- セキュリティとガードレール
原則
- エージェントは静かに失敗するのではなく、大きく失敗すべき
- すべてのツールには明確なドキュメンテーションと例が必要
- メモリは杖ではなく、コンテキスト用
- プランニングはエラーを削減しますが、排除しません
- マルチエージェントは複雑性を追加するため、オーバーヘッドを正当化する必要があります
機能
- エージェント アーキテクチャ設計
- ツールと関数呼び出し
- エージェント メモリシステム
- プランニングと推論戦略
- マルチエージェント オーケストレーション
- エージェント評価とデバッグ
前提条件
- 必須スキル: LLM API の使用、関数呼び出しの理解、基本的なプロンプト エンジニアリング
パターン
ReAct ループ
ステップバイステップ実行のための Reason-Act-Observe サイクル
使用時機: 明確なアクション・観測フローを持つシンプルなツール利用
- Thought: 次に何をすべきかについて推論
- Action: ツールを選択して呼び出す
- Observation: ツール結果を処理
- タスク完了またはスタックするまで繰り返す
- 最大反復制限を含める
Plan-and-Execute
まずプランを立て、その後ステップを実行
使用時機: マルチステップ プランニングが必要な複雑なタスク
- プランニング段階: タスクをステップに分解
- 実行段階: 各ステップを実行
- 再プランニング: 結果に基づいてプランを調整
- プランナーと実行者の分離モデルが可能
ツール レジストリ
動的なツール検出と管理
使用時機: 多くのツール、またはランタイムで変わるツール
- スキーマと例を含むツール登録
- ツール セレクタが タスクに関連するツールを選択
- 高価なツールの遅延読み込み
- 最適化のための使用追跡
階層的メモリ
異なる目的のための多レベルメモリ
使用時機: コンテキストが必要な長時間実行エージェント
- 作業メモリ: 現在のタスク コンテキスト
- エピソード記憶: 過去のインタラクション/結果
- セマンティック記憶: 学習した事実とパターン
- 長期記憶からの検索に RAG を使用
スーパーバイザー パターン
スーパーバイザー エージェントが専門エージェントをオーケストレート
使用時機: 複数のスキルが必要な複雑なタスク
- スーパーバイザーがタスクを分解し委譲
- スペシャリストは限定的な機能を持つ
- スーパーバイザーが結果を集約
- スーパーバイザー レベルでのエラーハンドリング
チェックポイント リカバリ
失敗後の再開のための状態保存
使用時機: 失敗する可能性のある長時間実行タスク
- 各成功ステップ後にチェックポイント
- タスク状態、メモリ、進捗を保存
- 失敗時に最後のチェックポイントから再開
- 完了時にチェックポイントをクリーンアップ
危険な落とし穴
反復制限なしのエージェント ループ
重大度: 重大
状況: エージェントが最大反復回数なしで「完了」まで実行
症状:
- エージェントが永遠に実行される
- 説明のつかない高額な API コスト
- アプリケーションがハング
なぜこれが問題になるのか: エージェントはループに留まり、同じアクションを繰り返すか、無限のツール呼び出しの渦に巻き込まれます。制限なしでは、これは API クレジットを消費し、アプリケーションをハングさせ、ユーザーをイライラさせます。
推奨される修正:
常に制限を設定する:
- エージェント ループの max_iterations
- ターンごとの max_tokens
- エージェント実行の timeout
- API 使用のコスト キャップ
- ツール失敗のサーキット ブレーカー
曖昧または불完全なツール説明
重大度: 高
状況: ツール説明が使用時機と方法を説明していない
症状:
- エージェントが間違ったツールを選択
- パラメータ エラー
- エージェントが実行可能なことを実行できないと言う
なぜこれが問題になるのか: エージェントは説明に基づいてツールを選択します。曖昧な説明は間違ったツール選択、パラメータの誤用、エラーにつながります。エージェントは説明に見えないものを知ることができません。
推奨される修正:
完全なツール仕様を作成:
- 明確な1文の目的
- 使用時機(そして使用しない時機)
- パラメータの説明と型
- 入出力の例
- 予想されるエラー ケース
ツール エラーがエージェントに通知されない
重大度: 高
状況: ツール例外を黙って処理
症状:
- エージェントが間違ったデータで続行
- 最終的な答えが間違っている
- 失敗のデバッグが難しい
なぜこれが問題になるのか: ツール エラーが飲み込まれると、エージェントは不正確なデータまたは欠落したデータで続行し、エラーが複合します。エージェントは見えないものから復旧できません。静かな失敗は後で大きな失敗になります。
推奨される修正:
明示的なエラー ハンドリング:
- エージェントにエラー メッセージを返す
- エラー タイプと復旧ヒントを含める
- エージェントが再試行または代替を選択できるようにする
- デバッグのためのエラーをログ
すべてをエージェント メモリに保存
重大度: 中
状況: フィルタリングなしに観測をメモリに追加
症状:
- コンテキスト ウィンドウ超過
- エージェントが古い情報を参照
- 高いトークン コスト
なぜこれが問題になるのか: メモリは関連のない詳細、古い情報、ノイズで満杯になります。これはコンテキストを膨張させ、コストを増加させ、モデルが重要な情報に焦点を失う可能性があります。
推奨される修正:
選別されたメモリ:
- そのまま保存するのではなく要約
- 保存前に関連性でフィルタリング
- 長期記憶に RAG を使用
- タスク間で作業メモリをクリア
エージェントが多すぎるツールを持つ
重大度: 中
状況: 柔軟性のため 20 以上のツールをエージェントに提供
症状:
- ツール選択を誤る
- エージェントがオプションに圧倒される
- レスポンスが遅い
なぜこれが問題になるのか: より多くのツールは、より多くの混乱を意味します。エージェントはすべてのツール説明を読んで検討する必要があり、レイテンシとエラー率が増加します。長いツール リストは削除または不正確に理解されます。
推奨される修正:
タスクごとのツール キュレーション:
- エージェントごとに最大 5-10 ツール
- 大規模なツール セットのためのツール選択レイヤー
- 限定的なツールを持つ専門エージェント
- タスクに基づく動的ツール読み込み
1 つで十分な時に複数エージェントを使用
重大度: 中
状況: シンプルなタスクでマルチエージェント アーキテクチャで開始
症状:
- エージェントが作業を重複
- 通信オーバーヘッド
- 失敗のデバッグが難しい
なぜこれが問題になるのか: マルチエージェントは調整オーバーヘッド、通信障害、デバッグの複雑さ、コストを追加します。各エージェントのハンドオフは潜在的な失敗ポイントです。シンプルで開始し、必要が証明されたときのみエージェントを追加します。
推奨される修正:
マルチエージェントを正当化:
- 適切なツールを備えた 1 つのエージェントでこれを解決できますか?
- 調整オーバーヘッドは価値がありますか?
- エージェントは本当に独立していますか?
- 単一エージェントで開始し、制限を測定
エージェント内部がログに記録されたり追跡可能でない
重大度: 中
状況: 思考/アクションをログせずにエージェントを実行
症状:
- エージェント失敗を説明できない
- エージェント推論への可視性がない
- デバッグに数時間かかる
なぜこれが問題になるのか: エージェントが失敗するとき、彼らが何を考えていたのか、どのツールを試したのか、どこで間違ったのかを見る必要があります。観測可能性がなければ、デバッグは推測です。
推奨される修正:
トレーシングを実装:
- 各思考/アクション/観測をログ
- 入出力を含むツール呼び出しを追跡
- トークン使用とレイテンシを追跡
- 分析のための構造化ログを使用
エージェント出力の脆いパース
重大度: 中
状況: LLM 出力への regex または完全一致
症状:
- エージェント ループでのパース エラー
- 時々機能、時々失敗
- 小さなプロンプト変更がパースを壊す
なぜこれが問題になるのか: LLM は完全に一貫した出力を生成しません。わずかなフォーマット変動が脆いパーサーを壊します。これはパース エラーからのエージェント クラッシュまたは誤った動作を引き起こします。
推奨される修正:
堅牢な出力ハンドリング:
- 構造化出力 (JSON モード、関数呼び出し) を使用
- アクションのファジー マッチング
- パース失敗時にフォーマット指示で再試行
- 複数の出力フォーマットを処理
関連スキル
相性が良い: rag-engineer、prompt-engineer、backend、mcp-builder
使用時機
- ユーザーが言及またはほのめかす: build agent
- ユーザーが言及またはほのめかす: AI agent
- ユーザーが言及またはほのめかす: autonomous agent
- ユーザーが言及またはほのめかす: tool use
- ユーザーが言及またはほのめかす: function calling
- ユーザーが言及またはほのめかす: multi-agent
- ユーザーが言及またはほのめかす: agent memory
- ユーザーが言及またはほのめかす: agent planning
- ユーザーが言及またはほのめかす: langchain agent
- ユーザーが言及またはほのめかす: crewai
- ユーザーが言及またはほのめかす: autogen
- ユーザーが言及またはほのめかす: claude agent sdk
制限事項
- 上記の説明の範囲と明確に一致するタスクの場合のみこのスキルを使用してください。
- 出力を環境固有の検証、テスト、または専門家のレビューの代わりとして扱わないでください。
- 必要な入力、許可、セキュリティ境界、または成功基準が不足している場合は、停止して説明を求めてください。
ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ
詳細情報
- 作者
- sickn33
- ライセンス
- MIT
- 最終更新
- 不明
Source: https://github.com/sickn33/antigravity-awesome-skills / ライセンス: MIT
関連スキル
agent-browser
AI エージェント向けのブラウザ自動化 CLI です。ウェブサイトとの対話が必要な場合に使用します。ページ遷移、フォーム入力、ボタンクリック、スクリーンショット取得、データ抽出、ウェブアプリのテスト、ブラウザ操作の自動化など、あらゆるブラウザタスクに対応できます。「ウェブサイトを開く」「フォームに記入する」「ボタンをクリックする」「スクリーンショットを取得する」「ページからデータを抽出する」「このウェブアプリをテストする」「サイトにログインする」「ブラウザ操作を自動化する」といった要求や、プログラマティックなウェブ操作が必要なタスクで起動します。
anyskill
AnySkill — あなたのプライベート・スキルクラウド。GitHubを基盤としたリポジトリからエージェントスキルを管理、同期、動的にロードできます。自然言語でクラウドスキルを検索し、オンデマンドでプロンプトを自動ロード、カスタムスキルのアップロードと共有、スキルバンドルの一括インストールが可能です。OpenClaw、Antigravity、Claude Code、Cursorに対応しています。
engram
AIエージェント向けの永続的なメモリシステムです。バグ修正、意思決定、発見、設定変更の後はmem_saveを使用してください。ユーザーが「覚えている」「記憶している」と言及した場合、または以前のセッションと重複する作業を開始する際はmem_searchを使用します。セッション終了前にmem_session_summaryを使用して、コンテキストを保持してください。
skyvern
AI駆動のブラウザ自動化により、任意のウェブサイトを自動化できます。フォーム入力、データ抽出、ファイルダウンロード、ログイン、複数ステップのワークフロー実行など、ユーザーがウェブサイトと連携する必要があるときに使用します。Skyvernは、LLMとコンピュータビジョンを活用して、未知のサイトも自動操作可能です。Python SDK、TypeScript SDK、REST API、MCPサーバー、またはCLIを通じて統合できます。
pinchbench
PinchBenchベンチマークを実行して、OpenClawエージェントの実世界タスクにおけるパフォーマンスを評価できます。モデルの機能テスト、モデル間の比較、ベンチマーク結果のリーダーボード提出、またはOpenClawのセットアップがカレンダー、メール、リサーチ、コーディング、複数ステップのワークフローにどの程度対応しているかを確認する際に使用します。
openui
OpenUIとOpenUI Langを使用してジェネレーティブUIアプリを構築できます。これらはLLM生成インターフェースのためのトークン効率的なオープン標準です。OpenUI、@openuidev、ジェネレーティブUI、LLMからのストリーミングUI、AI向けコンポーネントライブラリ、またはjson-render/A2UIの置き換えについて述べる際に使用します。スキャフォルディング、defineComponent、システムプロンプト、Renderer、およびOpenUI Lang出力のデバッグに対応しています。