self-improving-agent
エージェントを自己改善させるためのメタスキルです。AGENTS.mdの更新、反復的なワークフローから新しいスキルの作成、および体系化すべき内容の判断を含みます。タスク完了後、繰り返される課題に気づいた時、またはセッション終了時に実行してください。
description の原文を見る
> Meta-skill for making the agent self-improving. Covers updating AGENTS.md, creating new skills from repeated workflows, and deciding what to systematize. Invoke after completing tasks, when noticing repeated friction, or at session end.
SKILL.md 本文
Self-Improving Agent
このスキルを使う場面:
- 重要なタスクを完了した後(タスク後の振り返り)
- 自分が複数ステップのワークフローを繰り返していることに気づいた
- 人間があなたの行動を訂正し、その訂正を永続化する必要がある
- AGENTS.md のコードベースマップが古い
- 作業セッションの終了時
ステップ1: 改善が必要なことを診断する
作業完了後、自分に次の質問を投げかけてください:
-
迷走したか? ファイルを探すのに時間を費やしたのか、それらはコードベースマップに含まれるべきだった?
- →
AGENTS.mdの Codebase Map を更新する
- →
-
訂正されたか? 人間がやり方を変えるよう言ったのか?
- →
AGENTS.mdの Local Norms、Guardrails、または Patterns & Gotchas に追加する
- →
-
ワークフローを繰り返したか? 以前にやった(または今後やる可能性のある)複数ステップの手順に従ったのか?
- → 新しい skill を作成する(以下のステップ3を参照)
-
何か驚いたことはあるか? gotcha、廃止予定の
...
詳細情報
- 作者
- grail-computer
- ライセンス
- unknown
- 最終更新
- 不明
Source: https://github.com/grail-computer/self-improving-agent / ライセンス: unknown
関連スキル
agent-browser
AI エージェント向けのブラウザ自動化 CLI です。ウェブサイトとの対話が必要な場合に使用します。ページ遷移、フォーム入力、ボタンクリック、スクリーンショット取得、データ抽出、ウェブアプリのテスト、ブラウザ操作の自動化など、あらゆるブラウザタスクに対応できます。「ウェブサイトを開く」「フォームに記入する」「ボタンをクリックする」「スクリーンショットを取得する」「ページからデータを抽出する」「このウェブアプリをテストする」「サイトにログインする」「ブラウザ操作を自動化する」といった要求や、プログラマティックなウェブ操作が必要なタスクで起動します。
anyskill
AnySkill — あなたのプライベート・スキルクラウド。GitHubを基盤としたリポジトリからエージェントスキルを管理、同期、動的にロードできます。自然言語でクラウドスキルを検索し、オンデマンドでプロンプトを自動ロード、カスタムスキルのアップロードと共有、スキルバンドルの一括インストールが可能です。OpenClaw、Antigravity、Claude Code、Cursorに対応しています。
engram
AIエージェント向けの永続的なメモリシステムです。バグ修正、意思決定、発見、設定変更の後はmem_saveを使用してください。ユーザーが「覚えている」「記憶している」と言及した場合、または以前のセッションと重複する作業を開始する際はmem_searchを使用します。セッション終了前にmem_session_summaryを使用して、コンテキストを保持してください。
skyvern
AI駆動のブラウザ自動化により、任意のウェブサイトを自動化できます。フォーム入力、データ抽出、ファイルダウンロード、ログイン、複数ステップのワークフロー実行など、ユーザーがウェブサイトと連携する必要があるときに使用します。Skyvernは、LLMとコンピュータビジョンを活用して、未知のサイトも自動操作可能です。Python SDK、TypeScript SDK、REST API、MCPサーバー、またはCLIを通じて統合できます。
pinchbench
PinchBenchベンチマークを実行して、OpenClawエージェントの実世界タスクにおけるパフォーマンスを評価できます。モデルの機能テスト、モデル間の比較、ベンチマーク結果のリーダーボード提出、またはOpenClawのセットアップがカレンダー、メール、リサーチ、コーディング、複数ステップのワークフローにどの程度対応しているかを確認する際に使用します。
openui
OpenUIとOpenUI Langを使用してジェネレーティブUIアプリを構築できます。これらはLLM生成インターフェースのためのトークン効率的なオープン標準です。OpenUI、@openuidev、ジェネレーティブUI、LLMからのストリーミングUI、AI向けコンポーネントライブラリ、またはjson-render/A2UIの置き換えについて述べる際に使用します。スキャフォルディング、defineComponent、システムプロンプト、Renderer、およびOpenUI Lang出力のデバッグに対応しています。