skill-optimizer
AIスキルの起動精度・明瞭さ・クロスモデル間の安定性を最適化します。スキルパックの作成・編集、スキルの反応不足の診断、回帰の低減、指示の顕著性チューニング、サンプルの改善、コンテキストコストの削減、またはスキルのベンチマーク・リリースゲートの設定を行う際に使用してください。トリガーワード:skill optimization、activation gap、benchmark skill、with/without skill delta、regression、context budget、prompt salience。
description の原文を見る
Optimizes AI skills for activation, clarity, and cross-model reliability. Use when creating or editing skill packs, diagnosing weak skill uptake, reducing regressions, tuning instruction salience, improving examples, shrinking context cost, or setting benchmark/release gates for skills. Trigger terms: skill optimization, activation gap, benchmark skill, with/without skill delta, regression, context budget, prompt salience.
SKILL.md 本文
使用するべき時
以下のような場合にこのスキルを使用してください:
- モデルが実際にスキルを適用するかどうかを改善したい
- すべてのモデルで特定の基準が失敗する理由を診断したい
- スキルが出力を悪化させることを防ぎたい
- コンテキスト負荷の下でのより強い検索のためにスキルテキストをリファクタリングしたい
- 反復可能なベンチマークループとリリースゲートを構築したい
最適化ループ(デフォルトワークフロー)
- ベースライン動作とスキル有効化の動作を測定 (モデル別、シナリオ別、基準別)
- 失敗パターンを特定:
- 普遍的な失敗(スキルありで 0%)
- モデル固有の弱点
- 回帰(負のデルタ)
- 顕著性のために編集:
- 明確なトリガーを追加
- 具体的な統合例を追加
- チェックリストと決定ルールを厳密化
- 評価を再実行してデルタを比較
- ガードレール付きでリリース (文書化されたゲート + 実行履歴 + フォローアップ issue)
使用方法
詳細な手順とテンプレートについては個別のルールファイルを参照してください:
rules/benchmark-loop.md- エンドツーエンドのベンチマークループとスコアリングrules/activation-design.md- 検索と命令の適用性を改善rules/context-budget.md- 動作を損なわずにトークンコストを削減rules/regression-triage.md- スキル有効化による回帰を診断・修正rules/release-gates.md- スキル更新をリリースする前のゴー/ノーゴー基準
実践的なヒューリスティック
- 多くのソフトな推奨事項より 少数の高シグナルなルール を優先する
- 脆弱で高価値な動作を トップレベルのチェックリスト に含める
- 一般的なシナリオごとに少なくとも 1 つの 統合例 を含める
- 省略されてはいけないもの に対する明確な表現を追加する
- スキルあり vs スキルなし の比較でゲイン/ロスを追跡する
ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ
詳細情報
- 作者
- mcollina
- リポジトリ
- mcollina/skills
- ライセンス
- MIT
- 最終更新
- 不明
Source: https://github.com/mcollina/skills / ライセンス: MIT
関連スキル
agent-browser
AI エージェント向けのブラウザ自動化 CLI です。ウェブサイトとの対話が必要な場合に使用します。ページ遷移、フォーム入力、ボタンクリック、スクリーンショット取得、データ抽出、ウェブアプリのテスト、ブラウザ操作の自動化など、あらゆるブラウザタスクに対応できます。「ウェブサイトを開く」「フォームに記入する」「ボタンをクリックする」「スクリーンショットを取得する」「ページからデータを抽出する」「このウェブアプリをテストする」「サイトにログインする」「ブラウザ操作を自動化する」といった要求や、プログラマティックなウェブ操作が必要なタスクで起動します。
anyskill
AnySkill — あなたのプライベート・スキルクラウド。GitHubを基盤としたリポジトリからエージェントスキルを管理、同期、動的にロードできます。自然言語でクラウドスキルを検索し、オンデマンドでプロンプトを自動ロード、カスタムスキルのアップロードと共有、スキルバンドルの一括インストールが可能です。OpenClaw、Antigravity、Claude Code、Cursorに対応しています。
engram
AIエージェント向けの永続的なメモリシステムです。バグ修正、意思決定、発見、設定変更の後はmem_saveを使用してください。ユーザーが「覚えている」「記憶している」と言及した場合、または以前のセッションと重複する作業を開始する際はmem_searchを使用します。セッション終了前にmem_session_summaryを使用して、コンテキストを保持してください。
skyvern
AI駆動のブラウザ自動化により、任意のウェブサイトを自動化できます。フォーム入力、データ抽出、ファイルダウンロード、ログイン、複数ステップのワークフロー実行など、ユーザーがウェブサイトと連携する必要があるときに使用します。Skyvernは、LLMとコンピュータビジョンを活用して、未知のサイトも自動操作可能です。Python SDK、TypeScript SDK、REST API、MCPサーバー、またはCLIを通じて統合できます。
pinchbench
PinchBenchベンチマークを実行して、OpenClawエージェントの実世界タスクにおけるパフォーマンスを評価できます。モデルの機能テスト、モデル間の比較、ベンチマーク結果のリーダーボード提出、またはOpenClawのセットアップがカレンダー、メール、リサーチ、コーディング、複数ステップのワークフローにどの程度対応しているかを確認する際に使用します。
openui
OpenUIとOpenUI Langを使用してジェネレーティブUIアプリを構築できます。これらはLLM生成インターフェースのためのトークン効率的なオープン標準です。OpenUI、@openuidev、ジェネレーティブUI、LLMからのストリーミングUI、AI向けコンポーネントライブラリ、またはjson-render/A2UIの置き換えについて述べる際に使用します。スキャフォルディング、defineComponent、システムプロンプト、Renderer、およびOpenUI Lang出力のデバッグに対応しています。