build-ai-skills
再利用可能なAI Skillsを設計・構築します。焦点を絞られ、バージョン管理された、組み合わせ可能なプロンプトベースの機能です。AIシステムの設計時、繰り返し利用できるAIワークフローの構築時、または信頼性の高いAI機能の構築方法についての相談時に使用できます。
description の原文を見る
Design and build reusable AI Skills — focused, versioned, and composable prompt-based capabilities. Use when architecting AI systems, creating repeatable AI workflows, or when someone asks how to build reliable AI capabilities.
SKILL.md 本文
AI スキルを構築する — エージェントではなく
小さく、フォーカスされた、コンポーザブルな AI 機能を構築するためのフレームワーク。Anthropic のエンジニアリング講演 (Barry Zhang & Mahesh Murag, AI Engineer Code Summit) に基づいています。
コア哲学
モノリシックなエージェントを構築しないでください。スキルを構築してください。
- エージェント は、すべてのことを行おうとする大規模で複雑なシステム
- スキル は、小さく、非常に具体的で、信頼性のある、改善可能な機能
スキルはより安定していて、保守しやすく、スケーラビリティに優れています。エージェントはスキルをツールとして使用します — これらは競合ではなく、補完的です。
本番スキルの 3 つの必須プロパティ
1. 評価
具体的で測定可能な成功基準 — リリース前に定義されたもの:
- 精度: ≥ X%
- フォーマット正確性: はい/いいえ
- レイテンシ: < X 秒
- 既知の失敗ケース: ドキュメント化されたリスト
2. バージョニング
各スキルには版があり、依存関係を破壊することなく安全に反復できます:
- フォーマット:
v1.0 – YYYY-MM-DD - 意味のある変更 = 新しいバージョン
- チェンジログを保持
3. コンポーザビリティ
スキルは連鎖します。各スキルがクリーンなインプットを受け取り、クリーンなアウトプットを生成するように設計します:
- リサーチスキル → ライティングスキル → フォーマットスキル
- インプット/アウトプットコントラクトを明示的に定義
進化マインドセット
1日目: ほぼスキルなし → モデルは「インテリジェント」
5日目: いくつかのスキル → モデルは「有能」
30日目: 多くのスキル → モデルは「非常に有用で信頼性が高い」
基本から始めましょう。テストします。改善します。組み合わせます。1日目に完璧なスキルを構築しようとしないでください。
スキルビルダーテンプレート
コピーして適応させてください:
**スキル名**: [明確で具体的な名前 — 例: 「Swedish Accident Report Analyzer v2」]
**目的** (1 文):
正確に何をするのか、そして理想的なアウトプットがどのように見えるか。
**バージョン**: v1.0 – [日付]
---
## ベースプロンプト
You are an expert [ultra-specific role] with 15 years of experience.
Your only mission is [objective in one sentence].
Instructions:
- Think step by step (Chain-of-Thought) before responding
- First, quote the relevant parts of the input
- Only answer with information you can extract or reason with high confidence
- If something is uncertain, say "UNCERTAINTY: [explanation]"
- Always use this exact output format:
[JSON or structured Markdown format]
Example input → output: [1–2 good examples]
---
## 評価基準
- 精度: ≥ 95%
- 完全なフォーマット: はい/いいえ
- 実行時間: < X 秒
- 既知の失敗: [失敗したケースとその理由のリスト]
## バージョンログ
- v1.0 – [日付]: 初版
## コンポーザビリティ
このスキルは以下と組み合わせることができます: [他のスキルのリスト]
スキルを構築する方法 (5 ステップループ)
- AI で繰り返し行うタスクを特定する
- 上記のテンプレートを使用してベースプロンプトを作成する
- 3~5 つの実際のケース (エッジケースを含む) でテストする
- プロンプトを改善する:
- より多くの例を追加 (少数ショット)
- ハルシネーション防止ルールを追加
- アウトプット検証ステップを追加
- 問題が分岐している場合は ToT に切り替え
- 評価基準を追加 + バージョンタグを追加 → スキルライブラリに保存
スキルライブラリ構造
スキルごとにフォルダを維持してください:
skills/
{skill-name}/
SKILL.md # prompt + metadata (このフォーマット)
test-cases/ # inputs + expected outputs
CHANGELOG.md # version history
スキルを使用するたびに:
- 結果をログに記録
- 失敗した場合 → v1.X を修正して作成
- 非常にうまくいった場合 → 共有するか、別のスキルと組み合わせ
ユーザーに結果を提示
スキル設計についてアドバイスするときは、常に以下に対応してください:
- 目的は十分に具体的ですか? (広すぎる = 悪いスキル)
- 評価基準は何ですか?
- どの既存スキルとこれを組み合わせることができますか?
- 現在どのバージョンであり、次のバージョンで何が予定されていますか?
トラブルシューティング
- スキルが広すぎる: 1 つのジョブを持つ 2 つのより小さいスキルに分割
- アウトプットが一貫していない: アウトプットフォーマットを厳しくする + 2~3 の例を追加
- 評価が難しい: バイナリメトリック (フォーマット正確: はい/いいえ) を主観的なものの前に定義
- 組み合わせると破壊される: インプット/アウトプットコントラクトを確認 — 明示的なスキーマ定義を追加
ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ
詳細情報
- 作者
- jmolinasoler
- ライセンス
- MIT
- 最終更新
- 2026/5/3
Source: https://github.com/jmolinasoler/ai-learning / ライセンス: MIT
関連スキル
agent-browser
AI エージェント向けのブラウザ自動化 CLI です。ウェブサイトとの対話が必要な場合に使用します。ページ遷移、フォーム入力、ボタンクリック、スクリーンショット取得、データ抽出、ウェブアプリのテスト、ブラウザ操作の自動化など、あらゆるブラウザタスクに対応できます。「ウェブサイトを開く」「フォームに記入する」「ボタンをクリックする」「スクリーンショットを取得する」「ページからデータを抽出する」「このウェブアプリをテストする」「サイトにログインする」「ブラウザ操作を自動化する」といった要求や、プログラマティックなウェブ操作が必要なタスクで起動します。
anyskill
AnySkill — あなたのプライベート・スキルクラウド。GitHubを基盤としたリポジトリからエージェントスキルを管理、同期、動的にロードできます。自然言語でクラウドスキルを検索し、オンデマンドでプロンプトを自動ロード、カスタムスキルのアップロードと共有、スキルバンドルの一括インストールが可能です。OpenClaw、Antigravity、Claude Code、Cursorに対応しています。
engram
AIエージェント向けの永続的なメモリシステムです。バグ修正、意思決定、発見、設定変更の後はmem_saveを使用してください。ユーザーが「覚えている」「記憶している」と言及した場合、または以前のセッションと重複する作業を開始する際はmem_searchを使用します。セッション終了前にmem_session_summaryを使用して、コンテキストを保持してください。
skyvern
AI駆動のブラウザ自動化により、任意のウェブサイトを自動化できます。フォーム入力、データ抽出、ファイルダウンロード、ログイン、複数ステップのワークフロー実行など、ユーザーがウェブサイトと連携する必要があるときに使用します。Skyvernは、LLMとコンピュータビジョンを活用して、未知のサイトも自動操作可能です。Python SDK、TypeScript SDK、REST API、MCPサーバー、またはCLIを通じて統合できます。
pinchbench
PinchBenchベンチマークを実行して、OpenClawエージェントの実世界タスクにおけるパフォーマンスを評価できます。モデルの機能テスト、モデル間の比較、ベンチマーク結果のリーダーボード提出、またはOpenClawのセットアップがカレンダー、メール、リサーチ、コーディング、複数ステップのワークフローにどの程度対応しているかを確認する際に使用します。
openui
OpenUIとOpenUI Langを使用してジェネレーティブUIアプリを構築できます。これらはLLM生成インターフェースのためのトークン効率的なオープン標準です。OpenUI、@openuidev、ジェネレーティブUI、LLMからのストリーミングUI、AI向けコンポーネントライブラリ、またはjson-render/A2UIの置き換えについて述べる際に使用します。スキャフォルディング、defineComponent、システムプロンプト、Renderer、およびOpenUI Lang出力のデバッグに対応しています。