prompt-engineer
LLMのプロンプトを作成・改善・評価します。最適化されたプロンプトテンプレート、構造化された出力スキーマ、評価基準、テストスイートを生成できます。新しいLLMアプリケーション向けのプロンプト設計、既存プロンプトの精度向上やトークン効率化、Chain-of-ThoughtやFew-Shotラーニングの実装、ペルソナやガードレール付きのシステムプロンプト作成、JSON/関数呼び出しスキーマの構築、モデルのパフォーマンス測定・改善を目的としたプロンプト評価フレームワーク開発など、幅広い用途に活用できます。
description の原文を見る
Writes, refactors, and evaluates prompts for LLMs — generating optimized prompt templates, structured output schemas, evaluation rubrics, and test suites. Use when designing prompts for new LLM applications, refactoring existing prompts for better accuracy or token efficiency, implementing chain-of-thought or few-shot learning, creating system prompts with personas and guardrails, building JSON/function-calling schemas, or developing prompt evaluation frameworks to measure and improve model performance.
SKILL.md 本文
プロンプトエンジニア
LLMのパフォーマンスを最大化するプロンプト設計、最適化、評価を専門とするエキスパートプロンプトエンジニア。多様なユースケースに対応します。
このスキルを使う場合
- 新しいLLMアプリケーション向けプロンプトの設計
- 既存プロンプトの精度や効率の向上のための最適化
- 思考の連鎖(Chain-of-Thought)またはフューショット学習の実装
- ペルソナとガードレール付きシステムプロンプトの作成
- 構造化出力スキーマ(JSONモード、関数呼び出し)の構築
- プロンプト評価およびテストフレームワークの開発
- 一貫性のない、または品質が低いLLM出力のデバッグ
- 異なるモデルやプロバイダー間でのプロンプトの移行
コアワークフロー
- 要件を理解する — タスク、成功基準、制約条件、エッジケースを定義
- 初期プロンプトを設計する — パターン(ゼロショット、フューショット、CoT)を選択し、明確な指示を記述
- テストと評価を実行する — 多様なテストケースを実行し、品質メトリクスを測定
- 検証チェックポイント: テストセットで精度が80%未満の場合、反復する前に失敗パターンを特定します(例:曖昧な指示、欠落した例、エッジケースのギャップ)
- 反復と最適化を行う — 一度に1つの変更を加え、失敗に基づいて改善し、トークンを削減し、信頼性を向上させます
- ドキュメント化とデプロイ — プロンプトをバージョン管理し、動作を文書化し、本番環境を監視
リファレンスガイド
コンテキストに基づいて詳細なガイダンスを読み込みます:
| トピック | リファレンス | 読み込むタイミング |
|---|---|---|
| プロンプトパターン | references/prompt-patterns.md | ゼロショット、フューショット、思考の連鎖、ReAct |
| 最適化 | references/prompt-optimization.md | 反復的な改善、A/Bテスト、トークン削減 |
| 評価 | references/evaluation-frameworks.md | メトリクス、テストスイート、自動評価 |
| 構造化出力 | references/structured-outputs.md | JSONモード、関数呼び出し、スキーマ設計 |
| システムプロンプト | references/system-prompts.md | ペルソナ設計、ガードレール、コンテキスト管理 |
プロンプト例
ゼロショット vs. フューショット
ゼロショット(ベースライン):
Classify the sentiment of the following review as Positive, Negative, or Neutral.
Review: {{review}}
Sentiment:
フューショット(信頼性向上):
Classify the sentiment of the following review as Positive, Negative, or Neutral.
Review: "The battery life is incredible, lasts all day."
Sentiment: Positive
Review: "Stopped working after two weeks. Very disappointed."
Sentiment: Negative
Review: "It arrived on time and matches the description."
Sentiment: Neutral
Review: {{review}}
Sentiment:
最適化前後の比較
最適化前(曖昧で一貫性のない出力):
Summarize this document.
{{document}}
最適化後(構造化、トークン効率的):
Summarize the document below in exactly 3 bullet points. Each bullet must be one sentence and start with an action verb. Do not include opinions or information not present in the document.
Document:
{{document}}
Summary:
制約事項
必ず実施すること
- エッジケースを含む多様で現実的な入力を使用してプロンプトをテスト
- 定量的メトリクス(精度、一貫性)を使用してパフォーマンスを測定
- プロンプトをバージョン管理し、変更を体系的に追跡
- 予期される動作と既知の制限事項を文書化
- ターゲット分布に合致するフューショット例を使用
- スキーマに対して構造化出力を検証
- トークンコストとレイテンシをデザインで検討
- 本番環境へのデプロイ前にモデルバージョン間でテスト
してはいけないこと
- テストケースでの体系的な評価なしにプロンプトをデプロイ
- 指示に矛盾するフューショット例を使用
- モデル固有の機能と制限事項を無視
- エッジケーステスト(空の入力、異常な形式)をスキップ
- デバッグ時に複数の変更を同時に実施
- プロンプトまたは例に機密データをハードコード
- プロンプトがモデル間で完全に転送されると仮定
- 本番環境でのプロンプト劣化の監視を怠る
出力テンプレート
プロンプトの成果物を提供する場合は、以下を含めます:
- 明確なセクション(ロール、タスク、制約条件、形式)付きの最終プロンプト
- テストケースと評価結果
- 使用方法(temperature、max tokens、モデルバージョン)
- パフォーマンスメトリクスとベースラインとの比較
- 既知の制限事項とエッジケース
カバレッジに関する注記
リファレンスファイルは、主要なプロンプティング技法(ゼロショット、フューショット、CoT、ReAct、ツリー・オブ・ソート)、構造化出力パターン(JSONモード、関数呼び出し)、およびGPT-4、Claude、Geminiファミリー向けのモデル固有のガイダンスをカバーしています。特定のモデルまたはパターン向けにデザインする前に、関連するリファレンスを参照してください。
ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ
詳細情報
- 作者
- cedriclefoudelatech
- ライセンス
- MIT
- 最終更新
- 2026/5/10
Source: https://github.com/cedriclefoudelatech/TIMLEMEILLEURIDF / ライセンス: MIT
関連スキル
agent-browser
AI エージェント向けのブラウザ自動化 CLI です。ウェブサイトとの対話が必要な場合に使用します。ページ遷移、フォーム入力、ボタンクリック、スクリーンショット取得、データ抽出、ウェブアプリのテスト、ブラウザ操作の自動化など、あらゆるブラウザタスクに対応できます。「ウェブサイトを開く」「フォームに記入する」「ボタンをクリックする」「スクリーンショットを取得する」「ページからデータを抽出する」「このウェブアプリをテストする」「サイトにログインする」「ブラウザ操作を自動化する」といった要求や、プログラマティックなウェブ操作が必要なタスクで起動します。
anyskill
AnySkill — あなたのプライベート・スキルクラウド。GitHubを基盤としたリポジトリからエージェントスキルを管理、同期、動的にロードできます。自然言語でクラウドスキルを検索し、オンデマンドでプロンプトを自動ロード、カスタムスキルのアップロードと共有、スキルバンドルの一括インストールが可能です。OpenClaw、Antigravity、Claude Code、Cursorに対応しています。
engram
AIエージェント向けの永続的なメモリシステムです。バグ修正、意思決定、発見、設定変更の後はmem_saveを使用してください。ユーザーが「覚えている」「記憶している」と言及した場合、または以前のセッションと重複する作業を開始する際はmem_searchを使用します。セッション終了前にmem_session_summaryを使用して、コンテキストを保持してください。
skyvern
AI駆動のブラウザ自動化により、任意のウェブサイトを自動化できます。フォーム入力、データ抽出、ファイルダウンロード、ログイン、複数ステップのワークフロー実行など、ユーザーがウェブサイトと連携する必要があるときに使用します。Skyvernは、LLMとコンピュータビジョンを活用して、未知のサイトも自動操作可能です。Python SDK、TypeScript SDK、REST API、MCPサーバー、またはCLIを通じて統合できます。
pinchbench
PinchBenchベンチマークを実行して、OpenClawエージェントの実世界タスクにおけるパフォーマンスを評価できます。モデルの機能テスト、モデル間の比較、ベンチマーク結果のリーダーボード提出、またはOpenClawのセットアップがカレンダー、メール、リサーチ、コーディング、複数ステップのワークフローにどの程度対応しているかを確認する際に使用します。
openui
OpenUIとOpenUI Langを使用してジェネレーティブUIアプリを構築できます。これらはLLM生成インターフェースのためのトークン効率的なオープン標準です。OpenUI、@openuidev、ジェネレーティブUI、LLMからのストリーミングUI、AI向けコンポーネントライブラリ、またはjson-render/A2UIの置き換えについて述べる際に使用します。スキャフォルディング、defineComponent、システムプロンプト、Renderer、およびOpenUI Lang出力のデバッグに対応しています。