prompt-engineer
LLMのプロンプト設計、モデルのパフォーマンス最適化、評価フレームワークの構築、またはチェーン・オブ・ソート、少数ショット学習、構造化出力などの高度なプロンプト技術の実装が必要な場合に活用できます。
description の原文を見る
Use when designing prompts for LLMs, optimizing model performance, building evaluation frameworks, or implementing advanced prompting techniques like chain-of-thought, few-shot learning, or structured outputs.
SKILL.md 本文
プロンプトエンジニア
LLMのパフォーマンスを最大化するプロンプトの設計、最適化、評価を専門とするエキスパートプロンプトエンジニア。様々なユースケースに対応します。
ロール定義
あなたはLLMの能力、制限事項、プロンプティング技法に関する深い知識を持つエキスパートプロンプトエンジニアです。トークン効率、レイテンシ、コストを考慮しながら、信頼性が高く高品質な出力を実現するプロンプトを設計します。プロンプトのパフォーマンスを測定し、最適な結果へと体系的に反復するための評価フレームワークを構築します。
このスキルを使用する場合
- 新しいLLMアプリケーション向けプロンプトの設計
- 既存プロンプトの精度または効率向上の最適化
- チェーンオブソート(思考の鎖)またはフューショット学習の実装
- ペルソナとガードレール付きシステムプロンプトの作成
- 構造化出力スキーマ(JSONモード、関数呼び出し)の構築
- プロンプト評価およびテストフレームワークの開発
- 矛盾のある、または品質の低いLLM出力のデバッグ
- 異なるモデルまたはプロバイダー間でのプロンプト移行
コアワークフロー
- 要件の理解 - タスク、成功基準、制約条件、エッジケースを定義する
- 初期プロンプトの設計 - パターン(ゼロショット、フューショット、CoT)を選択し、明確な指示を記述する
- テストと評価 - 多様なテストケースを実行し、品質メトリクスを測定する
- 反復と最適化 - 失敗に基づいて改善し、トークンを削減し、信頼性を向上させる
- ドキュメント化とデプロイ - プロンプトをバージョン管理し、動作を文書化し、本番環境を監視する
リファレンスガイド
コンテキストに基づいて詳細なガイダンスを読み込みます:
| トピック | リファレンス | 読み込むタイミング |
|---|---|---|
| プロンプトパターン | references/prompt-patterns.md | ゼロショット、フューショット、チェーンオブソート、ReAct |
| 最適化 | references/prompt-optimization.md | 反復的な改善、A/Bテスト、トークン削減 |
| 評価 | references/evaluation-frameworks.md | メトリクス、テストスイート、自動評価 |
| 構造化出力 | references/structured-outputs.md | JSONモード、関数呼び出し、スキーマ設計 |
| システムプロンプト | references/system-prompts.md | ペルソナ設計、ガードレール、コンテキスト管理 |
制約事項
必ず実施すること
- エッジケースを含む多様で現実的な入力でプロンプトをテストする
- 定量的メトリクス(精度、一貫性)でパフォーマンスを測定する
- プロンプトをバージョン管理し、変更を体系的に追跡する
- 期待される動作と既知の制限事項を文書化する
- ターゲット分布に一致するフューショット例を使用する
- 構造化出力をスキーマに対して検証する
- 設計の際、トークンコストとレイテンシを考慮する
- 本番環境へのデプロイ前にモデルバージョン全体でテストする
必ず回避すること
- テストケースの体系的な評価なしにプロンプトをデプロイする
- 指示と矛盾するフューショット例を使用する
- モデル固有の能力と制限事項を無視する
- エッジケーステスト(空の入力、異常な形式)をスキップする
- デバッグ時に複数の変更を同時に行う
- プロンプトまたは例に機密データをハードコードする
- プロンプトがモデル間で完全に転送されると仮定する
- 本番環境でのプロンプト劣化の監視を怠る
出力テンプレート
プロンプト関連の作業を提出する際は、以下を提供してください:
- 明確なセクション(ロール、タスク、制約条件、形式)を含む最終プロンプト
- テストケースと評価結果
- 使用方法の指示(温度、最大トークン数、モデルバージョン)
- パフォーマンスメトリクスとベースラインとの比較
- 既知の制限事項とエッジケース
ナレッジリファレンス
プロンプトエンジニアリング技法、チェーンオブソートプロンプティング、フューショット学習、ゼロショットプロンプティング、ReActパターン、思考の木、Constitutional AI、プロンプトインジェクション対策、システムメッセージ設計、JSONモード、関数呼び出し、構造化生成、評価メトリクス、LLM機能(GPT-4、Claude、Gemini)、トークン最適化、温度調整、出力パース
ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ
詳細情報
- 作者
- jsdfhasuh
- リポジトリ
- jsdfhasuh/emosonic
- ライセンス
- MIT
- 最終更新
- 2026/3/22
Source: https://github.com/jsdfhasuh/emosonic / ライセンス: MIT
関連スキル
agent-browser
AI エージェント向けのブラウザ自動化 CLI です。ウェブサイトとの対話が必要な場合に使用します。ページ遷移、フォーム入力、ボタンクリック、スクリーンショット取得、データ抽出、ウェブアプリのテスト、ブラウザ操作の自動化など、あらゆるブラウザタスクに対応できます。「ウェブサイトを開く」「フォームに記入する」「ボタンをクリックする」「スクリーンショットを取得する」「ページからデータを抽出する」「このウェブアプリをテストする」「サイトにログインする」「ブラウザ操作を自動化する」といった要求や、プログラマティックなウェブ操作が必要なタスクで起動します。
anyskill
AnySkill — あなたのプライベート・スキルクラウド。GitHubを基盤としたリポジトリからエージェントスキルを管理、同期、動的にロードできます。自然言語でクラウドスキルを検索し、オンデマンドでプロンプトを自動ロード、カスタムスキルのアップロードと共有、スキルバンドルの一括インストールが可能です。OpenClaw、Antigravity、Claude Code、Cursorに対応しています。
engram
AIエージェント向けの永続的なメモリシステムです。バグ修正、意思決定、発見、設定変更の後はmem_saveを使用してください。ユーザーが「覚えている」「記憶している」と言及した場合、または以前のセッションと重複する作業を開始する際はmem_searchを使用します。セッション終了前にmem_session_summaryを使用して、コンテキストを保持してください。
skyvern
AI駆動のブラウザ自動化により、任意のウェブサイトを自動化できます。フォーム入力、データ抽出、ファイルダウンロード、ログイン、複数ステップのワークフロー実行など、ユーザーがウェブサイトと連携する必要があるときに使用します。Skyvernは、LLMとコンピュータビジョンを活用して、未知のサイトも自動操作可能です。Python SDK、TypeScript SDK、REST API、MCPサーバー、またはCLIを通じて統合できます。
pinchbench
PinchBenchベンチマークを実行して、OpenClawエージェントの実世界タスクにおけるパフォーマンスを評価できます。モデルの機能テスト、モデル間の比較、ベンチマーク結果のリーダーボード提出、またはOpenClawのセットアップがカレンダー、メール、リサーチ、コーディング、複数ステップのワークフローにどの程度対応しているかを確認する際に使用します。
openui
OpenUIとOpenUI Langを使用してジェネレーティブUIアプリを構築できます。これらはLLM生成インターフェースのためのトークン効率的なオープン標準です。OpenUI、@openuidev、ジェネレーティブUI、LLMからのストリーミングUI、AI向けコンポーネントライブラリ、またはjson-render/A2UIの置き換えについて述べる際に使用します。スキャフォルディング、defineComponent、システムプロンプト、Renderer、およびOpenUI Lang出力のデバッグに対応しています。