gpt-image-2
GPT Image 2を使った画像生成・編集に特化したスキルで、3つの動作モードに対応しています:(A) Garden ローカルモードでOpenAI互換インターフェース経由で直接生成・保存、(B) Host-Nativeモードで最適化されたプロンプトを宿主Agentの画像ツールに渡して生成、(C) Advisorモードで画像ツールが存在しない環境でも高品質なプロンプト提案を提供。ポスター・UI・製品・インフォグラフィック・学術図・技術アーキテクチャ図・漫画・アバター・絵コンテ・IP展開など18カテゴリ・80以上の構造化テンプレートを網羅しています。
description の原文を見る
面向 GPT Image 2 的图像生成 / 编辑技能。可在 3 种环境下使用:(A) Garden 本地模式,通过 OpenAI 兼容接口直接出图并落盘;(B) Host-Native 模式,把本 Skill 当作提示词工程指引,把渲染好的 prompt 交给宿主 Agent 自带的图像工具出图;(C) Advisor 模式,宿主无任何图像工具时退化为高质量 prompt 顾问。涵盖 18 大类、80+ 个结构化模板,覆盖海报 / UI / 产品 / 信息图 / 学术图 / 技术架构图 / 漫画 / 头像 / 流程板 / 电影分镜 / IP 周边 / 编辑工作流等场景。
SKILL.md 本文
GPT Image 2
これはGPT Image 2向けの特化型スキルであり、3つの実行環境で使用できますが、動作は大きく異なります。最初のステップで現在の実行モードを必ず確認してください。
2つの画像タスクのみを実行します:
- 画像生成:
POST /images/generations - 画像編集:
POST /images/edits
このファイルに含まれるもの:実行モード、スキル構造、環境変数、保存・命名規則、テンプレートインデックス、モード対応ワークフロー。詳細なテンプレートはすべてreferences/に配置され、階層的に整理されています:
- 第1階層:分類ディレクトリ
- 第2階層:個別テンプレート Markdownファイル
実行モード(必読、何かをする前に必ず確認)
本スキルには軽量な検出スクリプトが付属しており、先に実行してから結果に基づいて作業方法を決定します:
node skills/gpt-image-2/scripts/check-mode.js
# 構造化結果を上位プログラムに渡したい場合:
node skills/gpt-image-2/scripts/check-mode.js --json
出力はmode = A / A? / B-or-Cおよびrecommendationを提供します。3つのモードは以下の通り定義されます:
Mode A · Garden ローカル生成
トリガー条件:環境変数ENABLE_GARDEN_IMAGEGENがTrue(1 / true / yes / on)かつ OPENAI_API_KEYが存在する。
動作:完全なエンドツーエンドの「テンプレート選択 → プロンプト作成 → スクリプト実行 → 出力・保存」を実行します。
scripts/generate.jsでテキスト生成、scripts/edit.jsで既存画像編集を使用。- プロンプトはデフォルトで
garden-gpt-image-2/prompt/に、画像はgarden-gpt-image-2/image/に保存。 - これが最強のモード:画像ツールの「所有者」です。
Mode B · Host-Native 委譲出力
トリガー条件:Garden が未有効(ENABLE_GARDEN_IMAGEGENが未設定/False)かつ 現在のホストエージェントが画像生成ツールまたは画像MCPを備えている。
典型的な識別シグナル(自己確認すべき):
- ツールセットに
image_generation/imagegen/dalle/nano_banana/mcp__*image*/make_imageなどの名前が出現 - ChatGPT / Codex / Gemini / Cursor など、ネイティブ出力をサポートするクライアント内で本スキルを呼び出し
- ユーザーが明示的に「あなた自身のツールで出力」と言及
動作:本スキルはプロンプトエンジニアリングガイドに退化します。
- 相変わらず「テンプレート選択 → フィールド埋補 → 最終プロンプトレンダリング」のフローに従う。
node scripts/generate.jsを呼び出してはいけません(API キーなし、失敗必至)。- ホスト付属の画像ツールを直接呼び出し、レンダリング済みプロンプトを入力として使用。
- ユーザーが希望する場合、プロンプトファイルを
garden-gpt-image-2/prompt/に保存できますが、画像の行き先はホスト側が決定し、強制されません。
Mode C · Advisor 純粋プロンプトアドバイザー
トリガー条件:Garden が未有効かつ ホストエージェントが画像生成ツールを持たない。
動作:本スキルは「高品質プロンプト執筆アドバイザー」に退化します。
- 「テンプレート選択 → フィールド埋補 → 最終プロンプトレンダリング」フローに従い、情報が不足していればユーザーに質問。
- 最終プロンプトをユーザーに直接出力 +
garden-gpt-image-2/prompt/<task-slug>-<timestamp>.mdに1コピー保存。 - 簡潔な「使用方法」提案を付記(例:ChatGPT / Midjourney / DALL·E / Sora / Nano Banana / 自分のバックエンド / サードパーティGPT Image 2ゲートウェイに投入)。
- 出力成功を装わない。ユーザーに明確に伝えてください:「直接再利用可能な高品質プロンプトが生成されました。あなたの画像ツールで実行してください。」
モード判定表
| 条件 | モード | スクリプト実行? | プロンプト保存? | 画像保存? |
|---|---|---|---|---|
ENABLE_GARDEN_IMAGEGEN=1 + キーあり | A | ✅ generate.js / edit.js | ✅ 自動 | ✅ 自動 |
ENABLE_GARDEN_IMAGEGEN=1 だがキーなし | A? | ❌(キー必要) | — | — |
| 未有効 + ホストに画像ツール | B | ❌(ホストツール使用) | オプション | ホスト決定 |
| 未有効 + ホストに画像ツールなし | C | ❌ | ✅ 必須 | ❌(不可能) |
モード不確定の場合
- 自分がBかCか判定できない場合、ユーザーに1文質問してください:「あなたの環境の画像ツールで出力、それともプロンプトを書くだけでいい?」
- Mode A スクリプト失敗(401 / ネットワーク / 枠)→ エラー報告と「B / C に切り替えますか?」を質問。
ユーザー入力ツール
本スキルがユーザーに質問する必要がある場合、以下のルールに従ってください:
- 現在の実行時が提供するユーザー入力ツールを優先的に使用。
- 対応するツールがない場合、簡潔なプレーンテキスト番号付き問題で質問。
- マージ可能な問題はできるだけ一度に質問。
スキル構造
scripts/check-mode.js:先にこれを実行、実行モード(A / B / C)を検出scripts/generate.js:テキスト生成(Mode A のみ使用)scripts/edit.js:既存画像・マスク編集(Mode A のみ使用)scripts/shared.js:共有リクエスト・保存・環境変数読み込みロジックreferences/:階層化された構造化プロンプトテンプレート(A / B / C 三モードすべて使用)
環境変数
以下の順序で設定を読み込みます:
- CLI パラメータ
process.env<cwd>/.env<cwd>/.gateway.env~/.gateway.env
コア変数:
ENABLE_GARDEN_IMAGEGEN— モードスイッチ。1/true/yes/on時にMode Aを有効化;未設定またはその他の値でMode B / Cに移行。OPENAI_API_KEY— Mode A 必須;B / C 不要。OPENAI_BASE_URL— デフォルトhttps://api.openai.com/v1、サードパーティ互換ゲートウェイに指定可能。OPENAI_IMAGE_MODEL— デフォルトgpt-image-2、ゲートウェイがサポートするモデルに変更可能(例:gpt-image-1/dall-e-3)。
デフォルト実装はOpenAI互換インターフェースで動作し、サードパーティゲートウェイはハードコードされていません。
デフォルト出力ディレクトリ
ユーザーが明示的に出力パスを指定しない場合、現在のワークスペース下で統一的に使用:
- プロンプトディレクトリ:
garden-gpt-image-2/prompt/(A / B / C 三モード推奨、再利用とバージョン管理が容易) - 画像ディレクトリ:
garden-gpt-image-2/image/(Mode A のみ使用;Mode B はホスト決定、Mode C は画像生成なし)
ディレクトリが存在しない場合、スクリプト(Mode A)は自動作成する必要があります;Mode B / C はプロンプト作成前に手動でmkdir -p実行。
デフォルト命名規則
ユーザーが明示的にファイル名を指定しない場合、スクリプトは現在のタスクに関連する自動生成ファイル名に現在のタイムスタンプを追加し、重複を避けるべきです。
命名規則:
- プロンプト:
garden-gpt-image-2/prompt/<task-slug>-<timestamp>.md - 画像:
garden-gpt-image-2/image/<task-slug>-<timestamp>.png
ここで:
<task-slug>:現在のユーザー要件から自動抽出された関連する短い名前<timestamp>:現在のタイムスタンプ、例:20260424-153045
例:
garden-gpt-image-2/prompt/live-commerce-ui-20260424-153045.mdgarden-gpt-image-2/image/live-commerce-ui-20260424-153045.pnggarden-gpt-image-2/prompt/vr-headset-exploded-view-20260424-153102.mdgarden-gpt-image-2/image/vr-headset-exploded-view-20260424-153102.png
プロンプト保存ルール
| モード | プロンプト保存必須? | 説明 |
|---|---|---|
| Mode A | ✅ 必須 | 実際の生成・編集フロー実行時は必ず保存 |
| Mode B | 推奨 | デフォルトで再利用のため保存推奨;ユーザーが「不要」と言えばスキップ |
| Mode C | ✅ 必須 | ユーザーがプロンプトを持ち出して自分で実行、保存なし=無駄 |
通用規則(三モード共通):
- ユーザーが明示的にプロンプトファイルパスを与えた場合、そのファイルを入力として直接使用可能。
- ユーザーが直接テキストプロンプトを与えた場合も、最終プロンプトを
garden-gpt-image-2/prompt/に保存する必要があります。 - ユーザーが明示的に
--prompt-outputを指定した場合、ユーザー指定パスを尊重。 - そうでなければデフォルト命名規則を使用して自動保存。
画像保存ルール(Mode A のみ)
- ユーザーが明示的に
--imageまたは--outputを指定した場合、ユーザー指定パスを尊重。 - そうでなければデフォルトで
garden-gpt-image-2/image/に保存。 - ファイル名は現在のタスクの意味論に関連し、タイムスタンプを付記。
Mode B はホスト画像ツールが保存方法を決定;Mode C は画像を生成しません。
クイック使用方法
0. 実行モード検出(すべてのタスクの最初のステップ)
node skills/gpt-image-2/scripts/check-mode.js
出力は現在がMode A / B / C かを告知し、その後generate.js / edit.jsを呼び出すかどうかを決定します。以下1~4はMode A下でのみ使用。
1. テキスト生成(Mode A)
node skills/gpt-image-2/scripts/generate.js \
--prompt "A cute baby sea otter" \
--size 1024x1024 \
--quality high
2. プロンプトファイルで生成(Mode A)
node skills/gpt-image-2/scripts/generate.js \
--promptfile garden-gpt-image-2/prompt/poster-20260424-153045.md
3. 既存画像編集(Mode A)
node skills/gpt-image-2/scripts/edit.js \
--image assets/source.png \
--prompt "Replace the background with a clean studio scene"
4. マスク付き部分編集(Mode A)
node skills/gpt-image-2/scripts/edit.js \
--image assets/source.png \
--mask assets/mask.png \
--prompt "Replace only the masked area with a glass vase"
5. Mode B / C の「使用法」
コマンドラインエントリがありません――本スキルはこの時点でプロンプトエンジニアリングガイドです:
- Mode B:最終プロンプトをレンダリング → ホスト付属の
image_generation類ツール呼び出し(パラメータでプロンプトを渡す) → 画像取得。 - Mode C:最終プロンプトをレンダリング →
garden-gpt-image-2/prompt/<task-slug>-<timestamp>.mdに保存 → 内容をユーザーに直接表示 → ユーザーがどの画像ツールで直接再利用できるかを提示。
JSON テンプレート動作方法
references/に JSON テンプレートが提供される場合、以下のルールで使用:
- 最初に
SKILL.mdから最も貼近い分類ディレクトリを見つけ。 - 次に具体的なテンプレートファイルを特定。
- テンプレート内の
{argument ...}は置換可能なパラメータを表す。 - ユーザーが明示的に指定した値は直接埋補。
- ユーザーが指定していないが、テンプレートが
defaultをマークしている場合、デフォルト値を先に使用可能。 - 情報不足が結果に大きく影響する場合は、ユーザーに主動的に質問。
- ユーザーが明示的に「ランダム生成」と言及した場合、デフォルト値を保持するか、テンプレート許容範囲内で合理的にランダム化可能。
質問ルール
テンプレートが重要変数を欠いている場合、「あなたはどんなスタイルを望みますか?」と一括質問してはいけません。テンプレートフィールドに基づいて正確に質問すべき。
例えばライブコマース UI テンプレートが主体を欠いている場合、優先的に質問:
- キャスターは誰?
- 実写、著名人名、人物説明、それとも完全ランダム生成?
商品情報を欠く場合は質問:
- 商品名は何?
- 商品価格を指定?
- コメントとギフト内容を自動補完希望?
テンプレートインデックス
タスクタイプごとに最貼近の具体的テンプレートファイルのみ読み込み、references/全体を一度に読み込まない。
1. 方法論総文書
先に読む:
references/prompt-writing.md
適用対象:
- JSON テンプレート構築方法がまだ決定されていない
- どのフィールドを質問すべき、どのフィールドがデフォルト可能、どのフィールドがランダム可能か判定が必要
- ケーススタディを再利用可能テンプレートに抽象化する必要
2. UI Mockups (references/ui-mockups/)
様々な「インターフェース+コンテンツ」型サンプル視覚に適切。現在配置済み:
live-commerce-ui.md— eコマースライブショッピングスクリーンショット(キャスター+チャット+ギフト+商品カード)social-interface-mockup.md— ソーシャルプラットフォーム動的詳細ページ(Twitter/X、小红书、Weibo、Threads等)product-card-overlay.md— ランディングページhero/詳細ページメイン(人物+商品+売上点+価格)chat-interface-scene.md— チャット/対話インターフェース(iMessage、WeChat、グループチャット、AI助手)short-video-cover-ui.md— 短動画カバー/ライブサムネイル(YouTube、抖音、B站、VTuberストリーム)landing-page-case-study.md— ダークSaaS/マーケティングケーススタディ長ページ UIモックアップ(マルチセクション+スクロール叙事+データカード+CTA)
3. Product Visuals (references/product-visuals/)
「商品を視覚中心」とする画像に適切。現在配置済み:
exploded-view-poster.md— 製品爆発図ポスター(メイン垂直積層+callout+トップロゴ+ボトムブランド領域)white-background-product.md— eコマース純白背景メイン(単品/複数角度/極简マーケティング積層)premium-studio-product.md— 高級スタジオ商業製品画像(雑誌広告級ムード)packaging-showcase.md— ギフトボックス/パッケージング展示(外箱+内容物展示)lifestyle-product-scene.md— ライフスタイル製品シーン(実生活シーン内の製品)ecommerce-marketing-board.md— 中国型eコマーム超複合販売ボード(メイン+詳細+売上点+使用ステップ+シーン+TVC分割画面複合一図)
4. Maps (references/maps/)
「地図型視覚」に適切(インフォグラフィックは分類17に独立)。現在配置済み:
food-map.md— 都市グルメ手書き地図(番号付き点+凡例+中央キャラクター)travel-route-map.md— 旅行ルート地図(複数日行程/一日シティウォーク/野外ルート)illustrated-city-map.md— 都市風景イラスト地図(ランドマーク+山水+文化要素)store-distribution-map.md— ブランド店舗/サービスカバレッジ分布図itinerary-day-trip-map.md— 一日ツアー split ポスター(左羊皮紙行程カード+右ファンタジー写実地図、5-7駅点厳密対齢)
5. Slides & Visual Docs (references/slides-and-visual-docs/)
「一ページで一件事を説明」する視覚文書に適切。現在配置済み:
dense-explainer-slides.md— Irasutoya×霞関混合高密度説明Slidepolicy-style-slide.md— 政策/政府公告/白皮書風説明Slidevisual-report-page.md— 商業報告エグゼクティブサマリー/投資家簡報/年報概要ページeducational-diagram-slide.md— 教学示意図(概念/機制/プロセス分解)
6. Poster & Campaigns (references/poster-and-campaigns/)
「ブランド主視覚+キャンペーン+バナー+雑誌カバー」に適切。現在配置済み:
brand-poster.md— ブランドメインポスター(製品/人物/純粋文字主張)campaign-kv.md— Campaign Key Visual + 派生レイアウトシステムbanner-hero.md— Web hero/ランディングページ/appバナー(横構図+CTA)editorial-cover.md— 雑誌/期刊/出版物カバーbiomimetic-concept-poster.md— 仿生工業デザイン概念ポスター(自然原型→進化条→heroレンダー→複数視図技術図)vintage-editorial-infographic.md— レトロアーカイブ/ 1940年代編集式インフォグラフィックポスター(人物+公式+タイムライン+モデル、Bell Labs スタイル)character-catalog-poster.md— 同一角色多バージョンインフォグラフィックポスター(星座/要素/朝代/人格シリーズカード)lineup-comparison-poster.md— シリーズ製品ラインアップ対比インフォグラフィックポスター(30+ SKU同図+凡例+等級key)
7. Portraits & Characters (references/portraits-and-characters/)
「人物視覚」に適切。現在配置済み:
professional-portrait.md— プロ級商務肖像(LinkedIn/チームページ/メディア配図)founder-portrait.md— 創設者メディア大片肖像(ドラマ照明+タイトル位確保)virtual-host.md— VTuber/仮想キャスター個人カード+ライブプレビューcharacter-sheet.md— キャラ総合設定稿(三視図+表情+服装+配色パレット)pose-reference-sheet.md— N×N ポーズ/動作辞書リファレンス表(同一キャラ複数ポーズ、ダンス/戦闘/フィットネス)
8. Scenes & Illustrations (references/scenes-and-illustrations/)
「ムード+ストーリー+感情」のイラスト型視覚に適切。現在配置済み:
healing-scene.md— 癒し系日常/季節シーンイラストconcept-scene.md— 映画感概念大シーン/IP key artpicture-book-scene.md— 児童書/絵本内ページ/祭日カードminimalist-mood-scene.md— 極简留白ムード図/文学的壁紙
9. Editing Workflows (references/editing-workflows/)
「既存画像編集」タスク(scripts/edit.js対応)に適切。現在配置済み:
background-replacement.md— 背景置換(商品/人像/野外/棚景)local-object-replacement.md— 局所オブジェクト置換(マスク有無問わず)object-removal.md— 雑物/路人/電線/傷去除product-retouching.md— 製品精修(光沢/ラベル/影/傷)portrait-local-edit.md— 人像局所修正(ヘアスタイル/服装/メイク/アクセサリー)
10. Avatars & Profile (references/avatars-and-profile/)
「スタイル化アバター/人設/グリッド/ステッカー/シリーズ肖像」など「個人イメージ」型視覚に適切。現在配置済み:
style-transfer-selfie.md— 参考図人物をコスプレ/ゴシック/レトロフィルム/アイドル写真など任意スタイルに転換character-grid-portrait.md— 同一キャラ n×n グリッド肖像(複数職業/複数表情/複数朝代/複数スタイル)themed-3d-icon.md— Kawaii 3D / Minecraft / スキューモーフィック 3D アプリアイコンスタイルアバターsticker-set.md— ステッカーセット/顔文字セット(独立要素+描線+ラベル)cultural-portrait-series.md— 朝代/神話/文学/民族シリーズ肖像
11. Storyboards & Sequences (references/storyboards-and-sequences/)
「複数分割画面/漫画/関係図/フロー手順」など「叙事的シーケンス」型視覚に適切。現在配置済み:
four-panel-comic.md— 4格漫画/風刺漫画/段子漫画(起承転合+対話吹き出し)manga-spread-page.md— 単ページ/見開き漫画分割画面(不規則グリッド+対話+心声)anime-key-visual.md— 単図アニメKV/ライトノベルカバー/IP ポスターcharacter-relationship-diagram.md— キャラ関係図ポスター(カード+関係連線+凡例)recipe-process-flowchart.md— レシピ/チュートリアル/フロー手順図(番号+イラスト+説明)product-tvc-storyboard.md— 製品TVC商業広告分割画面板(9-panel実写質感+シーン説明+時長)cinematic-storyboard-grid.md— 映画感叙事分割画面 contact sheet(3×4 / 4×4、連続叙事+cinemaicスチル)process-photo-board.md— リアルcinematic プロセス板(装備装着/メイク/訓練/操作分解、番号+手順逓進)
12. Grids & Collages (references/grids-and-collages/)
「複数パネルグリッド/コラージュ/立項board」型視覚に適切。現在配置済み:
banner-grid-2x2.md— 2×2 マーケティングバナーセット(一度に4張統一シリーズデザイン出力)lookbook-grid.md— 7日ルックブック/ 9宮セルフケア/TOP Nリスト図mixed-style-multi-panel.md— マルチスタイル混合コラージュ(同一主体複数画風演出)anime-pitch-board.md— アニメ/ゲーム/映画立項pitchボード(KV+キャラ+世界観+文案)ad-banner-multi-grid.md— 複数業種/複数テーマ混合広告バナーグリッド(各格独立業種+スタイル+文案)
13. Branding & Packaging (references/branding-and-packaging/)
「ブランド識別体系/マスコット/パッケージデザイン」型視覚に適切。現在配置済み:
brand-identity-board.md— ブランド識別体系板(ロゴ+配色+フォント+アプリケーションmockup)mascot-brand-kit.md— マスコット複数パネルブランド識別セット(メイン形象+三視図+表情+アプリケーション)cosmetic-packaging.md— 化粧品/スキンケア単瓶/シリーズ/ギフトボックスパッケージングbeverage-label-design.md— 飲料/食品/調味料ラベルデザイン(国潮/日式/西式)full-mascot-brand-doc.md— 18+モジュール大型ブランド識別+マスコット全フロー文書(DNA/moodboard/スケッチ/線稿/3D/配色/素材/アプリケーション一図概望)character-merch-board.md— IPキャラ+周辺商品/パッケージ/ポスター/ソーシャルプロフィール複数要素総合ブランド板
14. Typography & Text Layout (references/typography-and-text-layout/)
「字面優先/双言語レイアウト」など「文字を主視覚」とするタイプに適切。現在配置済み:
title-safe-poster.md— 大字主張型ポスター(日式高エネルギー/スイス極简/レトロプリント)bilingual-layout-visual.md— 中英/中日双言語レイアウト視覚(文化/学術/クロスカルチャーブランド)
15. Assets & Props (references/assets-and-props/)
「アイコンセット/ゲームスクリーンショット」など「成套素材/ゲーム資産」型視覚に適切。現在配置済み:
retro-skeuomorphic-icons.md— スキューモーフィック/ Y2K /ピクセルアイコンセット(成套統一スタイル)game-screenshot-mockup.md— ゲーム内スクリーンショットmockup(HUD+字幕+任務面板)
16. Academic Figures (references/academic-figures/)
「論文/トップカンファレンス投稿/学術ポスター/論文答弁PPT/開題答弁/期刊投稿Graphical Abstract」配図に適切。全体的に白背景+出版物フォント+幾何精確+低彩度エンジニアリング色(深青/灰青/黒灰主体、≤3主色)+モノクロ印刷可能。定量データ虚構は厳密禁止(数値/等値線/配色スケール範囲/公式)。
CS / CV / ML 方向:
method-pipeline-overview.md— 方法総望図/pipelinefigure(複数stage块+データフロー;変体4はエンジニアリング左/中/右三段式技術ルートマップ提供)neural-network-architecture.md— ニューラルネットアーキテクチャ図(layer块+tensorシェイプ+スキップ連結)qualitative-comparison-grid.md— 複数方法qualitative対比グリッド(行=サンプル、列=方法)
エンジニアリング/自然科学/答弁共用:
scientific-schematic.md— 概念/原理/実験装置示意図(自由度高、自然言語テンプレート)mechanism-diagram.md— 機理示意図/因果チェーン/変換パス(中心オブジェクト+複数段階変換+結果区;三段式因果チェーン/循環自励発/複数分支競争三種類変体含む)multi-condition-comparison.md— 複数工況/複数条件結果対比図(同一オブジェクト異なる条件下の並列結果、2×2 / 1×N / M×N;panel間厳密統一強調)publication-chart.md— publication-ready データ図表(bar / line / scatter / heatmap / box)
総望/摘要/答弁首页:
graphical-abstract.md— 期刊投稿Graphical Abstract/図形摘要(横向4段式/中心展開/方形/竖版四種類変体)research-overview-poster.md— 開題/答弁/汇报首页研究総望図(上中下三層+五モジュール;中心辐射/左右双栏/極简三種類変体含む)
選択戦略:CS/CV/ML論文は
method-pipeline-overview+qualitative-comparison-gridを首选;エンジニアリング/エネルギー/化学工業/素材方向はmethod-pipeline-overview変体4 +mechanism-diagram+multi-condition-comparisonを首选;期刊投稿摘要図はgraphical-abstract使用;答弁PPT首页はresearch-overview-poster使用。
17. Infographics (references/infographics/)
「インフォグラフィック/高密度科学普及/手書きインフォグラフィック/KPI ダッシュボード」など「情報ビジュアライゼーション大図」に適切。現在配置済み:
legend-heavy-infographic.md— 高図例密度科学普及/因果チェーン/進化/解剖図(双言語)hand-drawn-infographic.md— 手書きスタイル インフォグラフィック(macaron / morandi / 黒板/牛皮紙;自然言語テンプレート)bento-grid-infographic.md— 弁当格モジュール化インフォグラフィック(高密度複数モジュールwidget排布)comparison-infographic.md— 二元/複数元対比インフォグラフィック(A vs B /パッケージグレード/誤区 vs 正解)step-by-step-infographic.md— ステップバイステップインフォグラフィック(イラスト感、ぬくもり;エンジニアリングフロー図ではない)kpi-dashboard-infographic.md— KPIダッシュボード式インフォグラフィック(年度回顧/Wrapped /業務dashboard)
18. Technical Diagrams (references/technical-diagrams/)
「システムアーキテクチャ/フロー/時序/ステートマシン/ER/思維導図/ネットワークトポロジ」などエンジニアリング示意図に適切。統一暗色grid背景+等幅フォント+キャラ符号化配色、各テンプレートともlight変体を付記。
⚠️ 注意:本ディレクトリが生成するのはPNG位図、編集可能SVGではない;編集可能が必要ならmermaid / draw.io / excalidraw / Figmaに変更。現在配置済み:
system-architecture.md— システムアーキテクチャ図(フロント+バック+DB+キャッシュ+キュー+外部)flowchart-decision.md— フロー図/判定図(BPMN形状セマンティクス+Yes/No分支)sequence-diagram.md— 時序図(actor+ライフライン+メッセージ矢印+活性化条)state-machine.md— ステートマシン/ライフサイクル図(state+transition+guard / action)er-diagram.md— ER図/データモデル図(実体+フィールド+PK/FK+crow's footリレーション)mind-map-tech.md— テック主題思維導図(中央+放射式分支)network-topology.md— ネットワークトポロジ図(デバイスglyph+zone / VPC+帯域幅/プロトコル標)
プロンプトワークフロー(モード対応)
A / B / C を問わず、前6ステップは共用;違いはステップ7-8でどのように「出画」するかだけ。
check-mode.js実行してモード確認(A / B / C)。- タスクが生成か編集か判定。
- どのカテゴリディレクトリに属するか識別(下記「テンプレートインデックス」参照)。
- 対応する具体的なテンプレートファイルのみ読込、
references/全体を読まない。 - 厳密にテンプレート形式に従う:大多数のテンプレートはJSON主テンプレート(構造化タスク首选)使用、少数テンプレート(
infographics/hand-drawn-infographic.md、academic-figures/scientific-schematic.md等)は「構造化自然言語+パラメータ」混合形式使用、強行JSON は創作自由度を制限するため。 - ユーザー入力をテンプレートパラメータにマップ;重要情報不足時は主動的に有針対性の澄清質問開始。
この時点でプロンプトは既にレンダリング済み。以下はモード分岐:
7-A. Mode A:最終プロンプトをgarden-gpt-image-2/prompt/に保存、scripts/generate.jsまたはscripts/edit.js呼び出し、画像はgarden-gpt-image-2/image/に落ち着く。
7-B. Mode B:最終プロンプトをホスト画像ツール呼び出しに直接渡す;必要に応じてプロンプト副本をgarden-gpt-image-2/prompt/に保存。
7-C. Mode C:最終プロンプトをgarden-gpt-image-2/prompt/<task-slug>-<timestamp>.mdに保存、完全なプロンプトを対話で表示、「使用方法/推奨ツール」簡潔提示を付記。
- タスク終了後、一文でユーザーに告知:現在のモードは何か、プロンプトはどこに、画像(あれば)はどこにあるか。
重要な制約
通用:
- テンプレートファイル内のJSON はプロンプト構造テンプレート、API リクエストボディテンプレートではない。
- 三モード下で、最終的に画像モデルに渡されるのはすべて「レンダリング後のプロンプト文字列」――拍平JSON か、構造化自然言語段落か、テンプレート原様使用。
- ユーザーが明示的に要求しない限り、SKILL.md内の「モード説明」を最終プロンプトにコピーしない――それはエージェント向けメタ情報。
Mode A のみ適用:
- 生成スクリプトはJSON body 使用
- 編集スクリプトはmultipart form data 使用
- レスポンス優先
data[0].b64_jsonで解析、data[0].urlも互換 - 上流インターフェースが明示的に要求しない限り、特殊query パラメータを追加導入しない
何時に質問
以下の情報が欠けており、結果に大きく影響する場合のみ質問:
- プロンプト目標なし
- 改図時に元画像なし
- 主体身份または視覚タイプが結果方向を決定
- 商品/価格/文案/UI テキストは画面中核構成部分
- ユーザーが複数個の互い互い矛盾する目標を同時に表現
以外、優先的に自分で合理的デフォルトを行い、実行を継続。
ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ
詳細情報
- 作者
- conardli
- ライセンス
- MIT
- 最終更新
- 不明
Source: https://github.com/conardli/garden-skills / ライセンス: MIT
関連スキル
agent-browser
AI エージェント向けのブラウザ自動化 CLI です。ウェブサイトとの対話が必要な場合に使用します。ページ遷移、フォーム入力、ボタンクリック、スクリーンショット取得、データ抽出、ウェブアプリのテスト、ブラウザ操作の自動化など、あらゆるブラウザタスクに対応できます。「ウェブサイトを開く」「フォームに記入する」「ボタンをクリックする」「スクリーンショットを取得する」「ページからデータを抽出する」「このウェブアプリをテストする」「サイトにログインする」「ブラウザ操作を自動化する」といった要求や、プログラマティックなウェブ操作が必要なタスクで起動します。
anyskill
AnySkill — あなたのプライベート・スキルクラウド。GitHubを基盤としたリポジトリからエージェントスキルを管理、同期、動的にロードできます。自然言語でクラウドスキルを検索し、オンデマンドでプロンプトを自動ロード、カスタムスキルのアップロードと共有、スキルバンドルの一括インストールが可能です。OpenClaw、Antigravity、Claude Code、Cursorに対応しています。
engram
AIエージェント向けの永続的なメモリシステムです。バグ修正、意思決定、発見、設定変更の後はmem_saveを使用してください。ユーザーが「覚えている」「記憶している」と言及した場合、または以前のセッションと重複する作業を開始する際はmem_searchを使用します。セッション終了前にmem_session_summaryを使用して、コンテキストを保持してください。
skyvern
AI駆動のブラウザ自動化により、任意のウェブサイトを自動化できます。フォーム入力、データ抽出、ファイルダウンロード、ログイン、複数ステップのワークフロー実行など、ユーザーがウェブサイトと連携する必要があるときに使用します。Skyvernは、LLMとコンピュータビジョンを活用して、未知のサイトも自動操作可能です。Python SDK、TypeScript SDK、REST API、MCPサーバー、またはCLIを通じて統合できます。
pinchbench
PinchBenchベンチマークを実行して、OpenClawエージェントの実世界タスクにおけるパフォーマンスを評価できます。モデルの機能テスト、モデル間の比較、ベンチマーク結果のリーダーボード提出、またはOpenClawのセットアップがカレンダー、メール、リサーチ、コーディング、複数ステップのワークフローにどの程度対応しているかを確認する際に使用します。
openui
OpenUIとOpenUI Langを使用してジェネレーティブUIアプリを構築できます。これらはLLM生成インターフェースのためのトークン効率的なオープン標準です。OpenUI、@openuidev、ジェネレーティブUI、LLMからのストリーミングUI、AI向けコンポーネントライブラリ、またはjson-render/A2UIの置き換えについて述べる際に使用します。スキャフォルディング、defineComponent、システムプロンプト、Renderer、およびOpenUI Lang出力のデバッグに対応しています。