image-poster
ポスター、キーアート、編集用イラストなど単一画像の生成に対応したスキルです。デフォルトではgpt-image-2を使用しますが、プロバイダーに依存しない設計になっており、同じワークフローでFlux、Imagen、Midjourneyを上流ツールの設定に応じて利用できます。生成された画像はPNG/JPEG形式で複数枚プロジェクトフォルダに保存されます。
description の原文を見る
Single-image generation skill for posters, key art, and editorial illustrations. Defaults to gpt-image-2 but is provider-agnostic — the same workflow drives Flux, Imagen, or Midjourney via the active upstream tooling. Output is one or more PNG/JPEG files saved to the project folder.
SKILL.md 本文
Image Poster Skill
ユーザーが別途のバリエーション要求をしない限り、1ターンあたり1つの完成した画像アセットを生成します。画像生成には、構造化された厳密なプロンプトが有効です。ユーザーのブリーフからプロンプトを組み立て、これをディスパッチするのが当スキルの役割です。
リソースマップ
image-poster/
├── SKILL.md ← 現在ご覧のファイル
└── example.html ← Examples に表示される結果カードの見た目
ワークフロー
ステップ 0 — プロジェクトメタデータの確認
アクティブなプロジェクトは imageModel、imageAspect、および(オプション)imageStyle のノートを保持しています。これらを上流のモデル + キャンバス + スタイルアンカーとして使用します。(unknown — ask) とマークされている場合のみ、ユーザーに記入するよう要求してください。
ステップ 1 — プロンプトの構成
何かツールを呼び出す前に、以下の正確な順序で計画を立てます:
- 被写体 + 構図 — フレーム内に何があるか、どこにあるか、どのスケールか;視線と切り抜き。
- ライティング + 雰囲気 — 自然光 / スタジオライト / ムーディー;暖色 / 寒色;キーライト、リムライト、フィルライト;屋外の場合は時間帯。
- パレット + テクスチャ — ユーザーがブランドパレットを提示した場合はHex値;それ以外は3語の雰囲気タグ(例:「muted ochre + ink」)。
- カメラ / レンズ — ユーザーが写真的リアリズム(「85mm portrait, shallow DOF」)または特定のフィルムストックを望む場合のみ。
- 避けるべき要素 — よくあるAIアーティファクト(「指が多すぎない、テキストが歪んでいない、ロゴプレースホルダーがない」)。
ステップ 2 — メディアコントラクト経由でのディスパッチ
統一されたディスパッチャーを使用します。上流プロバイダーAPIを直接呼び出さないでください。シェルツールから実行します:
node "$OD_BIN" media generate \
--project "$OD_PROJECT_ID" \
--surface image \
--model "<imageModel from metadata>" \
--aspect "<imageAspect from metadata>" \
--output "<short-descriptive-name>.png" \
--prompt "<the full assembled prompt from Step 1>"
このコマンドは1行のJSON {"file": {"name": "...", ...}} を出力します。デーモンはバイト列をプロジェクトフォルダに書き込み、FileViewerが自動的に検出します。
ステップ 3 — ハンドオフ
使用したプロンプトの1段落の要約と、ディスパッチャーが返したファイル名(例:I generated hero-poster.png with gpt-image-2 at 1:1.)で返信します。<artifact> タグは出力しないでください。
厳密なルール
- 別途のバリエーション要求がない限り、1ターンあたり1つの画像。
imageAspectを正確に守ります。上流のコストは同じですが、アスペクト比を揃えるとリレンダリングを回避できます。- ユーザーがフレーム内テキストを要求しない限り、画像内に詰め物用タイポグラフィを入れません。実際のコピーがlorem ipsumに勝ります。
- すべてのレンダリングを保存します。ファイルを生成せずに画像を説明することはありません。ユーザーはファイルビューアで何かを開くことを期待しています。
ライセンス: Apache-2.0(寛容ライセンスのため全文を引用しています) · 原本リポジトリ
詳細情報
- 作者
- junainfinity
- ライセンス
- Apache-2.0
- 最終更新
- 2026/5/8
Source: https://github.com/junainfinity/osmDesign / ライセンス: Apache-2.0
関連スキル
nano-banana-2
inference.sh CLIを通じてGoogle Gemini 3.1 Flash Image Preview(Nano Banana 2)で画像を生成します。テキストから画像を生成する機能、画像編集、最大14枚の複数画像入力、Google Searchグラウンディング機能に対応しています。トリガーワード:「nano banana 2」「nanobanana 2」「gemini 3.1 flash image」「gemini 3 1 flash image preview」「google image generation」
octocode-slides
洗練されたマルチファイル形式のHTMLプレゼンテーションを生成します。6段階のフロー(概要 → リサーチ → アウトライン → デザイン → 実装 → レビュー)で構成されています。各スライドは独立したHTMLファイルとなり、iframeで読み込まれます。「スライドを作成してほしい」「プレゼンテーションを作ってほしい」「HTMLスライドを生成してほしい」「デックを構築してほしい」といった依頼や、ノート・ドキュメント・コードを洗練されたプレゼンテーションに変換する際に使用できます。
gpt-image2-ppt
OpenAIのgpt-image-2を使用して、視覚的に優れたPPTスライドを生成します。Spatial Glass、Tech Blue、Editorial Monoなど10種類のキュレーション済みスタイルに対応し、ユーザーが提供したPPTXファイルを模倣するテンプレートクローンモードも搭載しています。HTMLビューアと16:9形式のPPTXファイルを出力します。プレゼンテーション、スライド、ピッチデック、投資家向けPPT、雑誌風PPTの作成依頼などで活用してください。
nano-banana
Nano Banana PRO(Gemini 3 Pro Image)およびNano Banana(Gemini 2.5 Flash Image)を使用したAI画像生成機能です。以下の場合に活用できます:(1)テキストプロンプトからの画像生成、(2)既存画像の編集、(3)インフォグラフィックス、ロゴ、商品写真、ステッカーなどのプロフェッショナルなビジュアルアセット制作、(4)複数画像での人物キャラクターの一貫性保持、(5)正確なテキスト描画を含む画像生成、(6)AI生成ビジュアルが必要なあらゆるタスク。「画像を生成」「画像を作成」「写真を作る」「ロゴをデザイン」「インフォグラフィックスを作成」「AI画像」「nano banana」またはその他の画像生成リクエストをトリガーとして機能します。
oiloil-ui-ux-guide
モダンでクリーンなUI/UXガイダンス・レビュースキルです。新機能や既存システム(Webアプリ)に対して、実行可能なUI/UX改善提案、デザイン原則、デザインレビューチェックリストが必要な場合に活用できます。CRAP(コントラスト・反復・配置・近接)をベースに、タスクファーストなUX、情報設計、フィードバック・システムステータス、一貫性、affordances、エラー防止・復旧、認知負荷を重視します。モダンミニマルスタイル(クリーン・余白・タイポグラフィ主導)を強制し、不要なテキストを削減、アイコンとしての絵文字を禁止し、統一されたアイコンセットから直感的で洗練されたアイコンを推奨します。
axiom-hig-ref
Apple Human Interface Guidelines リファレンス — 色(セマンティックカラー、カスタムカラー、パターン)、背景(マテリアル階層、ダイナミック背景)、タイポグラフィ(標準スタイル、カスタムフォント、Dynamic Type)、SF Symbols(レンダリングモード、色、多言語対応)、ダークモード、アクセシビリティ、プラットフォーム固有の考慮事項を網羅したガイドラインです。