Nanobanana — Nano Banana イメージ生成

Google の Nano Banana (Gemini イメージ生成 API) を使用して、画像を生成・編集します。このスキルは、直接的な画像生成、反復的な編集、およびコードベースへの API 統合に関する専門的なガイダンスを提供します。

主な特徴: ユーザーの意図とプロジェクトコンテキストを分析し、API 呼び出しの前に最適化されたプロンプトを作成するプロンプト強化システムです。

フェーズ 0: 環境確認

その他の処理に先立ち、環境が準備できていることを確認します。

1. API キーを確認:

echo "${GEMINI_API_KEY:0:10}..."  # Show first 10 chars only (security)

GEMINI_API_KEY が空または未設定の場合:

references/integration-guide.md (セットアップセクション) を読む
ユーザーにセットアップ手順を提示する
キーが設定されるまでここで停止します

2. uv が利用可能か確認:

uv --version 2>&1

uv がインストールされていない場合は、ユーザーを https://docs.astral.sh/uv/getting-started/installation/ に案内して停止してください。uv は PEP 723 のインラインメタデータを使用して依存関係を自動的に処理します。手動で pip install を実行する必要はありません。

フェーズ 1: 意図を理解してモードを判定

会話から以下を抽出します:

被写体/シーン: 画像に何が映っていますか？
用途: 何のためですか？ (ヒーロー画像、アイコン、モックアップ、ブログ記事など)
スタイル: フォトリアリスティック、イラスト、ミニマリストなど
技術要件: アスペクト比、解像度、特定の寸法
ムード/雰囲気: エネルギッシュ、落ち着いた、プロフェッショナル、遊び心のあるなど

モード判定

エキスパート統合モード — ユーザーが Nano Banana をコードベースに統合したい場合 (例: 「アプリに画像生成を追加するにはどうすればいい？」「API を見せて」「画像を生成する機能を構築している」):

references/integration-guide.md を読む
SDK の例、認証パターン、本番環境のベストプラクティスを提供する
ガイダンスにスキップ — API を呼び出さない

生成モード — ユーザーが今すぐ画像を生成したい場合:

フェーズ 2 に進む

プロジェクトコンテキストを分析 (生成モードのみ)

プロジェクトディレクトリ内で起動された場合、プロンプトを改善するためにコンテキストを収集します:

# Identify project type
ls package.json pyproject.toml README.md 2>/dev/null | head -5

# Find project description
head -20 README.md 2>/dev/null || head -20 pyproject.toml 2>/dev/null

# Find existing images (identify style conventions)
find . -name "*.png" -o -name "*.jpg" -o -name "*.svg" 2>/dev/null | grep -v node_modules | head -10

# Find color schemes (Tailwind, CSS variables, theme files)
grep -r "primary\|brand\|#[0-9a-fA-F]\{6\}" --include="*.css" --include="*.ts" --include="*.json" -l 2>/dev/null | head -5

このコンテキストを使用して、生成された画像がプロジェクトのビジュアル言語に適合するようにします。

リクエストタイプを分類

最も適切なカテゴリを選択します:

photorealistic — シーン、ポートレート、商品写真、風景
stylized — イラスト、アート、漫画、コンセプトアート
text-heavy — ポスター、バナー、テキスト付きインフォグラフィックス
product-marketing — 商業的な商品撮影
ui-mockup — アプリ画面、ウェブサイトデザイン、ワイヤーフレーム
diagram — テクニカルイラスト、フローチャート、アーキテクチャ
minimalist — 抽象的、ロゴ、アイコンコンセプト

不足している情報のみを質問

会話で既に提供されていない情報のみを質問してください。ユーザーが「SaaS アプリ向けのミニマリストロゴ」と言った場合、被写体 (ロゴ)、スタイル (ミニマリスト)、用途 (SaaS ブランディング) は既にわかっています。既にわかっていることは質問しないでください。

フェーズ 2: プロンプトを強化

リクエストカテゴリに基づいて、references/prompt-engineering.md から関連するセクションを読みます。

強化プロセス

カテゴリ固有の強化を適用します:

カテゴリ	プロンプトに追加
`photorealistic`	カメラアングル、レンズタイプ、ライティング設定、被写界深度、雰囲気
`stylized`	アートスタイル、品質レベル、シェーディング手法、カラーパレット参照
`text-heavy`	引用符内の正確なテキスト、フォントスタイル、ウェイト、色、配置
`product-marketing`	スタジオライティング設定、表面素材、背景タイプ
`ui-mockup`	デバイスフレーム、デザイン言語、既知のプロジェクト色
`diagram`	ダイアグラムタイプ、カラーコード方式、ラベルスタイル、クリーンな線
`minimalist`	背景色 (正確に)、要素の配置、サイズの割合

フェーズ 1 で見つかったプロジェクトコンテキスト (ブランドカラー、デザインシステム、ドメイン) を組み込みます。

強化されたプロンプトを承認のために提示

生成の前に必ず表示します。このステップをスキップしないでください。

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
 プロンプト確認
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
元のプロンプト: [ユーザーの元のプロンプト]

強化されたプロンプト: [追加が含まれた改善されたプロンプト]

変更内容:
  + [追加されたもの]
  + [追加された理由]

モデル:    [選択されたモデル名]
アスペクト比:   [例: 16:9]
解像度: [例: 2K]
推定コスト: ~$[推定値]
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
強化されたプロンプトで進みますか？ (yes / modify / use original)

ユーザーが変更したい場合、強化されたプロンプトを更新し、進める前に確認ブロックを再度表示します。

フェーズ 3: モデルとパラメータを選択

デフォルト: Nano Banana 2 (gemini-3.1-flash-image-preview) を 2K 解像度で使用します。

詳細については references/model-guide.md を参照してください。クイックリファレンス:

ユースケース	モデル	解像度
クイックドラフト/反復処理	`gemini-2.5-flash-image`	512 または 1K
ほとんどの本番資産 (デフォルト)	`gemini-3.1-flash-image-preview`	2K
テキスト重視の画像	`gemini-3-pro-image-preview`	2K–4K
プリント/高 DPI	`gemini-3-pro-image-preview`	4K

ユースケース別のアスペクト比のデフォルト:

ヒーロー/バナー: 16:9
プロフィール/アバター: 1:1
ストーリー/モバイル: 9:16
ポートレート/ピン: 2:3
標準ウェブ: 4:3

モデルと解像度の選択を常にフェーズ 2 の確認ブロックの一部としてユーザーに提示し、ユーザーが上書きできるようにします。

フェーズ 4: 画像を生成

出力パスを決定します (指定されていない場合はデフォルトで ./generated-image.png を使用するか、./hero-image.png や ./logo-concept.png などの文脈に適した名前を使用します)。

テキストから画像へ

uv run "$(dirname "$0")/scripts/generate.py" \
  --prompt "ENHANCED_PROMPT_HERE" \
  --model "MODEL_ID_HERE" \
  --aspect-ratio "ASPECT_RATIO_HERE" \
  --resolution "RESOLUTION_HERE" \
  --output "OUTPUT_PATH_HERE"

画像編集 (ユーザーが既存の画像を提供する場合)

uv run "$(dirname "$0")/scripts/generate.py" \
  --prompt "EDIT_INSTRUCTION_HERE" \
  --input-image "INPUT_IMAGE_PATH_HERE" \
  --model "MODEL_ID_HERE" \
  --aspect-ratio "ASPECT_RATIO_HERE" \
  --resolution "RESOLUTION_HERE" \
  --output "OUTPUT_PATH_HERE"

JSON 出力を解析

スクリプトは JSON オブジェクトを出力します。各ケースを解析および処理します:

成功:

{"status": "success", "output_path": "/abs/path/image.png", "model_used": "...", "text_response": "...", "size_bytes": 245760}

→ ファイルパスを報告します。プラットフォームがインライン表示をサポートしている場合は、画像ファイルで Read を使用します。

エラーケース:

`error_code`	意味	対応
`CONTENT_POLICY`	プロンプトが安全フィルターでブロックされた	言い回しを変更するよう提案し、機密要素を削除する
`RATE_LIMIT`	API クォータを超過した	再試行前に待機し、低コストモデルの使用を提案する
`AUTH_ERROR`	API キーが無効または見つからない	ユーザーを `references/integration-guide.md` のセットアップセクションに案内する
`NO_IMAGE_GENERATED`	モデルが画像を返さなかった	プロンプトを言い換えるか、別のモデルを試す
`DEPENDENCY_ERROR`	`google-genai` がインストールされていない	`uv` が利用可能であることを確認し、`uv run` が PEP 723 メタデータを使用して依存関係を自動的に処理します
`FILE_NOT_FOUND`	入力画像パスが無効	パスを確認して再実行する

フェーズ 5: 反復 (オプション)

成功した生成の後、ユーザーのフィードバックに基づいて反復オプションを提供します:

軽微な調整 (色、明るさ、小さな構成変更): → 画像編集モード を使用 — 前の出力を --input-image として渡す

大きな変更 (まったく異なる被写体、スタイル変更): → 強化されたプロンプトを変更し、最初から再生成 します

迅速な探索 (複数のコンセプトをテスト): → すべての反復に gemini-2.5-flash-image を 512 解像度で使用する → 勝利するコンセプトを特定し、gemini-3.1-flash-image-preview で 2K で再生成する

反復編集セッション では、ユーザーが必要に応じて以前のバージョンに戻せるようにプロンプトの進化を追跡します。

エキスパート統合モード

ユーザーがコードベースに画像生成を追加したい場合:

references/integration-guide.md を読む
ユーザーのテックスタック (Python、JavaScript/TypeScript、REST API が必要) を特定する
ガイドから関連する SDK の例を提供する
例をプロジェクト構造にカスタマイズします:
- Python FastAPI/Flask → エンドポイントとして表示
- Next.js → API ルートとして表示
- プレーンスクリプト → スタンドアロン関数として表示
ガイドの重要な本番環境の懸念事項を強調します:
- API キーをフロントエンドで公開しない
- ユーザーごとにレート制限を実装
- プロンプトハッシュでキャッシュ
- 429 を指数バックオフで処理
プロジェクトタイプに適した環境変数セットアップを提案します

リファレンスファイル

references/prompt-engineering.md — 写真用語、スタイルガイド、カテゴリ別のスパース→リッチ例
references/model-guide.md — モデル比較、価格、レート制限、解像度オプション
references/integration-guide.md — SDK の例 (Python/JS/REST)、セットアップ、本番環境のベストプラクティス
scripts/generate.py — リトライロジックと JSON 出力を備えたコア API コーラー
scripts/requirements.txt — google-genai>=1.0.0

ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ

nanobanana

SKILL.md 本文

Nanobanana — Nano Banana イメージ生成

フェーズ 0: 環境確認

フェーズ 1: 意図を理解してモードを判定

会話から以下を抽出します:

モード判定

プロジェクトコンテキストを分析 (生成モードのみ)

リクエストタイプを分類

不足している情報のみを質問

フェーズ 2: プロンプトを強化

強化プロセス

強化されたプロンプトを承認のために提示

フェーズ 3: モデルとパラメータを選択

フェーズ 4: 画像を生成

テキストから画像へ

画像編集 (ユーザーが既存の画像を提供する場合)

JSON 出力を解析

フェーズ 5: 反復 (オプション)

エキスパート統合モード

リファレンスファイル

詳細情報

SKILL.md 本文

Nanobanana — Nano Banana イメージ生成

フェーズ 0: 環境確認

フェーズ 1: 意図を理解してモードを判定

会話から以下を抽出します:

モード判定

プロジェクト コンテキストを分析 (生成モードのみ)

リクエスト タイプを分類

不足している情報のみを質問

フェーズ 2: プロンプトを強化

強化プロセス

強化されたプロンプトを承認のために提示

フェーズ 3: モデルとパラメータを選択

フェーズ 4: 画像を生成

テキストから画像へ

画像編集 (ユーザーが既存の画像を提供する場合)

JSON 出力を解析

フェーズ 5: 反復 (オプション)

エキスパート統合モード

リファレンス ファイル

詳細情報

プロジェクトコンテキストを分析 (生成モードのみ)

リクエストタイプを分類

リファレンスファイル