Agent Skills by ALSEL
Anthropic Claudeデザイン・クリエイティブ⭐ リポ 299品質スコア 94/100

nano-banana

Nano Banana PRO(Gemini 3 Pro Image)およびNano Banana(Gemini 2.5 Flash Image)を使用したAI画像生成機能です。以下の場合に活用できます:(1)テキストプロンプトからの画像生成、(2)既存画像の編集、(3)インフォグラフィックス、ロゴ、商品写真、ステッカーなどのプロフェッショナルなビジュアルアセット制作、(4)複数画像での人物キャラクターの一貫性保持、(5)正確なテキスト描画を含む画像生成、(6)AI生成ビジュアルが必要なあらゆるタスク。「画像を生成」「画像を作成」「写真を作る」「ロゴをデザイン」「インフォグラフィックスを作成」「AI画像」「nano banana」またはその他の画像生成リクエストをトリガーとして機能します。

description の原文を見る

AI image generation using Nano Banana PRO (Gemini 3 Pro Image) and Nano Banana (Gemini 2.5 Flash Image). Use this skill when: (1) Generating images from text prompts, (2) Editing existing images, (3) Creating professional visual assets like infographics, logos, product shots, stickers, (4) Working with character consistency across multiple images, (5) Creating images with accurate text rendering, (6) Any task requiring AI-generated visuals. Triggers on: 'generate image', 'create image', 'make a picture', 'design a logo', 'create infographic', 'AI image', 'nano banana', or any image generation request.

SKILL.md 本文

Nano Banana PRO 画像生成

Gemini APIを介してGoogle の Nano Banana モデルを使用し、プロフェッショナルなAI画像を生成します。

前提条件

  • APIキーを GEMINI_API_KEY 環境変数として設定する必要があります
  • すべてのAPI呼び出しに curl を使用(SDKは不要)

モデル選択

モデル識別子最適な用途
Nano Banana PROgemini-3-pro-image-previewプロフェッショナルアセット、テキストレンダリング、インフォグラフィック、4K出力、複雑なマルチターン編集
Nano Bananagemini-2.5-flash-image高速生成、シンプルな編集、低コスト

高品質な作業にはPRO をデフォルトにします。迅速な反復やシンプルなタスクにはFlashを使用してください。

重要:プロンプトエンジニアリング最優先

API呼び出し前に、必ず効果的なプロンプトを作成してください。 包括的なプロンプト作成戦略については、references/prompting-guide.md を参照してください。主要原則:

金の法則

  1. キーワードを列挙するのではなくシーンを説明する - タグの羅列ではなく、物語的な説明を書く
  2. 自然言語を使用する - 正しい文法で完全な文を使う
  3. 具体的にする - 被写体、背景、照明、雰囲気、素材を定義する
  4. 文脈を提供する - 「なぜ」がモデルより良い芸術的決定を下すのに役立つ
  5. 再生成ではなく編集を行う - 80%正しい場合は、特定の変更をリクエストする

ICSフレームワーク(クイックリファレンス)

任意の画像について以下を指定します:

  • Image type(画像タイプ):どんなビジュアルか(写真、インフォグラフィック、ロゴ、ステッカーなど)
  • Content(コンテンツ):含める特定の要素、データ、情報
  • Style(スタイル):ビジュアルスタイル、カラーパレット、アーティスティックアプローチ

APIリファレンス

テキストから画像への生成

curl -s -X POST \
  "https://generativelanguage.googleapis.com/v1beta/models/gemini-3-pro-image-preview:generateContent" \
  -H "x-goog-api-key: $GEMINI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "contents": [{
      "parts": [{"text": "YOUR_PROMPT_HERE"}]
    }],
    "generationConfig": {
      "responseModalities": ["TEXT", "IMAGE"],
      "imageConfig": {
        "aspectRatio": "16:9",
        "imageSize": "2K"
      }
    }
  }'

画像編集(入力画像付き)

curl -s -X POST \
  "https://generativelanguage.googleapis.com/v1beta/models/gemini-3-pro-image-preview:generateContent" \
  -H "x-goog-api-key: $GEMINI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "contents": [{
      "parts": [
        {"text": "YOUR_EDIT_INSTRUCTION"},
        {"inline_data": {"mime_type": "image/png", "data": "BASE64_IMAGE_DATA"}}
      ]
    }],
    "generationConfig": {
      "responseModalities": ["TEXT", "IMAGE"]
    }
  }'

設定オプション

パラメータ注記
aspectRatio1:1, 2:3, 3:2, 3:4, 4:3, 4:5, 5:4, 9:16, 16:9, 21:9ユースケースに合わせる
imageSize1K, 2K, 4K大文字のK を使用;4Kはプロモデルのみ

Googleサーチグラウンディング(リアルタイムデータ)

現在の情報に基づいて画像を生成するために "tools": [{"google_search": {}}] を追加します:

curl -s -X POST \
  "https://generativelanguage.googleapis.com/v1beta/models/gemini-3-pro-image-preview:generateContent" \
  -H "x-goog-api-key: $GEMINI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "contents": [{"parts": [{"text": "Create an infographic of current tech stock prices"}]}],
    "tools": [{"google_search": {}}],
    "generationConfig": {
      "responseModalities": ["TEXT", "IMAGE"],
      "imageConfig": {"aspectRatio": "16:9"}
    }
  }'

ワークフロー

ステップ 1:プロンプトを作成する

ICS フレームワークとプロンプティングガイドを使用します。例:

フォトリアリスティック:

深いしわと温かい笑顔を持つ年配の日本人陶芸家が茶碗を検査するクローズアップ肖像写真。窓からの柔らかい夕方の光。85mm レンズ、浅いピント。静寂に満ちた雰囲気。

インフォグラフィック:

レシピとして光合成を説明するクリーンでモダンなインフォグラフィックを作成してください。「材料」(太陽光、水、CO2)と「完成品」(エネルギー)を表示します。カラフルなキッズ料理本のページのようなスタイル。

製品写真:

磨かれたコンクリートの上にマットブラックの陶製コーヒーマグを配置したハイレゾリューション スタジオ写真。3点ソフトボックス照明、45度角、立ち上る湯気にシャープフォーカス。正方形フォーマット。

ステップ 2:画像を生成する

scripts/generate-image.sh を使用するか、API を直接呼び出します:

./scripts/generate-image.sh "Your prompt here" output.png --ratio 16:9 --size 2K

ステップ 3:レスポンスを処理する

APIは base64 エンコードされた画像データを返します。抽出してデコードします:

# レスポンスに含まれるもの: {"candidates":[{"content":{"parts":[{"inlineData":{"mimeType":"image/png","data":"BASE64..."}}]}}]}
# jq で抽出してデコード:
cat response.json | jq -r '.candidates[0].content.parts[] | select(.inlineData) | .inlineData.data' | base64 -d > image.png

よくあるユースケース

ランディングページと広告

  • ヒーロー画像には 16:9 または 21:9 を使用
  • ブランドカラー、モダン/ミニマルスタイルを指定
  • プロンプトにテキスト要件を含める

ロゴとアイコン

  • 1:1 アスペクト比を使用
  • 「ミニマリスト」「クリーンなライン」「ベクタースタイル」をリクエスト
  • カラースキームを明示的に指定

製品写真

  • 照明設定(ソフトボックス、自然光、スタジオ)を説明
  • 表面/背景素材を記載
  • カメラアングルとレンズタイプを含める

インフォグラフィック

  • 視覚化するデータを定義
  • スタイルを指定(コーポレート、プレイフル、テクニカル)
  • クリアなテキストとラベル付きセクションをリクエスト

ステッカーとイラスト

  • 「太い輪郭」「かわいい」「セルシェーディング」をリクエスト
  • 「白背景」または「透明背景」を指定
  • カラーパレットを定義

キャラクター一貫性(複数画像)

  • PROは最大14の参考画像をサポート
  • 明示的に状態:「Image 1 と全く同じ顔の特徴を保持してください」
  • アイデンティティを保ちながら表情/ポーズの変更を説明

スクリプト

すぐに使用できる生成スクリプトについては、scripts/generate-image.sh を参照してください。

詳細なプロンプティングガイド

以下を含む高度なテクニック:

  • フォトリアリスティックシーンテンプレート
  • テキストレンダリングのベストプラクティス
  • シーケンシャルアートとストーリーボーディング
  • 次元変換(2D↔3D)
  • リアルタイムデータ用のサーチグラウンディング

references/prompting-guide.md を参照してください。

ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ

詳細情報

作者
majiayu000
リポジトリ
majiayu000/claude-skill-registry
ライセンス
MIT
最終更新
2026/5/4

Source: https://github.com/majiayu000/claude-skill-registry / ライセンス: MIT

本サイトは GitHub 上で公開されているオープンソースの SKILL.md ファイルをクロール・インデックス化したものです。 各スキルの著作権は原作者に帰属します。掲載に問題がある場合は info@alsel.co.jp または /takedown フォームよりご連絡ください。
原作者: majiayu000 · majiayu000/claude-skill-registry · ライセンス: MIT