nano-banana-2
GoogleのNano Banana 2(Gemini 3.1 Flash Image Preview)APIを使用して画像の生成・編集を行います。ユーザーが画像の作成や加工を求める際、特に高速な反復処理、アスペクト比の細かい指定、または512pxから4Kまでの解像度コントロールが必要な場合に使用してください。
description の原文を見る
Generate and edit images using Google's Nano Banana 2 (Gemini 3.1 Flash Image Preview) API. This skill should be used when the user asks to create or modify images, especially when they need fast iteration, explicit aspect-ratio control, or resolution control from 512px to 4K.
SKILL.md 本文
Nano Banana 2 画像生成・編集
Nano Banana 2 (gemini-3.1-flash-image-preview) を使用して新規画像を生成したり、既存の画像を編集したりできます。
使用方法
スキルディレクトリに cd しずに、絶対パスまたはワークスペース相対パスを使用してスクリプトを実行します:
新規画像を生成:
uv run ./.agents/skills/nano-banana-2/scripts/generate_image.py --prompt "画像の説明" --filename "output-name.png" [--resolution 512px|1K|2K|4K] [--aspect-ratio RATIO] [--api-key KEY]
参照画像を使用して編集:
uv run ./.agents/skills/nano-banana-2/scripts/generate_image.py --prompt "編集指示" --filename "output-name.png" --input-image "path/to/input1.png" [--input-image "path/to/input2.png" ...] [--resolution 512px|1K|2K|4K] [--aspect-ratio RATIO] [--api-key KEY]
ユーザーの現在のワーキングディレクトリから実行して、出力がアクティブなプロジェクトコンテキストに保存されることを確認してください。
モデル
以下のモデルコードを使用:
gemini-3.1-flash-image-preview(Nano Banana 2)
このスキルでは gemini-3-pro-image-preview を使用しないでください。
解像度オプション
Nano Banana 2 は以下をサポート:
512px(最速、低レイテンシーの反復)1K(デフォルト)2K4K
一般的なユーザーの言葉をマッピング:
- 「クイックドラフト」「サムネイル」「小さい」「512」「0.5K」 →
512px - 解像度の指定なし →
1K - 「2K」「中程度」「標準」 →
2K - 「4K」「高解像度」「ウルトラ」「印刷品質」 →
4K
1K、2K、4K は大文字の K を使用してください。
アスペクト比
サポートされるアスペクト比:
1:1、1:4、1:8、2:3、3:2、3:4、4:1、4:3、4:5、5:4、8:1、9:16、16:9、21:9
一般的なリクエストをマッピング:
- 正方形の投稿 / アイコン →
1:1 - スマートフォン壁紙 / 縦型リール →
9:16 - ワイドスクリーン / スライド / ヒーロー画像 →
16:9 - シネマティック・ワイド →
21:9 - ポートレートプリント →
2:3または3:4 - パノラマバナー →
4:1または8:1
指定されない場合は、モデルのデフォルト動作を適用してください。
参照画像 (Gemini 3 画像ワークフローの新機能)
必要に応じて --input-image を繰り返して、最大 14 枚の参照画像を提供できます:
- キャラクターの一貫性を保持
- オブジェクトの忠実度を保持
- 複数の視覚的参照を 1 つの出力に組み合わせる
シンプルな編集には 1 枚の画像を使用;構成や一貫性に敏感なタスクには複数の画像を使用してください。
API キー
API キーを以下の順序で解決:
--api-key引数GEMINI_API_KEY環境変数
キーが利用できない場合は、停止して明確なエラーを報告してください。
ファイル名生成
ファイル名を以下の形式で生成:yyyy-mm-dd-hh-mm-ss-name.png
例:
2026-02-26-17-31-04-japanese-garden.png2026-02-26-17-31-59-social-banner.png
プロンプト処理
生成の場合、重大な不足がない限り、ユーザーのリクエストをそのまま渡してください。 編集の場合、明示的な変換指示をプロンプトに含め、元の意図を保持してください。
出力
- PNG を現在のディレクトリ (または
--filenameで指定されたパス) に保存 - 保存された完全パスを返す
- 明示的にリクエストされない限り、出力画像を読み込まない
例
4K ワイドスクリーン画像を作成:
uv run ./.agents/skills/nano-banana-2/scripts/generate_image.py --prompt "Futuristic city skyline at blue hour with neon reflections" --filename "2026-02-26-17-45-00-futuristic-skyline.png" --resolution 4K --aspect-ratio 16:9
複数の参照を使用して編集:
uv run ./.agents/skills/nano-banana-2/scripts/generate_image.py --prompt "Create a polished campaign image that keeps the exact logo details and character identity" --filename "2026-02-26-17-50-10-campaign-image.png" --input-image "logo.png" --input-image "character.png" --resolution 2K --aspect-ratio 4:5
ライセンス: CC0-1.0(寛容ライセンスのため全文を引用しています) · 原本リポジトリ
詳細情報
- 作者
- intellectronica
- ライセンス
- CC0-1.0
- 最終更新
- 不明
Source: https://github.com/intellectronica/agent-skills / ライセンス: CC0-1.0
関連スキル
agent-browser
AI エージェント向けのブラウザ自動化 CLI です。ウェブサイトとの対話が必要な場合に使用します。ページ遷移、フォーム入力、ボタンクリック、スクリーンショット取得、データ抽出、ウェブアプリのテスト、ブラウザ操作の自動化など、あらゆるブラウザタスクに対応できます。「ウェブサイトを開く」「フォームに記入する」「ボタンをクリックする」「スクリーンショットを取得する」「ページからデータを抽出する」「このウェブアプリをテストする」「サイトにログインする」「ブラウザ操作を自動化する」といった要求や、プログラマティックなウェブ操作が必要なタスクで起動します。
anyskill
AnySkill — あなたのプライベート・スキルクラウド。GitHubを基盤としたリポジトリからエージェントスキルを管理、同期、動的にロードできます。自然言語でクラウドスキルを検索し、オンデマンドでプロンプトを自動ロード、カスタムスキルのアップロードと共有、スキルバンドルの一括インストールが可能です。OpenClaw、Antigravity、Claude Code、Cursorに対応しています。
engram
AIエージェント向けの永続的なメモリシステムです。バグ修正、意思決定、発見、設定変更の後はmem_saveを使用してください。ユーザーが「覚えている」「記憶している」と言及した場合、または以前のセッションと重複する作業を開始する際はmem_searchを使用します。セッション終了前にmem_session_summaryを使用して、コンテキストを保持してください。
skyvern
AI駆動のブラウザ自動化により、任意のウェブサイトを自動化できます。フォーム入力、データ抽出、ファイルダウンロード、ログイン、複数ステップのワークフロー実行など、ユーザーがウェブサイトと連携する必要があるときに使用します。Skyvernは、LLMとコンピュータビジョンを活用して、未知のサイトも自動操作可能です。Python SDK、TypeScript SDK、REST API、MCPサーバー、またはCLIを通じて統合できます。
pinchbench
PinchBenchベンチマークを実行して、OpenClawエージェントの実世界タスクにおけるパフォーマンスを評価できます。モデルの機能テスト、モデル間の比較、ベンチマーク結果のリーダーボード提出、またはOpenClawのセットアップがカレンダー、メール、リサーチ、コーディング、複数ステップのワークフローにどの程度対応しているかを確認する際に使用します。
openui
OpenUIとOpenUI Langを使用してジェネレーティブUIアプリを構築できます。これらはLLM生成インターフェースのためのトークン効率的なオープン標準です。OpenUI、@openuidev、ジェネレーティブUI、LLMからのストリーミングUI、AI向けコンポーネントライブラリ、またはjson-render/A2UIの置き換えについて述べる際に使用します。スキャフォルディング、defineComponent、システムプロンプト、Renderer、およびOpenUI Lang出力のデバッグに対応しています。