nano-banana-edit
RunComfy上でGoogle Nano Banana 2のimage-to-image編集エンドポイントを使用して画像を編集します。被写体のアイデンティティ保持・背景の差し替え・空間的な言語指示によるローカル編集・最大20枚のバッチ編集などNano Banana Editの強みを把握しており、GPT Image 2 edit / Flux Kontext / Nano Banana 2 t2iへのルーティング判断も行います。「nano banana edit」「edit with nano banana」などの指示、またはこのモデルでの編集リクエストをトリガーに、ローカルRunComfy CLIを通じて`runcomfy run google/nano-banana-2/edit`を呼び出します。
description の原文を見る
> Edit images with Google Nano Banana 2 (image-to-image edit endpoint) on RunComfy. Documents Nano Banana Edit's strengths (preserve subject identity, swap background, localize edits with spatial language, multi-image batch edits up to 20 inputs), the schema, and when to route to GPT Image 2 edit / Flux Kontext / Nano Banana 2 t2i instead. Calls `runcomfy run google/nano-banana-2/edit` through the local RunComfy CLI. Triggers on "nano banana edit", "edit with nano banana", "image edit nano banana", or any explicit ask to edit with this model.
SKILL.md 本文
Nano Banana Edit — Pro Pack on RunComfy
runcomfy.com · Edit endpoint · GitHub
Google Nano Banana 2 Edit — Gemini ファミリーのフラッシュ層画像モデルの image-to-image 編集エンドポイント — RunComfy Model API でホストされています。バッチ編集およびマルチリファレンス変異のために、呼び出しあたり最大 20 入力画像 に対応しています。
npx skills add agentspace-so/runcomfy-skills --skill nano-banana-edit -g
このモデルを選ぶべき場面(兄弟スキルとの比較)
| 要件 | 使用するモデル |
|---|---|
| 被写体アイデンティティを保持し、背景または衣服をスワップ | Nano Banana Edit |
| 1 つのバッチで最大 20 画像を一貫して編集 | Nano Banana Edit |
| 空間言語で「X のみ」に編集をローカライズ | Nano Banana Edit |
| 画像内の多言語テキスト(看板、ラベル)を編集 | GPT Image 2 edit |
| 単一リファレンス + 正確なローカル編集(「彼女は今 X を持っている」) | Flux Kontext |
| スクラッチから新しい画像を生成 | Nano Banana 2 t2i(兄弟スキル) |
ユーザーが「nano banana edit」/「edit with nano banana」を明示的に指定した場合は、関係なくここにルーティングしてください。
前提条件
- RunComfy CLI —
npm i -g @runcomfy/cli - RunComfy アカウント —
runcomfy loginでブラウザデバイスコードフローが開きます。 - CI / コンテナ —
runcomfy loginの代わりにRUNCOMFY_TOKEN=<token>を設定します。
エンドポイント + 入力スキーマ
google/nano-banana-2/edit
| フィールド | 型 | 必須 | デフォルト | 注記 |
|---|---|---|---|---|
prompt | string | はい | — | 編集指示。保持内容から始めて、変更で終わります。 |
image_urls | array | はい | — | 1~20 個のパブリックにアクセス可能な HTTPS URL。 |
number_of_images | int | いいえ | 1 | 1~4 個の出力を呼び出しあたり生成します。 |
seed | int | いいえ | — | 再現性。 |
aspect_ratio | enum | いいえ | auto | auto(入力に従う)または固定アスペクト比 — バッチの一貫性のためにロック。 |
resolution | enum | いいえ | 1K | 0.5K / 1K / 2K / 4K。 |
output_format | enum | いいえ | png | png / jpeg / webp。 |
safety_tolerance | int | いいえ | 4 | 1(厳密)~6(寛容)。 |
limit_generations | bool | いいえ | — | true の場合、各ラウンドを 1 出力に制限します。 |
enable_web_search | bool | いいえ | false | Web グラウンディング(追加コスト / レイテンシ)。 |
呼び出し方法
単一画像背景スワップ、アイデンティティ保持:
runcomfy run google/nano-banana-2/edit \
--input '{
"prompt": "Keep the subject identity, pose, and clothing unchanged. Convert the background into a rainy neon cyberpunk street.",
"image_urls": ["https://.../portrait.jpg"]
}' \
--output-dir <absolute/path>
ロック済みフレーミングでバッチ編集:
runcomfy run google/nano-banana-2/edit \
--input '{
"prompt": "Replace the watermark in the bottom-right with the text \"AURA\" in clean white sans-serif. Keep everything else exactly as in the input.",
"image_urls": ["https://.../sku-1.jpg", "https://.../sku-2.jpg", "https://.../sku-3.jpg"],
"aspect_ratio": "1:1",
"resolution": "1K"
}' \
--output-dir <absolute/path>
ターゲット化された空間編集(「左オブジェクトのみ」):
runcomfy run google/nano-banana-2/edit \
--input '{
"prompt": "Remove the leftmost object only. Keep the right two objects, the table, and the lighting unchanged.",
"image_urls": ["https://.../still-life.jpg"]
}' \
--output-dir <absolute/path>
プロンプト作成 — 実際に機能すること
保持を最初に、変更を最後に。 常に "Keep [identity / pose / clothing / brand / framing] unchanged." で始めます。その後、変更を 1 つのクリーンな文で述べてください。モデルは最初に述べられたことを守ります。末尾の保持内容は無視されます。
空間言語でローカライズ。 「背景のみ」「左オブジェクト」「右上のコーナー」「見出しの上」 — 具体的な空間スコープは守られます。「より X のようにする」はあいまいで、ドリフトします。
バッチの一貫性 — 一連を編集するときは、aspect_ratio と resolution をロックします。バッチ全体で同じプロンプト文法を使用して、各出力がリミックスではなく兄弟として読まれるようにします。
小さく反復。 1 回のパス編集がドリフトする場合は、2 つに分割します。パス 1 で背景のみを変更し、パス 2 で被写体の衣装をスワップします。クリーナーな編集で、総コストは同じです(同様の解像度を想定)。
マルチ画像変異 — 最大 20 の入力をパスしてコヒーレントなバッチを取得します。SKU ギャラリー、A/B テスト、キャラクター シート変異に便利です。
アンチパターン:
- 長い複合指示(「A と B と C と D を変更」) — スコープが追加されるたびにドリフトが増加します。
- 受動態で書かれた編集指示(「背景を変更する必要があります」) — 命令形で書いてください。
- 保持目標の欠落 — モデルは顔 / ブランドを微妙に書き換えます。
- 入力と一致しないアスペクト比 — クロップまたはストレッチを引き起こします。
輝く場面
| ユースケース | Nano Banana Edit を選ぶ理由 |
|---|---|
| SKU ギャラリー — 異なる背景での同じ製品 | 20 のバッチ、アイデンティティ保持、フレーミングロック |
| インフルエンサー / スポークスパーソン背景スワップ | 編集全体での強いアイデンティティ保持 |
| 局所的なオブジェクト削除 / 追加 | 空間言語は守られます |
| 広告クリエイティブの A/B 変異 | シードロック + 複数の number_of_images |
| ブランドアセット再ローカライゼーション | テキスト / パレット スワップと同じ構成 |
サンプルプロンプト(強い結果を生成することが確認されています)
背景スワップ(ページ例):
Keep the subject identity unchanged. Convert the background into a rainy
neon cyberpunk street.
ターゲット化されたテキスト置換:
Keep the bottle, label, and lighting exactly as in the input.
Replace only the brand text on the label from "ALPHA" to "AURA",
same font weight, centered, white on black.
マルチ画像バッチ一貫性:
For each input image: keep the subject's pose and identity unchanged.
Convert the background to a soft warm-grey studio sweep with subtle
floor shadow. Center the subject at the same fraction of frame as the
input.
制限事項
- 1~20 入力画像/呼び出し — 最初のものはプライマリとして扱われ、残りは補助的な手がかりを提供します。
- 1~4 出力/呼び出し。
- 長い複合プロンプトはドリフト — 複数のパスに分割します。
- Web 検索はレイテンシとコストを追加 — オンデマンドでのみ有効にしてください。
- 多言語の画像内テキスト編集については、GPT Image 2 edit が優れています。
終了コード
| コード | 意味 |
|---|---|
| 0 | 成功 |
| 64 | 不正な CLI 引数 |
| 65 | 不正な入力 JSON / スキーマ不一致 |
| 69 | アップストリーム 5xx |
| 75 | 再試行可能: タイムアウト / 429 |
| 77 | サインイン していないか、トークンが拒否されました |
完全なリファレンス: docs.runcomfy.com/cli/troubleshooting。
動作原理
スキーマと一致する JSON ボディで runcomfy run google/nano-banana-2/edit を呼び出します。CLI は https://model-api.runcomfy.net/v1/models/google/nano-banana-2/edit に POST し、リクエストをポーリングし、結果を取得し、すべての .runcomfy.net/.runcomfy.com URL を --output-dir にダウンロードします。Ctrl-C は終了前にリモート リクエストをキャンセルします。
セキュリティ & プライバシー
- トークンストレージ:
runcomfy loginは API トークンを~/.config/runcomfy/token.jsonにモード 0600(所有者のみ読み取り/書き込み)で書き込みます。CI / コンテナではファイル全体をバイパスするためにRUNCOMFY_TOKEN環境変数を設定します。 - 入力境界: ユーザープロンプトは
--input経由で JSON 文字列として CLI に渡されます。CLI はプロンプトをシェル展開しません。JSON ボディを HTTPS 経由で Model API に直接転送します。プロンプト コンテンツからのシェル インジェクション サーフェスはありません。 - サードパーティ コンテンツ: 渡す画像 / マスク / ビデオ URL は、CLI ではなく RunComfy モデル サーバーによってフェッチされます。外部 URL を信頼されていないものとして扱います。画像ベースのプロンプト インジェクションは、image-edit / video-edit モデルの既知のリスクです。
- アウトバウンド エンドポイント:
model-api.runcomfy.net(リクエスト送信)と*.runcomfy.net/*.runcomfy.com(生成出力のダウンロード ホワイトリスト)のみ。テレメトリなし、コールバックなし。 - 生成ファイル サイズ キャップ: CLI は 2 GiB を超える単一ダウンロードを中止し、悪意のあるまたは暴走モデル出力からのディスク満杯を防止します。
ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ
詳細情報
- 作者
- agentspace-so
- ライセンス
- MIT
- 最終更新
- 不明
Source: https://github.com/agentspace-so/runcomfy-agent-skills / ライセンス: MIT
関連スキル
agent-browser
AI エージェント向けのブラウザ自動化 CLI です。ウェブサイトとの対話が必要な場合に使用します。ページ遷移、フォーム入力、ボタンクリック、スクリーンショット取得、データ抽出、ウェブアプリのテスト、ブラウザ操作の自動化など、あらゆるブラウザタスクに対応できます。「ウェブサイトを開く」「フォームに記入する」「ボタンをクリックする」「スクリーンショットを取得する」「ページからデータを抽出する」「このウェブアプリをテストする」「サイトにログインする」「ブラウザ操作を自動化する」といった要求や、プログラマティックなウェブ操作が必要なタスクで起動します。
anyskill
AnySkill — あなたのプライベート・スキルクラウド。GitHubを基盤としたリポジトリからエージェントスキルを管理、同期、動的にロードできます。自然言語でクラウドスキルを検索し、オンデマンドでプロンプトを自動ロード、カスタムスキルのアップロードと共有、スキルバンドルの一括インストールが可能です。OpenClaw、Antigravity、Claude Code、Cursorに対応しています。
engram
AIエージェント向けの永続的なメモリシステムです。バグ修正、意思決定、発見、設定変更の後はmem_saveを使用してください。ユーザーが「覚えている」「記憶している」と言及した場合、または以前のセッションと重複する作業を開始する際はmem_searchを使用します。セッション終了前にmem_session_summaryを使用して、コンテキストを保持してください。
skyvern
AI駆動のブラウザ自動化により、任意のウェブサイトを自動化できます。フォーム入力、データ抽出、ファイルダウンロード、ログイン、複数ステップのワークフロー実行など、ユーザーがウェブサイトと連携する必要があるときに使用します。Skyvernは、LLMとコンピュータビジョンを活用して、未知のサイトも自動操作可能です。Python SDK、TypeScript SDK、REST API、MCPサーバー、またはCLIを通じて統合できます。
pinchbench
PinchBenchベンチマークを実行して、OpenClawエージェントの実世界タスクにおけるパフォーマンスを評価できます。モデルの機能テスト、モデル間の比較、ベンチマーク結果のリーダーボード提出、またはOpenClawのセットアップがカレンダー、メール、リサーチ、コーディング、複数ステップのワークフローにどの程度対応しているかを確認する際に使用します。
openui
OpenUIとOpenUI Langを使用してジェネレーティブUIアプリを構築できます。これらはLLM生成インターフェースのためのトークン効率的なオープン標準です。OpenUI、@openuidev、ジェネレーティブUI、LLMからのストリーミングUI、AI向けコンポーネントライブラリ、またはjson-render/A2UIの置き換えについて述べる際に使用します。スキャフォルディング、defineComponent、システムプロンプト、Renderer、およびOpenUI Lang出力のデバッグに対応しています。