nanobanana
Gemini ネイティブの Nano Banana イメージ生成・編集スキルで、Nano Banana、Nano Banana 2、Nano Banana Pro に対応。テキストから画像生成、画像編集、ローカル参照の繰り返し、バッチ生成、ドライラン検査、セルフホスト型ゲートウェイなどカスタム Gemini 互換ベース URL が必要な場面で活用できます。
description の原文を見る
Gemini-native Nano Banana image generation and editing across Nano Banana, Nano Banana 2, and Nano Banana Pro. Use when you need text-to-image, image-to-image edits, repeated local references, batch generation, dry-run request inspection, or a custom Gemini-compatible base URL such as a self-hosted gateway.
SKILL.md 本文
Nano Banana
Gemini-native Nano Banana 画像生成と編集のための単一の Python エントリーポイント。モデルエイリアス、厳密なオプション検証、バッチ実行、カスタムエンドポイント対応を備えています。
ワークフロー
references/config.mdを開いて環境変数とオーバーライド順序を選択します。references/models-and-api.mdを開いて適切な Nano Banana ティアを選択し、モデル固有の制約を確認します。- 最速で低コストのデフォルト (
nanobanana) または最高忠度の推論モデル (nanobanana-pro) が必要な場合を除き、gemini-3.1-flash-image-preview(nanobanana-2) を優先します。 - 単一リクエストの場合は
scripts/nanobanana.py generateを実行し、反復的なバリアントの場合はscripts/nanobanana.py batchを実行します。 - ペイロード形状、エンドポイント、またはモデル固有のオプション対応がメインのリスクである場合は、最初に
--dry-runを追加します。 - カスタム Gemini 互換ゲートウェイが必要な場合は
--base-urlまたはGEMINI_BASE_URLを渡します。 - デバッグのために生の JSON ボディが必要な場合は、
generateで--save-response <path>を追加します。
コマンド
単一のテキスト から画像へのリクエスト:
python .\skills\nanobanana\scripts\nanobanana.py generate `
--prompt "A retro-futurist product hero illustration for a developer tool" `
--output .\out\hero.png `
--model nanobanana-2 `
--ratio 16:9 `
--size 2K
2 つのローカル参照を使用して既存の画像を編集:
python .\skills\nanobanana\scripts\nanobanana.py generate `
--prompt "Turn these references into a clean launch poster with legible title text" `
--input-image .\refs\subject.png `
--input-image .\refs\background.png `
--output .\out\poster.png `
--model nanobanana-pro `
--ratio 4:5 `
--size 2K
カスタム Gemini 互換ゲートウェイを使用:
python .\skills\nanobanana\scripts\nanobanana.py generate `
--prompt "A bold mascot sticker pack" `
--output .\out\stickers.png `
--base-url http://your-gateway.example.com/v1beta `
--auth-mode bearer
5 つのバリアントをバッチ生成:
python .\skills\nanobanana\scripts\nanobanana.py batch `
--prompt "Minimal app icon for a PDF workflow product" `
--count 5 `
--dir .\out\icons `
--prefix icon `
--model nanobanana `
--ratio 1:1
送信せずに最終リクエストを検査:
python .\skills\nanobanana\scripts\nanobanana.py generate `
--prompt "An editorial illustration of AI agents at work" `
--model nanobanana-2 `
--output .\out\agents.png `
--dry-run
ルール
--modelはnanobanana、nanobanana-2、nanobanana-proのエイリアスか、正確な Gemini モデル ID を受け入れます。nanobananaはgemini-2.5-flash-imageに、nanobanana-2はgemini-3.1-flash-image-previewに、nanobanana-proはgemini-3-pro-image-previewに解決されます。image_sizeは Gemini 3 画像モデルでのみ有効です。nanobananaは--sizeを拒否します。512解像度はnanobanana-2でのみ有効です。- プロセス環境変数は
.envをオーバーライドします。CLI フラグは両方をオーバーライドします。 - シークレットを出力しないでください。
generateは画像編集または複数参照生成用に反復する--input-imageパスを受け入れます。--base-urlは/models/...に直接ではなく、https://generativelanguage.googleapis.com/v1betaのような Gemini API ルートを指す必要があります。--auth-mode autoは公式 Google エンドポイント用にx-goog-api-keyを使用し、カスタムエンドポイント用にAuthorization: Bearerとx-goog-api-keyの両方を送信してゲートウェイ互換性を最大化します。
リソース
- スクリプト:
scripts/nanobanana.py - 設定リファレンス:
references/config.md - モデルと API リファレンス:
references/models-and-api.md
ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ
詳細情報
- 作者
- gargantuax
- ライセンス
- MIT
- 最終更新
- 不明
Source: https://github.com/gargantuax/openskills / ライセンス: MIT
関連スキル
agent-browser
AI エージェント向けのブラウザ自動化 CLI です。ウェブサイトとの対話が必要な場合に使用します。ページ遷移、フォーム入力、ボタンクリック、スクリーンショット取得、データ抽出、ウェブアプリのテスト、ブラウザ操作の自動化など、あらゆるブラウザタスクに対応できます。「ウェブサイトを開く」「フォームに記入する」「ボタンをクリックする」「スクリーンショットを取得する」「ページからデータを抽出する」「このウェブアプリをテストする」「サイトにログインする」「ブラウザ操作を自動化する」といった要求や、プログラマティックなウェブ操作が必要なタスクで起動します。
anyskill
AnySkill — あなたのプライベート・スキルクラウド。GitHubを基盤としたリポジトリからエージェントスキルを管理、同期、動的にロードできます。自然言語でクラウドスキルを検索し、オンデマンドでプロンプトを自動ロード、カスタムスキルのアップロードと共有、スキルバンドルの一括インストールが可能です。OpenClaw、Antigravity、Claude Code、Cursorに対応しています。
engram
AIエージェント向けの永続的なメモリシステムです。バグ修正、意思決定、発見、設定変更の後はmem_saveを使用してください。ユーザーが「覚えている」「記憶している」と言及した場合、または以前のセッションと重複する作業を開始する際はmem_searchを使用します。セッション終了前にmem_session_summaryを使用して、コンテキストを保持してください。
skyvern
AI駆動のブラウザ自動化により、任意のウェブサイトを自動化できます。フォーム入力、データ抽出、ファイルダウンロード、ログイン、複数ステップのワークフロー実行など、ユーザーがウェブサイトと連携する必要があるときに使用します。Skyvernは、LLMとコンピュータビジョンを活用して、未知のサイトも自動操作可能です。Python SDK、TypeScript SDK、REST API、MCPサーバー、またはCLIを通じて統合できます。
pinchbench
PinchBenchベンチマークを実行して、OpenClawエージェントの実世界タスクにおけるパフォーマンスを評価できます。モデルの機能テスト、モデル間の比較、ベンチマーク結果のリーダーボード提出、またはOpenClawのセットアップがカレンダー、メール、リサーチ、コーディング、複数ステップのワークフローにどの程度対応しているかを確認する際に使用します。
openui
OpenUIとOpenUI Langを使用してジェネレーティブUIアプリを構築できます。これらはLLM生成インターフェースのためのトークン効率的なオープン標準です。OpenUI、@openuidev、ジェネレーティブUI、LLMからのストリーミングUI、AI向けコンポーネントライブラリ、またはjson-render/A2UIの置き換えについて述べる際に使用します。スキャフォルディング、defineComponent、システムプロンプト、Renderer、およびOpenUI Lang出力のデバッグに対応しています。