nanobanana
Google Gemini 3 Pro Image(Nano Banana Pro)を使用して画像の生成・編集を行うスキルです。テキストから画像生成、既存画像の編集、各種アスペクト比、2K/4Kの高解像度出力に対応しており、AI画像生成やGeminiを使った画像作成をしたい場合に活用できます。
description の原文を見る
Generate and edit images using Google Gemini 3 Pro Image (Nano Banana Pro). Supports text-to-image, image editing, various aspect ratios, and high-resolution output (2K/4K). Use when user wants to generate images, create images, use Gemini image generation, or do AI image generation.
SKILL.md 本文
Nano Banana - AI Image Generation
Google の Gemini 3 Pro Image モデル (gemini-3-pro-image-preview、別名「Nano Banana Pro」🍌) を使用して画像を生成・編集します。
前提条件
必須:
GEMINI_API_KEY- Google AI Studio から取得- Python 3.10 以上と
google-genaiパッケージ
依存関係のインストール:
pip install google-genai pillow
クイックスタート
画像を生成:
python3 <skill_dir>/scripts/generate.py "a cute robot mascot, pixel art style" -o robot.png
既存の画像を編集:
python3 <skill_dir>/scripts/generate.py "make the background blue" -i input.jpg -o output.png
特定のアスペクト比で生成:
python3 <skill_dir>/scripts/generate.py "cinematic landscape" --ratio 21:9 -o landscape.png
高解像度 4K 画像を生成:
python3 <skill_dir>/scripts/generate.py "professional product photo" --size 4K -o product.png
スクリプト リファレンス
scripts/generate.py
メイン画像生成スクリプト。
Usage: generate.py [OPTIONS] PROMPT
Arguments:
PROMPT Text prompt for image generation
Options:
-o, --output PATH Output file path (default: auto-generated)
-i, --input PATH Input image for editing (optional)
-r, --ratio RATIO Aspect ratio (1:1, 16:9, 9:16, 21:9, etc.)
-s, --size SIZE Image size: 2K or 4K (default: standard)
--search Enable Google Search grounding for accuracy
-v, --verbose Show detailed output
サポートされているアスペクト比:
1:1- スクエア (デフォルト)2:3,3:2- ポートレート/ランドスケープ3:4,4:3- 標準4:5,5:4- 写真9:16,16:9- ワイドスクリーン21:9- ウルトラワイド/シネマティック
scripts/batch_generate.py
連続した名前の複数の画像を生成します。
Usage: batch_generate.py [OPTIONS] PROMPT
Arguments:
PROMPT Text prompt for image generation
Options:
-n, --count N Number of images to generate (default: 10)
-d, --dir PATH Output directory
-p, --prefix STR Filename prefix (default: "image")
-r, --ratio RATIO Aspect ratio
-s, --size SIZE Image size (2K/4K)
--delay SECONDS Delay between generations (default: 3)
例:
python3 <skill_dir>/scripts/batch_generate.py "pixel art logo" -n 20 -d ./logos -p logo
Python API
モジュールを直接使用することもできます:
from generate import generate_image, edit_image
# 画像を生成
result = generate_image(
prompt="a futuristic city at night",
output_path="city.png",
aspect_ratio="16:9",
image_size="4K"
)
# 既存の画像を編集
result = edit_image(
prompt="add flying cars to the sky",
input_path="city.png",
output_path="city_edited.png"
)
環境変数
| 変数 | 説明 | デフォルト |
|---|---|---|
GEMINI_API_KEY | Google Gemini API キー | 必須 |
IMAGE_OUTPUT_DIR | デフォルト出力ディレクトリ | ./nanobanana-images |
機能
テキストから画像への生成
テキスト説明から画像を作成します。モデルは以下に優れています:
- 写真的リアリズム
- 芸術的スタイル (ピクセルアート、イラストなど)
- 商品写真
- 風景とシーン
画像編集
自然言語で既存の画像を変形:
- スタイル転送
- オブジェクトの追加/削除
- 背景変更
- 色調整
高解像度出力
- 標準: 高速生成、良好な品質
- 2K: 強化されたディテール (2048px)
- 4K: 最高品質 (3840px)、テキストレンダリングに最適
Google Search グラウンディング
以下を含む事実的に正確な画像には --search を有効にします:
- 実在する人物、場所、ランドマーク
- 現在のイベント
- 特定の製品またはブランド
ベストプラクティス
プロンプト作成
良いプロンプトには以下が含まれます:
- 対象の説明
- スタイル/美的
- ライティングと雰囲気
- 構図の詳細
- カラーパレット
例:
"A cozy coffee shop interior, warm lighting, vintage aesthetic,
wooden furniture, plants on shelves, morning sunlight through windows,
soft focus background, 35mm film photography style"
バッチ生成のヒント
- 10~20 のバリエーションを生成してオプションを探索
- スタイルの一貫性のために一貫したプロンプトを使用
- レート制限を回避するために 3~5 秒の遅延を追加
- 結果を確認し、最良の候補に対して反復
レート制限
- Gemini API には使用量クォータがあります
- バッチ生成間に遅延を追加
- Google AI Studio でクォータを確認
トラブルシューティング
"API key not found"
GEMINI_API_KEY環境変数を設定- または
--api-keyオプション経由で渡す
"No image in response"
- プロンプトがセーフティフィルターをトリガーした可能性があります
- センシティブなコンテンツを避けるために言い換えてみてください
"Rate limit exceeded"
- 数秒待機して再試行
- バッチサイズを削減または遅延を長くする
リファレンス
references/prompts.md- カテゴリ別プロンプト例examples/- 使用例スクリプト
ライセンス: Apache-2.0(寛容ライセンスのため全文を引用しています) · 原本リポジトリ
詳細情報
- 作者
- resciencelab
- ライセンス
- Apache-2.0
- 最終更新
- 不明
Source: https://github.com/resciencelab/opc-skills / ライセンス: Apache-2.0
関連スキル
agent-browser
AI エージェント向けのブラウザ自動化 CLI です。ウェブサイトとの対話が必要な場合に使用します。ページ遷移、フォーム入力、ボタンクリック、スクリーンショット取得、データ抽出、ウェブアプリのテスト、ブラウザ操作の自動化など、あらゆるブラウザタスクに対応できます。「ウェブサイトを開く」「フォームに記入する」「ボタンをクリックする」「スクリーンショットを取得する」「ページからデータを抽出する」「このウェブアプリをテストする」「サイトにログインする」「ブラウザ操作を自動化する」といった要求や、プログラマティックなウェブ操作が必要なタスクで起動します。
anyskill
AnySkill — あなたのプライベート・スキルクラウド。GitHubを基盤としたリポジトリからエージェントスキルを管理、同期、動的にロードできます。自然言語でクラウドスキルを検索し、オンデマンドでプロンプトを自動ロード、カスタムスキルのアップロードと共有、スキルバンドルの一括インストールが可能です。OpenClaw、Antigravity、Claude Code、Cursorに対応しています。
engram
AIエージェント向けの永続的なメモリシステムです。バグ修正、意思決定、発見、設定変更の後はmem_saveを使用してください。ユーザーが「覚えている」「記憶している」と言及した場合、または以前のセッションと重複する作業を開始する際はmem_searchを使用します。セッション終了前にmem_session_summaryを使用して、コンテキストを保持してください。
skyvern
AI駆動のブラウザ自動化により、任意のウェブサイトを自動化できます。フォーム入力、データ抽出、ファイルダウンロード、ログイン、複数ステップのワークフロー実行など、ユーザーがウェブサイトと連携する必要があるときに使用します。Skyvernは、LLMとコンピュータビジョンを活用して、未知のサイトも自動操作可能です。Python SDK、TypeScript SDK、REST API、MCPサーバー、またはCLIを通じて統合できます。
pinchbench
PinchBenchベンチマークを実行して、OpenClawエージェントの実世界タスクにおけるパフォーマンスを評価できます。モデルの機能テスト、モデル間の比較、ベンチマーク結果のリーダーボード提出、またはOpenClawのセットアップがカレンダー、メール、リサーチ、コーディング、複数ステップのワークフローにどの程度対応しているかを確認する際に使用します。
openui
OpenUIとOpenUI Langを使用してジェネレーティブUIアプリを構築できます。これらはLLM生成インターフェースのためのトークン効率的なオープン標準です。OpenUI、@openuidev、ジェネレーティブUI、LLMからのストリーミングUI、AI向けコンポーネントライブラリ、またはjson-render/A2UIの置き換えについて述べる際に使用します。スキャフォルディング、defineComponent、システムプロンプト、Renderer、およびOpenUI Lang出力のデバッグに対応しています。