Agent Skills by ALSEL
Anthropic ClaudeLLM・AI開発⭐ リポ 0品質スコア 50/100

nanobanana

Google Gemini 3 Pro Image(Nano Banana Pro)を使用して画像の生成・編集を行うスキルです。テキストから画像生成、既存画像の編集、各種アスペクト比、2K/4Kの高解像度出力に対応しており、AI画像生成やGeminiを使った画像作成をしたい場合に活用できます。

description の原文を見る

Generate and edit images using Google Gemini 3 Pro Image (Nano Banana Pro). Supports text-to-image, image editing, various aspect ratios, and high-resolution output (2K/4K). Use when user wants to generate images, create images, use Gemini image generation, or do AI image generation.

SKILL.md 本文

Nano Banana - AI Image Generation

Google の Gemini 3 Pro Image モデル (gemini-3-pro-image-preview、別名「Nano Banana Pro」🍌) を使用して画像を生成・編集します。

前提条件

必須:

  • GEMINI_API_KEY - Google AI Studio から取得
  • Python 3.10 以上と google-genai パッケージ

依存関係のインストール:

pip install google-genai pillow

クイックスタート

画像を生成:

python3 <skill_dir>/scripts/generate.py "a cute robot mascot, pixel art style" -o robot.png

既存の画像を編集:

python3 <skill_dir>/scripts/generate.py "make the background blue" -i input.jpg -o output.png

特定のアスペクト比で生成:

python3 <skill_dir>/scripts/generate.py "cinematic landscape" --ratio 21:9 -o landscape.png

高解像度 4K 画像を生成:

python3 <skill_dir>/scripts/generate.py "professional product photo" --size 4K -o product.png

スクリプト リファレンス

scripts/generate.py

メイン画像生成スクリプト。

Usage: generate.py [OPTIONS] PROMPT

Arguments:
  PROMPT              Text prompt for image generation

Options:
  -o, --output PATH   Output file path (default: auto-generated)
  -i, --input PATH    Input image for editing (optional)
  -r, --ratio RATIO   Aspect ratio (1:1, 16:9, 9:16, 21:9, etc.)
  -s, --size SIZE     Image size: 2K or 4K (default: standard)
  --search            Enable Google Search grounding for accuracy
  -v, --verbose       Show detailed output

サポートされているアスペクト比:

  • 1:1 - スクエア (デフォルト)
  • 2:3, 3:2 - ポートレート/ランドスケープ
  • 3:4, 4:3 - 標準
  • 4:5, 5:4 - 写真
  • 9:16, 16:9 - ワイドスクリーン
  • 21:9 - ウルトラワイド/シネマティック

scripts/batch_generate.py

連続した名前の複数の画像を生成します。

Usage: batch_generate.py [OPTIONS] PROMPT

Arguments:
  PROMPT              Text prompt for image generation

Options:
  -n, --count N       Number of images to generate (default: 10)
  -d, --dir PATH      Output directory
  -p, --prefix STR    Filename prefix (default: "image")
  -r, --ratio RATIO   Aspect ratio
  -s, --size SIZE     Image size (2K/4K)
  --delay SECONDS     Delay between generations (default: 3)

例:

python3 <skill_dir>/scripts/batch_generate.py "pixel art logo" -n 20 -d ./logos -p logo

Python API

モジュールを直接使用することもできます:

from generate import generate_image, edit_image

# 画像を生成
result = generate_image(
    prompt="a futuristic city at night",
    output_path="city.png",
    aspect_ratio="16:9",
    image_size="4K"
)

# 既存の画像を編集
result = edit_image(
    prompt="add flying cars to the sky",
    input_path="city.png",
    output_path="city_edited.png"
)

環境変数

変数説明デフォルト
GEMINI_API_KEYGoogle Gemini API キー必須
IMAGE_OUTPUT_DIRデフォルト出力ディレクトリ./nanobanana-images

機能

テキストから画像への生成

テキスト説明から画像を作成します。モデルは以下に優れています:

  • 写真的リアリズム
  • 芸術的スタイル (ピクセルアート、イラストなど)
  • 商品写真
  • 風景とシーン

画像編集

自然言語で既存の画像を変形:

  • スタイル転送
  • オブジェクトの追加/削除
  • 背景変更
  • 色調整

高解像度出力

  • 標準: 高速生成、良好な品質
  • 2K: 強化されたディテール (2048px)
  • 4K: 最高品質 (3840px)、テキストレンダリングに最適

Google Search グラウンディング

以下を含む事実的に正確な画像には --search を有効にします:

  • 実在する人物、場所、ランドマーク
  • 現在のイベント
  • 特定の製品またはブランド

ベストプラクティス

プロンプト作成

良いプロンプトには以下が含まれます:

  • 対象の説明
  • スタイル/美的
  • ライティングと雰囲気
  • 構図の詳細
  • カラーパレット

例:

"A cozy coffee shop interior, warm lighting, vintage aesthetic, 
wooden furniture, plants on shelves, morning sunlight through windows, 
soft focus background, 35mm film photography style"

バッチ生成のヒント

  1. 10~20 のバリエーションを生成してオプションを探索
  2. スタイルの一貫性のために一貫したプロンプトを使用
  3. レート制限を回避するために 3~5 秒の遅延を追加
  4. 結果を確認し、最良の候補に対して反復

レート制限

  • Gemini API には使用量クォータがあります
  • バッチ生成間に遅延を追加
  • Google AI Studio でクォータを確認

トラブルシューティング

"API key not found"

  • GEMINI_API_KEY 環境変数を設定
  • または --api-key オプション経由で渡す

"No image in response"

  • プロンプトがセーフティフィルターをトリガーした可能性があります
  • センシティブなコンテンツを避けるために言い換えてみてください

"Rate limit exceeded"

  • 数秒待機して再試行
  • バッチサイズを削減または遅延を長くする

リファレンス

  • references/prompts.md - カテゴリ別プロンプト例
  • examples/ - 使用例スクリプト

ライセンス: Apache-2.0(寛容ライセンスのため全文を引用しています) · 原本リポジトリ

詳細情報

作者
resciencelab
リポジトリ
resciencelab/opc-skills
ライセンス
Apache-2.0
最終更新
不明

Source: https://github.com/resciencelab/opc-skills / ライセンス: Apache-2.0

関連スキル

OpenAILLM・AI開発⭐ リポ 6,054

agent-browser

AI エージェント向けのブラウザ自動化 CLI です。ウェブサイトとの対話が必要な場合に使用します。ページ遷移、フォーム入力、ボタンクリック、スクリーンショット取得、データ抽出、ウェブアプリのテスト、ブラウザ操作の自動化など、あらゆるブラウザタスクに対応できます。「ウェブサイトを開く」「フォームに記入する」「ボタンをクリックする」「スクリーンショットを取得する」「ページからデータを抽出する」「このウェブアプリをテストする」「サイトにログインする」「ブラウザ操作を自動化する」といった要求や、プログラマティックなウェブ操作が必要なタスクで起動します。

by JimmyLv
汎用LLM・AI開発⭐ リポ 1,982

anyskill

AnySkill — あなたのプライベート・スキルクラウド。GitHubを基盤としたリポジトリからエージェントスキルを管理、同期、動的にロードできます。自然言語でクラウドスキルを検索し、オンデマンドでプロンプトを自動ロード、カスタムスキルのアップロードと共有、スキルバンドルの一括インストールが可能です。OpenClaw、Antigravity、Claude Code、Cursorに対応しています。

by LeoYeAI
汎用LLM・AI開発⭐ リポ 1,982

engram

AIエージェント向けの永続的なメモリシステムです。バグ修正、意思決定、発見、設定変更の後はmem_saveを使用してください。ユーザーが「覚えている」「記憶している」と言及した場合、または以前のセッションと重複する作業を開始する際はmem_searchを使用します。セッション終了前にmem_session_summaryを使用して、コンテキストを保持してください。

by LeoYeAI
汎用LLM・AI開発⭐ リポ 21,584

skyvern

AI駆動のブラウザ自動化により、任意のウェブサイトを自動化できます。フォーム入力、データ抽出、ファイルダウンロード、ログイン、複数ステップのワークフロー実行など、ユーザーがウェブサイトと連携する必要があるときに使用します。Skyvernは、LLMとコンピュータビジョンを活用して、未知のサイトも自動操作可能です。Python SDK、TypeScript SDK、REST API、MCPサーバー、またはCLIを通じて統合できます。

by Skyvern-AI
汎用LLM・AI開発⭐ リポ 1,149

pinchbench

PinchBenchベンチマークを実行して、OpenClawエージェントの実世界タスクにおけるパフォーマンスを評価できます。モデルの機能テスト、モデル間の比較、ベンチマーク結果のリーダーボード提出、またはOpenClawのセットアップがカレンダー、メール、リサーチ、コーディング、複数ステップのワークフローにどの程度対応しているかを確認する際に使用します。

by pinchbench
汎用LLM・AI開発⭐ リポ 4,693

openui

OpenUIとOpenUI Langを使用してジェネレーティブUIアプリを構築できます。これらはLLM生成インターフェースのためのトークン効率的なオープン標準です。OpenUI、@openuidev、ジェネレーティブUI、LLMからのストリーミングUI、AI向けコンポーネントライブラリ、またはjson-render/A2UIの置き換えについて述べる際に使用します。スキャフォルディング、defineComponent、システムプロンプト、Renderer、およびOpenUI Lang出力のデバッグに対応しています。

by thesysdev
本サイトは GitHub 上で公開されているオープンソースの SKILL.md ファイルをクロール・インデックス化したものです。 各スキルの著作権は原作者に帰属します。掲載に問題がある場合は info@alsel.co.jp または /takedown フォームよりご連絡ください。
原作者: resciencelab · resciencelab/opc-skills · ライセンス: Apache-2.0