Agent Skills by ALSEL
Anthropic ClaudeLLM・AI開発⭐ リポ 0品質スコア 50/100

nanobanana

Gemini ネイティブの Nano Banana イメージ生成・編集スキルで、Nano Banana、Nano Banana 2、Nano Banana Pro に対応。テキストから画像生成、画像編集、ローカル参照の繰り返し、バッチ生成、ドライラン検査、セルフホスト型ゲートウェイなどカスタム Gemini 互換ベース URL が必要な場面で活用できます。

description の原文を見る

Gemini-native Nano Banana image generation and editing across Nano Banana, Nano Banana 2, and Nano Banana Pro. Use when you need text-to-image, image-to-image edits, repeated local references, batch generation, dry-run request inspection, or a custom Gemini-compatible base URL such as a self-hosted gateway.

SKILL.md 本文

Nano Banana

Gemini-native Nano Banana 画像生成と編集のための単一の Python エントリーポイント。モデルエイリアス、厳密なオプション検証、バッチ実行、カスタムエンドポイント対応を備えています。

ワークフロー

  1. references/config.md を開いて環境変数とオーバーライド順序を選択します。
  2. references/models-and-api.md を開いて適切な Nano Banana ティアを選択し、モデル固有の制約を確認します。
  3. 最速で低コストのデフォルト (nanobanana) または最高忠度の推論モデル (nanobanana-pro) が必要な場合を除き、gemini-3.1-flash-image-preview (nanobanana-2) を優先します。
  4. 単一リクエストの場合は scripts/nanobanana.py generate を実行し、反復的なバリアントの場合は scripts/nanobanana.py batch を実行します。
  5. ペイロード形状、エンドポイント、またはモデル固有のオプション対応がメインのリスクである場合は、最初に --dry-run を追加します。
  6. カスタム Gemini 互換ゲートウェイが必要な場合は --base-url または GEMINI_BASE_URL を渡します。
  7. デバッグのために生の JSON ボディが必要な場合は、generate--save-response <path> を追加します。

コマンド

単一のテキスト から画像へのリクエスト:

python .\skills\nanobanana\scripts\nanobanana.py generate `
  --prompt "A retro-futurist product hero illustration for a developer tool" `
  --output .\out\hero.png `
  --model nanobanana-2 `
  --ratio 16:9 `
  --size 2K

2 つのローカル参照を使用して既存の画像を編集:

python .\skills\nanobanana\scripts\nanobanana.py generate `
  --prompt "Turn these references into a clean launch poster with legible title text" `
  --input-image .\refs\subject.png `
  --input-image .\refs\background.png `
  --output .\out\poster.png `
  --model nanobanana-pro `
  --ratio 4:5 `
  --size 2K

カスタム Gemini 互換ゲートウェイを使用:

python .\skills\nanobanana\scripts\nanobanana.py generate `
  --prompt "A bold mascot sticker pack" `
  --output .\out\stickers.png `
  --base-url http://your-gateway.example.com/v1beta `
  --auth-mode bearer

5 つのバリアントをバッチ生成:

python .\skills\nanobanana\scripts\nanobanana.py batch `
  --prompt "Minimal app icon for a PDF workflow product" `
  --count 5 `
  --dir .\out\icons `
  --prefix icon `
  --model nanobanana `
  --ratio 1:1

送信せずに最終リクエストを検査:

python .\skills\nanobanana\scripts\nanobanana.py generate `
  --prompt "An editorial illustration of AI agents at work" `
  --model nanobanana-2 `
  --output .\out\agents.png `
  --dry-run

ルール

  • --modelnanobananananobanana-2nanobanana-pro のエイリアスか、正確な Gemini モデル ID を受け入れます。
  • nanobananagemini-2.5-flash-image に、nanobanana-2gemini-3.1-flash-image-preview に、nanobanana-progemini-3-pro-image-preview に解決されます。
  • image_size は Gemini 3 画像モデルでのみ有効です。nanobanana--size を拒否します。
  • 512 解像度は nanobanana-2 でのみ有効です。
  • プロセス環境変数は .env をオーバーライドします。CLI フラグは両方をオーバーライドします。
  • シークレットを出力しないでください。
  • generate は画像編集または複数参照生成用に反復する --input-image パスを受け入れます。
  • --base-url/models/... に直接ではなく、https://generativelanguage.googleapis.com/v1beta のような Gemini API ルートを指す必要があります。
  • --auth-mode auto は公式 Google エンドポイント用に x-goog-api-key を使用し、カスタムエンドポイント用に Authorization: Bearerx-goog-api-key の両方を送信してゲートウェイ互換性を最大化します。

リソース

  • スクリプト: scripts/nanobanana.py
  • 設定リファレンス: references/config.md
  • モデルと API リファレンス: references/models-and-api.md

ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ

詳細情報

作者
gargantuax
リポジトリ
gargantuax/openskills
ライセンス
MIT
最終更新
不明

Source: https://github.com/gargantuax/openskills / ライセンス: MIT

関連スキル

OpenAILLM・AI開発⭐ リポ 6,054

agent-browser

AI エージェント向けのブラウザ自動化 CLI です。ウェブサイトとの対話が必要な場合に使用します。ページ遷移、フォーム入力、ボタンクリック、スクリーンショット取得、データ抽出、ウェブアプリのテスト、ブラウザ操作の自動化など、あらゆるブラウザタスクに対応できます。「ウェブサイトを開く」「フォームに記入する」「ボタンをクリックする」「スクリーンショットを取得する」「ページからデータを抽出する」「このウェブアプリをテストする」「サイトにログインする」「ブラウザ操作を自動化する」といった要求や、プログラマティックなウェブ操作が必要なタスクで起動します。

by JimmyLv
汎用LLM・AI開発⭐ リポ 1,982

anyskill

AnySkill — あなたのプライベート・スキルクラウド。GitHubを基盤としたリポジトリからエージェントスキルを管理、同期、動的にロードできます。自然言語でクラウドスキルを検索し、オンデマンドでプロンプトを自動ロード、カスタムスキルのアップロードと共有、スキルバンドルの一括インストールが可能です。OpenClaw、Antigravity、Claude Code、Cursorに対応しています。

by LeoYeAI
汎用LLM・AI開発⭐ リポ 1,982

engram

AIエージェント向けの永続的なメモリシステムです。バグ修正、意思決定、発見、設定変更の後はmem_saveを使用してください。ユーザーが「覚えている」「記憶している」と言及した場合、または以前のセッションと重複する作業を開始する際はmem_searchを使用します。セッション終了前にmem_session_summaryを使用して、コンテキストを保持してください。

by LeoYeAI
汎用LLM・AI開発⭐ リポ 21,584

skyvern

AI駆動のブラウザ自動化により、任意のウェブサイトを自動化できます。フォーム入力、データ抽出、ファイルダウンロード、ログイン、複数ステップのワークフロー実行など、ユーザーがウェブサイトと連携する必要があるときに使用します。Skyvernは、LLMとコンピュータビジョンを活用して、未知のサイトも自動操作可能です。Python SDK、TypeScript SDK、REST API、MCPサーバー、またはCLIを通じて統合できます。

by Skyvern-AI
汎用LLM・AI開発⭐ リポ 1,149

pinchbench

PinchBenchベンチマークを実行して、OpenClawエージェントの実世界タスクにおけるパフォーマンスを評価できます。モデルの機能テスト、モデル間の比較、ベンチマーク結果のリーダーボード提出、またはOpenClawのセットアップがカレンダー、メール、リサーチ、コーディング、複数ステップのワークフローにどの程度対応しているかを確認する際に使用します。

by pinchbench
汎用LLM・AI開発⭐ リポ 4,693

openui

OpenUIとOpenUI Langを使用してジェネレーティブUIアプリを構築できます。これらはLLM生成インターフェースのためのトークン効率的なオープン標準です。OpenUI、@openuidev、ジェネレーティブUI、LLMからのストリーミングUI、AI向けコンポーネントライブラリ、またはjson-render/A2UIの置き換えについて述べる際に使用します。スキャフォルディング、defineComponent、システムプロンプト、Renderer、およびOpenUI Lang出力のデバッグに対応しています。

by thesysdev
本サイトは GitHub 上で公開されているオープンソースの SKILL.md ファイルをクロール・インデックス化したものです。 各スキルの著作権は原作者に帰属します。掲載に問題がある場合は info@alsel.co.jp または /takedown フォームよりご連絡ください。
原作者: gargantuax · gargantuax/openskills · ライセンス: MIT