Agent Skills by ALSEL
Anthropic ClaudeLLM・AI開発⭐ リポ 0品質スコア 50/100

nano-banana-pro

GoogleのNano Banana Pro(Gemini 3 Pro Image)APIを使用して画像の生成・編集を行います。ユーザーが画像の生成・作成・編集・変更・加工を求めた場合や、既存の画像ファイルを参照して「背景を変えて」「XをYに置き換えて」などの修正を依頼した場合にこのスキルを使用します。テキストからの画像生成と画像から画像への編集の両方に対応し、解像度は1K(デフォルト)・2K・4Kから選択可能です。

description の原文を見る

Generate and edit images using Google's Nano Banana Pro (Gemini 3 Pro Image) API. Use when the user asks to generate, create, edit, modify, change, alter, or update images. Also use when user references an existing image file and asks to modify it in any way (e.g., "modify this image", "change the background", "replace X with Y"). Supports both text-to-image generation and image-to-image editing with configurable resolution (1K default, 2K, or 4K for high resolution). DO NOT read the image file first - use this skill directly with the --input-image parameter.

SKILL.md 本文

Nano Banana Pro 画像生成・編集

Google の Nano Banana Pro API (Gemini 3 Pro Image) を使用して、新しい画像を生成または既存の画像を編集します。

使用方法

絶対パスを使用してスクリプトを実行してください(スキルディレクトリに cd しないでください):

新しい画像を生成:

uv run ~/.claude/skills/nano-banana-pro/scripts/generate_image.py --prompt "画像の説明" --filename "出力名.png" [--resolution 1K|2K|4K] [--api-key キー]

既存の画像を編集:

uv run ~/.claude/skills/nano-banana-pro/scripts/generate_image.py --prompt "編集指示" --filename "出力名.png" --input-image "入力ファイルへのパス.png" [--resolution 1K|2K|4K] [--api-key キー]

重要: ユーザーが作業しているディレクトリから実行してください。画像はスキルディレクトリではなく、ユーザーが作業している場所に保存されます。

解像度オプション

Gemini 3 Pro Image API は 3 つの解像度をサポートしています(大文字の K が必須):

  • 1K (デフォルト) - 約 1024px 解像度
  • 2K - 約 2048px 解像度
  • 4K - 約 4096px 解像度

ユーザーのリクエストを API パラメータにマップします:

  • 解像度についての言及がない → 1K
  • 「低解像度」、「1080」、「1080p」、「1K」 → 1K
  • 「2K」、「2048」、「通常」、「中程度の解像度」 → 2K
  • 「高解像度」、「高 res」、「高 res」、「4K」、「ウルトラ」 → 4K

API キー

スクリプトは以下の順序で API キーを確認します:

  1. --api-key 引数(ユーザーがチャットでキーを提供した場合)
  2. GEMINI_API_KEY 環境変数

どちらも利用できない場合、スクリプトはエラーメッセージで終了します。

ファイル名生成

ファイル名は yyyy-mm-dd-hh-mm-ss-name.png のパターンで生成します。

形式: {タイムスタンプ}-{説明的名前}.png

  • タイムスタンプ: 現在の日時を yyyy-mm-dd-hh-mm-ss 形式で(24 時間形式)
  • 名前: ハイフンで区切られた小文字の説明的テキスト
  • 説明部分は簡潔に(通常 1~5 語)
  • ユーザーのプロンプトまたは会話のコンテキストを使用
  • 不明な場合は、ランダムな識別子を使用(例:x9k2a7b3

例:

  • プロンプト「A serene Japanese garden」→ 2025-11-23-14-23-05-japanese-garden.png
  • プロンプト「sunset over mountains」→ 2025-11-23-15-30-12-sunset-mountains.png
  • プロンプト「create an image of a robot」→ 2025-11-23-16-45-33-robot.png
  • コンテキストが不明 → 2025-11-23-17-12-48-x9k2.png

画像編集

ユーザーが既存の画像を修正したい場合:

  1. 画像パスを提供しているか、現在のディレクトリ内の画像を参照しているかを確認します
  2. 画像へのパスで --input-image パラメータを使用します
  3. プロンプトには編集指示が含まれるべきです(例:「空をより劇的に」、「人物を削除」、「漫画スタイルに変更」)
  4. 一般的な編集タスク: 要素の追加・削除、スタイル変更、色調整、背景のぼかし、など

プロンプト処理

生成の場合: ユーザーの画像説明を --prompt にそのまま渡します。明らかに不十分な場合のみ修正します。

編集の場合: --prompt に編集指示を渡します(例:「空に虹を追加」、「水彩画のように見せる」)

両方の場合でユーザーのクリエイティブな意図を保持します。

出力

  • PNG を現在のディレクトリに保存します(ファイル名にディレクトリが含まれている場合は指定されたパス)
  • スクリプトは生成された画像への完全パスを出力します
  • 画像を読み込み直さないでください - 保存されたパスをユーザーに伝えるだけです

新しい画像を生成:

uv run ~/.claude/skills/nano-banana-pro/scripts/generate_image.py --prompt "A serene Japanese garden with cherry blossoms" --filename "2025-11-23-14-23-05-japanese-garden.png" --resolution 4K

既存の画像を編集:

uv run ~/.claude/skills/nano-banana-pro/scripts/generate_image.py --prompt "make the sky more dramatic with storm clouds" --filename "2025-11-23-14-25-30-dramatic-sky.png" --input-image "original-photo.jpg" --resolution 2K

ライセンス: CC0-1.0(寛容ライセンスのため全文を引用しています) · 原本リポジトリ

詳細情報

作者
intellectronica
リポジトリ
intellectronica/agent-skills
ライセンス
CC0-1.0
最終更新
不明

Source: https://github.com/intellectronica/agent-skills / ライセンス: CC0-1.0

関連スキル

OpenAILLM・AI開発⭐ リポ 6,054

agent-browser

AI エージェント向けのブラウザ自動化 CLI です。ウェブサイトとの対話が必要な場合に使用します。ページ遷移、フォーム入力、ボタンクリック、スクリーンショット取得、データ抽出、ウェブアプリのテスト、ブラウザ操作の自動化など、あらゆるブラウザタスクに対応できます。「ウェブサイトを開く」「フォームに記入する」「ボタンをクリックする」「スクリーンショットを取得する」「ページからデータを抽出する」「このウェブアプリをテストする」「サイトにログインする」「ブラウザ操作を自動化する」といった要求や、プログラマティックなウェブ操作が必要なタスクで起動します。

by JimmyLv
汎用LLM・AI開発⭐ リポ 1,982

anyskill

AnySkill — あなたのプライベート・スキルクラウド。GitHubを基盤としたリポジトリからエージェントスキルを管理、同期、動的にロードできます。自然言語でクラウドスキルを検索し、オンデマンドでプロンプトを自動ロード、カスタムスキルのアップロードと共有、スキルバンドルの一括インストールが可能です。OpenClaw、Antigravity、Claude Code、Cursorに対応しています。

by LeoYeAI
汎用LLM・AI開発⭐ リポ 1,982

engram

AIエージェント向けの永続的なメモリシステムです。バグ修正、意思決定、発見、設定変更の後はmem_saveを使用してください。ユーザーが「覚えている」「記憶している」と言及した場合、または以前のセッションと重複する作業を開始する際はmem_searchを使用します。セッション終了前にmem_session_summaryを使用して、コンテキストを保持してください。

by LeoYeAI
汎用LLM・AI開発⭐ リポ 21,584

skyvern

AI駆動のブラウザ自動化により、任意のウェブサイトを自動化できます。フォーム入力、データ抽出、ファイルダウンロード、ログイン、複数ステップのワークフロー実行など、ユーザーがウェブサイトと連携する必要があるときに使用します。Skyvernは、LLMとコンピュータビジョンを活用して、未知のサイトも自動操作可能です。Python SDK、TypeScript SDK、REST API、MCPサーバー、またはCLIを通じて統合できます。

by Skyvern-AI
汎用LLM・AI開発⭐ リポ 1,149

pinchbench

PinchBenchベンチマークを実行して、OpenClawエージェントの実世界タスクにおけるパフォーマンスを評価できます。モデルの機能テスト、モデル間の比較、ベンチマーク結果のリーダーボード提出、またはOpenClawのセットアップがカレンダー、メール、リサーチ、コーディング、複数ステップのワークフローにどの程度対応しているかを確認する際に使用します。

by pinchbench
汎用LLM・AI開発⭐ リポ 4,693

openui

OpenUIとOpenUI Langを使用してジェネレーティブUIアプリを構築できます。これらはLLM生成インターフェースのためのトークン効率的なオープン標準です。OpenUI、@openuidev、ジェネレーティブUI、LLMからのストリーミングUI、AI向けコンポーネントライブラリ、またはjson-render/A2UIの置き換えについて述べる際に使用します。スキャフォルディング、defineComponent、システムプロンプト、Renderer、およびOpenUI Lang出力のデバッグに対応しています。

by thesysdev
本サイトは GitHub 上で公開されているオープンソースの SKILL.md ファイルをクロール・インデックス化したものです。 各スキルの著作権は原作者に帰属します。掲載に問題がある場合は info@alsel.co.jp または /takedown フォームよりご連絡ください。
原作者: intellectronica · intellectronica/agent-skills · ライセンス: CC0-1.0