Agent Skills by ALSEL
Anthropic Claudeデザイン・クリエイティブ⭐ リポ 299品質スコア 94/100

nano-banana

Nano Banana PRO(Gemini 3 Pro Image)およびNano Banana(Gemini 2.5 Flash Image)を使用したAI画像生成機能です。以下の場合に活用できます:(1)テキストプロンプトからの画像生成、(2)既存画像の編集、(3)インフォグラフィックス、ロゴ、商品写真、ステッカーなどのプロフェッショナルなビジュアルアセット制作、(4)複数画像での人物キャラクターの一貫性保持、(5)正確なテキスト描画を含む画像生成、(6)AI生成ビジュアルが必要なあらゆるタスク。「画像を生成」「画像を作成」「写真を作る」「ロゴをデザイン」「インフォグラフィックスを作成」「AI画像」「nano banana」またはその他の画像生成リクエストをトリガーとして機能します。

description の原文を見る

AI image generation using Nano Banana PRO (Gemini 3 Pro Image) and Nano Banana (Gemini 2.5 Flash Image). Use this skill when: (1) Generating images from text prompts, (2) Editing existing images, (3) Creating professional visual assets like infographics, logos, product shots, stickers, (4) Working with character consistency across multiple images, (5) Creating images with accurate text rendering, (6) Any task requiring AI-generated visuals. Triggers on: 'generate image', 'create image', 'make a picture', 'design a logo', 'create infographic', 'AI image', 'nano banana', or any image generation request.

SKILL.md 本文

Nano Banana PRO 画像生成

Gemini APIを介してGoogle の Nano Banana モデルを使用し、プロフェッショナルなAI画像を生成します。

前提条件

  • APIキーを GEMINI_API_KEY 環境変数として設定する必要があります
  • すべてのAPI呼び出しに curl を使用(SDKは不要)

モデル選択

モデル識別子最適な用途
Nano Banana PROgemini-3-pro-image-previewプロフェッショナルアセット、テキストレンダリング、インフォグラフィック、4K出力、複雑なマルチターン編集
Nano Bananagemini-2.5-flash-image高速生成、シンプルな編集、低コスト

高品質な作業にはPRO をデフォルトにします。迅速な反復やシンプルなタスクにはFlashを使用してください。

重要:プロンプトエンジニアリング最優先

API呼び出し前に、必ず効果的なプロンプトを作成してください。 包括的なプロンプト作成戦略については、references/prompting-guide.md を参照してください。主要原則:

金の法則

  1. キーワードを列挙するのではなくシーンを説明する - タグの羅列ではなく、物語的な説明を書く
  2. 自然言語を使用する - 正しい文法で完全な文を使う
  3. 具体的にする - 被写体、背景、照明、雰囲気、素材を定義する
  4. 文脈を提供する - 「なぜ」がモデルより良い芸術的決定を下すのに役立つ
  5. 再生成ではなく編集を行う - 80%正しい場合は、特定の変更をリクエストする

ICSフレームワーク(クイックリファレンス)

任意の画像について以下を指定します:

  • Image type(画像タイプ):どんなビジュアルか(写真、インフォグラフィック、ロゴ、ステッカーなど)
  • Content(コンテンツ):含める特定の要素、データ、情報
  • Style(スタイル):ビジュアルスタイル、カラーパレット、アーティスティックアプローチ

APIリファレンス

テキストから画像への生成

curl -s -X POST \
  "https://generativelanguage.googleapis.com/v1beta/models/gemini-3-pro-image-preview:generateContent" \
  -H "x-goog-api-key: $GEMINI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "contents": [{
      "parts": [{"text": "YOUR_PROMPT_HERE"}]
    }],
    "generationConfig": {
      "responseModalities": ["TEXT", "IMAGE"],
      "imageConfig": {
        "aspectRatio": "16:9",
        "imageSize": "2K"
      }
    }
  }'

画像編集(入力画像付き)

curl -s -X POST \
  "https://generativelanguage.googleapis.com/v1beta/models/gemini-3-pro-image-preview:generateContent" \
  -H "x-goog-api-key: $GEMINI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "contents": [{
      "parts": [
        {"text": "YOUR_EDIT_INSTRUCTION"},
        {"inline_data": {"mime_type": "image/png", "data": "BASE64_IMAGE_DATA"}}
      ]
    }],
    "generationConfig": {
      "responseModalities": ["TEXT", "IMAGE"]
    }
  }'

設定オプション

パラメータ注記
aspectRatio1:1, 2:3, 3:2, 3:4, 4:3, 4:5, 5:4, 9:16, 16:9, 21:9ユースケースに合わせる
imageSize1K, 2K, 4K大文字のK を使用;4Kはプロモデルのみ

Googleサーチグラウンディング(リアルタイムデータ)

現在の情報に基づいて画像を生成するために "tools": [{"google_search": {}}] を追加します:

curl -s -X POST \
  "https://generativelanguage.googleapis.com/v1beta/models/gemini-3-pro-image-preview:generateContent" \
  -H "x-goog-api-key: $GEMINI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "contents": [{"parts": [{"text": "Create an infographic of current tech stock prices"}]}],
    "tools": [{"google_search": {}}],
    "generationConfig": {
      "responseModalities": ["TEXT", "IMAGE"],
      "imageConfig": {"aspectRatio": "16:9"}
    }
  }'

ワークフロー

ステップ 1:プロンプトを作成する

ICS フレームワークとプロンプティングガイドを使用します。例:

フォトリアリスティック:

深いしわと温かい笑顔を持つ年配の日本人陶芸家が茶碗を検査するクローズアップ肖像写真。窓からの柔らかい夕方の光。85mm レンズ、浅いピント。静寂に満ちた雰囲気。

インフォグラフィック:

レシピとして光合成を説明するクリーンでモダンなインフォグラフィックを作成してください。「材料」(太陽光、水、CO2)と「完成品」(エネルギー)を表示します。カラフルなキッズ料理本のページのようなスタイル。

製品写真:

磨かれたコンクリートの上にマットブラックの陶製コーヒーマグを配置したハイレゾリューション スタジオ写真。3点ソフトボックス照明、45度角、立ち上る湯気にシャープフォーカス。正方形フォーマット。

ステップ 2:画像を生成する

scripts/generate-image.sh を使用するか、API を直接呼び出します:

./scripts/generate-image.sh "Your prompt here" output.png --ratio 16:9 --size 2K

ステップ 3:レスポンスを処理する

APIは base64 エンコードされた画像データを返します。抽出してデコードします:

# レスポンスに含まれるもの: {"candidates":[{"content":{"parts":[{"inlineData":{"mimeType":"image/png","data":"BASE64..."}}]}}]}
# jq で抽出してデコード:
cat response.json | jq -r '.candidates[0].content.parts[] | select(.inlineData) | .inlineData.data' | base64 -d > image.png

よくあるユースケース

ランディングページと広告

  • ヒーロー画像には 16:9 または 21:9 を使用
  • ブランドカラー、モダン/ミニマルスタイルを指定
  • プロンプトにテキスト要件を含める

ロゴとアイコン

  • 1:1 アスペクト比を使用
  • 「ミニマリスト」「クリーンなライン」「ベクタースタイル」をリクエスト
  • カラースキームを明示的に指定

製品写真

  • 照明設定(ソフトボックス、自然光、スタジオ)を説明
  • 表面/背景素材を記載
  • カメラアングルとレンズタイプを含める

インフォグラフィック

  • 視覚化するデータを定義
  • スタイルを指定(コーポレート、プレイフル、テクニカル)
  • クリアなテキストとラベル付きセクションをリクエスト

ステッカーとイラスト

  • 「太い輪郭」「かわいい」「セルシェーディング」をリクエスト
  • 「白背景」または「透明背景」を指定
  • カラーパレットを定義

キャラクター一貫性(複数画像)

  • PROは最大14の参考画像をサポート
  • 明示的に状態:「Image 1 と全く同じ顔の特徴を保持してください」
  • アイデンティティを保ちながら表情/ポーズの変更を説明

スクリプト

すぐに使用できる生成スクリプトについては、scripts/generate-image.sh を参照してください。

詳細なプロンプティングガイド

以下を含む高度なテクニック:

  • フォトリアリスティックシーンテンプレート
  • テキストレンダリングのベストプラクティス
  • シーケンシャルアートとストーリーボーディング
  • 次元変換(2D↔3D)
  • リアルタイムデータ用のサーチグラウンディング

references/prompting-guide.md を参照してください。

ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ

詳細情報

作者
majiayu000
リポジトリ
majiayu000/claude-skill-registry
ライセンス
MIT
最終更新
2026/5/4

Source: https://github.com/majiayu000/claude-skill-registry / ライセンス: MIT

関連スキル

汎用デザイン・クリエイティブ⭐ リポ 1,739

nano-banana-2

inference.sh CLIを通じてGoogle Gemini 3.1 Flash Image Preview(Nano Banana 2)で画像を生成します。テキストから画像を生成する機能、画像編集、最大14枚の複数画像入力、Google Searchグラウンディング機能に対応しています。トリガーワード:「nano banana 2」「nanobanana 2」「gemini 3.1 flash image」「gemini 3 1 flash image preview」「google image generation」

by openakita
汎用デザイン・クリエイティブ⭐ リポ 815

octocode-slides

洗練されたマルチファイル形式のHTMLプレゼンテーションを生成します。6段階のフロー(概要 → リサーチ → アウトライン → デザイン → 実装 → レビュー)で構成されています。各スライドは独立したHTMLファイルとなり、iframeで読み込まれます。「スライドを作成してほしい」「プレゼンテーションを作ってほしい」「HTMLスライドを生成してほしい」「デックを構築してほしい」といった依頼や、ノート・ドキュメント・コードを洗練されたプレゼンテーションに変換する際に使用できます。

by bgauryy
汎用デザイン・クリエイティブ⭐ リポ 482

gpt-image2-ppt

OpenAIのgpt-image-2を使用して、視覚的に優れたPPTスライドを生成します。Spatial Glass、Tech Blue、Editorial Monoなど10種類のキュレーション済みスタイルに対応し、ユーザーが提供したPPTXファイルを模倣するテンプレートクローンモードも搭載しています。HTMLビューアと16:9形式のPPTXファイルを出力します。プレゼンテーション、スライド、ピッチデック、投資家向けPPT、雑誌風PPTの作成依頼などで活用してください。

by JuneYaooo
Anthropic Claudeデザイン・クリエイティブ⭐ リポ 299

oiloil-ui-ux-guide

モダンでクリーンなUI/UXガイダンス・レビュースキルです。新機能や既存システム(Webアプリ)に対して、実行可能なUI/UX改善提案、デザイン原則、デザインレビューチェックリストが必要な場合に活用できます。CRAP(コントラスト・反復・配置・近接)をベースに、タスクファーストなUX、情報設計、フィードバック・システムステータス、一貫性、affordances、エラー防止・復旧、認知負荷を重視します。モダンミニマルスタイル(クリーン・余白・タイポグラフィ主導)を強制し、不要なテキストを削減、アイコンとしての絵文字を禁止し、統一されたアイコンセットから直感的で洗練されたアイコンを推奨します。

by majiayu000
Anthropic Claudeデザイン・クリエイティブ⭐ リポ 299

axiom-hig-ref

Apple Human Interface Guidelines リファレンス — 色(セマンティックカラー、カスタムカラー、パターン)、背景(マテリアル階層、ダイナミック背景)、タイポグラフィ(標準スタイル、カスタムフォント、Dynamic Type)、SF Symbols(レンダリングモード、色、多言語対応)、ダークモード、アクセシビリティ、プラットフォーム固有の考慮事項を網羅したガイドラインです。

by majiayu000
汎用デザイン・クリエイティブ⭐ リポ 266

comfyui-skill-openclaw

任意のAIエージェント(Claude Code、OpenClaw、Codex、Hermes)からComfyUIワークフローを単一のCLIで実行できます。 ワークフローのインポート、依存関係の管理、複数サーバーでの実行、履歴追跡のすべてをシェルコマンドで操作できます。 **このSkillを使用する場面:** (1) ユーザーが「画像を生成してほしい」「絵を描いてほしい」「ComfyUIワークフローを実行したい」とリクエストした場合 (2) ユーザーが画像生成に対して特定のスタイル、キャラクター、シーン要件を指定している場合 (3) ユーザーが保存済みのComfyUIワークフローをインポート、登録、同期、または設定して後で再利用したいと依頼した場合

by HuangYuChuh
本サイトは GitHub 上で公開されているオープンソースの SKILL.md ファイルをクロール・インデックス化したものです。 各スキルの著作権は原作者に帰属します。掲載に問題がある場合は info@alsel.co.jp または /takedown フォームよりご連絡ください。
原作者: majiayu000 · majiayu000/claude-skill-registry · ライセンス: MIT