imagen
Google GeminiAIの画像生成機能を使って画像を作成するスキルです。UIモックアップ・アイコン・イラスト・図解・コンセプトアート・プレースホルダー画像など、あらゆる目的で画像を生成・作成したい場合に使用します。
description の原文を見る
| Generate images using Google Gemini's image generation capabilities. Use this skill when the user needs to create, generate, or produce images for any purpose including UI mockups, icons, illustrations, diagrams, concept art, placeholder images, or visual representations.
SKILL.md 本文
Imagen - AI 画像生成スキル
概要
このスキルは Google Gemini の画像生成モデル (gemini-3-pro-image-preview) を使用して画像を生成します。Claude Code セッション中に、フロントエンド UI の構築、ドキュメント作成、コンセプトの視覚化など、あらゆるシーンで画像生成をシームレスに実現できます。
クロスプラットフォーム対応: Windows、macOS、Linux で動作します。
このスキルを使用するタイミング
以下の場合に自動的にこのスキルを使用してください:
- ユーザーが画像生成を要求した場合 (例: 「〇〇の画像を生成して」、「画像を作成して」)
- フロントエンド開発でプレースホルダーまたは実際の画像が必要な場合
- ドキュメントにイラストやダイアグラムが必要な場合
- コンセプト、アーキテクチャ、アイデアを視覚化する必要がある場合
- アイコン、ロゴ、UI アセットを作成する場合
- AI で生成した画像が有用なあらゆるタスク
動作方法
- 目的の画像を説明するテキストプロンプトを受け取ります
- 画像生成設定で Google Gemini API を呼び出します
- 生成された画像を指定された場所に保存します (デフォルトはカレントディレクトリ)
- プロジェクトで使用するためのファイルパスを返します
使用方法
Python (クロスプラットフォーム - 推奨)
# 基本的な使用方法
python scripts/generate_image.py "A futuristic city skyline at sunset"
# カスタム出力パスを指定
python scripts/generate_image.py "A minimalist app icon for a music player" "./assets/icons/music-icon.png"
# カスタムサイズを指定
python scripts/generate_image.py --size 2K "High resolution landscape" "./wallpaper.png"
必要な環境
GEMINI_API_KEY環境変数が設定されていること- Python 3.6 以上 (標準ライブラリのみを使用、pip install は不要)
出力
生成された画像は PNG ファイルとして保存されます。スクリプトは以下を返します:
- 成功時: 生成された画像へのパス
- 失敗時: 詳細情報を含むエラーメッセージ
使用例
フロントエンド開発
ユーザー: 「ランディングページ用のヒーロー画像が必要です。テック関連で抽象的なデザインで」
-> 画像を生成して保存し、HTML/CSS で使用するためのパスを提供
ドキュメント作成
ユーザー: 「マイクロサービスアーキテクチャを示すダイアグラムを作成して」
-> 視覚的な表現を生成し、README またはドキュメントで使用可能にする
UI アセット
ユーザー: 「ユーザープロフィールコンポーネント用のプレースホルダーアバター画像を生成して」
-> コンポーネント使用に適したサイズで画像を作成
ライセンス: Apache-2.0(寛容ライセンスのため全文を引用しています) · 原本リポジトリ
詳細情報
- 作者
- sanjay3290
- リポジトリ
- sanjay3290/ai-skills
- ライセンス
- Apache-2.0
- 最終更新
- 不明
Source: https://github.com/sanjay3290/ai-skills / ライセンス: Apache-2.0
関連スキル
agent-browser
AI エージェント向けのブラウザ自動化 CLI です。ウェブサイトとの対話が必要な場合に使用します。ページ遷移、フォーム入力、ボタンクリック、スクリーンショット取得、データ抽出、ウェブアプリのテスト、ブラウザ操作の自動化など、あらゆるブラウザタスクに対応できます。「ウェブサイトを開く」「フォームに記入する」「ボタンをクリックする」「スクリーンショットを取得する」「ページからデータを抽出する」「このウェブアプリをテストする」「サイトにログインする」「ブラウザ操作を自動化する」といった要求や、プログラマティックなウェブ操作が必要なタスクで起動します。
anyskill
AnySkill — あなたのプライベート・スキルクラウド。GitHubを基盤としたリポジトリからエージェントスキルを管理、同期、動的にロードできます。自然言語でクラウドスキルを検索し、オンデマンドでプロンプトを自動ロード、カスタムスキルのアップロードと共有、スキルバンドルの一括インストールが可能です。OpenClaw、Antigravity、Claude Code、Cursorに対応しています。
engram
AIエージェント向けの永続的なメモリシステムです。バグ修正、意思決定、発見、設定変更の後はmem_saveを使用してください。ユーザーが「覚えている」「記憶している」と言及した場合、または以前のセッションと重複する作業を開始する際はmem_searchを使用します。セッション終了前にmem_session_summaryを使用して、コンテキストを保持してください。
skyvern
AI駆動のブラウザ自動化により、任意のウェブサイトを自動化できます。フォーム入力、データ抽出、ファイルダウンロード、ログイン、複数ステップのワークフロー実行など、ユーザーがウェブサイトと連携する必要があるときに使用します。Skyvernは、LLMとコンピュータビジョンを活用して、未知のサイトも自動操作可能です。Python SDK、TypeScript SDK、REST API、MCPサーバー、またはCLIを通じて統合できます。
pinchbench
PinchBenchベンチマークを実行して、OpenClawエージェントの実世界タスクにおけるパフォーマンスを評価できます。モデルの機能テスト、モデル間の比較、ベンチマーク結果のリーダーボード提出、またはOpenClawのセットアップがカレンダー、メール、リサーチ、コーディング、複数ステップのワークフローにどの程度対応しているかを確認する際に使用します。
openui
OpenUIとOpenUI Langを使用してジェネレーティブUIアプリを構築できます。これらはLLM生成インターフェースのためのトークン効率的なオープン標準です。OpenUI、@openuidev、ジェネレーティブUI、LLMからのストリーミングUI、AI向けコンポーネントライブラリ、またはjson-render/A2UIの置き換えについて述べる際に使用します。スキャフォルディング、defineComponent、システムプロンプト、Renderer、およびOpenUI Lang出力のデバッグに対応しています。