Agent Skills by ALSEL
Anthropic ClaudeLLM・AI開発⭐ リポ 0品質スコア 50/100

gpt-image-1-5

OpenAIのGPT Image 1.5モデルを使用して画像の生成・編集を行います。ユーザーが画像の生成・作成・編集・修正・変更を求めたとき、または既存の画像ファイルを参照して「背景を変えて」「XをYに置き換えて」などの加工を依頼したときに使用します。テキストからの画像生成やマスクを使った部分編集に対応しており、画像ファイルを事前に読み込まず、`--input-image`パラメータを使って直接このスキルを呼び出してください。

description の原文を見る

Generate and edit images using OpenAI's GPT Image 1.5 model. Use when the user asks to generate, create, edit, modify, change, alter, or update images. Also use when user references an existing image file and asks to modify it in any way (e.g., "modify this image", "change the background", "replace X with Y"). Supports text-to-image generation and image editing with optional mask. DO NOT read the image file first - use this skill directly with the --input-image parameter.

SKILL.md 本文

GPT Image 1.5 - 画像生成・編集

OpenAI の GPT Image 1.5 モデルを使用して新しい画像を生成したり、既存の画像を編集したりします。

  • 生成: Responses API と image_generation ツールを使用
  • 編集: Image API を使用した信頼性の高いマスクベースのインペインティング

使用方法

スキルディレクトリに cd しないで、絶対パスを使ってスクリプトを実行してください:

新しい画像を生成:

uv run ~/.claude/skills/gpt-image-1-5/scripts/generate_image.py --prompt "画像の説明" --filename "出力名.png" [--quality low|medium|high] [--size 1024x1024|1024x1536|1536x1024|auto] [--background transparent|opaque|auto] [--api-key KEY]

既存画像を編集 (マスクなし - フル画像編集):

uv run ~/.claude/skills/gpt-image-1-5/scripts/generate_image.py --prompt "編集指示" --filename "出力名.png" --input-image "入力パス.png" [--size 1024x1024|1024x1536|1536x1024|auto] [--api-key KEY]

既存画像を編集 (マスクあり - 精密なインペインティング):

uv run ~/.claude/skills/gpt-image-1-5/scripts/generate_image.py --prompt "マスク領域に追加する内容" --filename "出力名.png" --input-image "入力パス.png" --mask "マスクパス.png" [--size 1024x1024|1024x1536|1536x1024|auto] [--api-key KEY]

重要: ユーザーの現在の作業ディレクトリから実行して、画像がスキルディレクトリではなくユーザーが作業している場所に保存されるようにしてください。

パラメータ

品質オプション

  • low - 最速の生成、低品質
  • medium (デフォルト) - バランスの取れた品質と速度
  • high - 最高品質、遅い生成

ユーザーリクエストのマッピング:

  • 品質について言及なし -> medium
  • 「quick」「fast」「draft」 -> low
  • 「高品質」「最高」「詳細」「高解像度」 -> high

サイズオプション

  • 1024x1024 (デフォルト) - 正方形フォーマット
  • 1024x1536 - ポートレートフォーマット
  • 1536x1024 - ランドスケープフォーマット
  • auto - プロンプトに基づいてモデルが判定

ユーザーリクエストのマッピング:

  • サイズについて言及なし -> 1024x1024
  • 「正方形」 -> 1024x1024
  • 「ポートレート」「縦」「縦長」 -> 1024x1536
  • 「ランドスケープ」「横」「横長」 -> 1536x1024

背景オプション (生成のみ)

  • auto (デフォルト) - モデルが判定
  • transparent - 透明背景 (PNG/WebP 出力)
  • opaque - 無地背景

API キー

スクリプトは以下の順序で API キーをチェックします:

  1. --api-key 引数 (ユーザーがチャットで提供したキーを使用)
  2. OPENAI_API_KEY 環境変数

どちらも利用できない場合、スクリプトはエラーメッセージとともに終了します。

ファイル名の生成

パターン yyyy-mm-dd-hh-mm-ss-name.png でファイル名を生成してください:

フォーマット: {timestamp}-{descriptive-name}.png

  • タイムスタンプ: 現在の日時を yyyy-mm-dd-hh-mm-ss フォーマット (24時間形式)
  • 名前: ハイフン区切りの小文字の説明的テキスト
  • 説明部分は簡潔に保つ (通常 1〜5 単語)
  • ユーザーのプロンプトまたは会話からコンテキストを使用
  • 不明な場合はランダム識別子を使用 (例: x9k2, a7b3)

例:

  • プロンプト「A serene Japanese garden」-> 2025-12-17-14-23-05-japanese-garden.png
  • プロンプト「sunset over mountains」-> 2025-12-17-15-30-12-sunset-mountains.png
  • プロンプト「create an image of a robot」-> 2025-12-17-16-45-33-robot.png
  • 不明なコンテキスト -> 2025-12-17-17-12-48-x9k2.png

画像編集

両方の編集モードは Image API (images.edit エンドポイント) を gpt-image-1.5 で使用し、信頼性の高い結果を得ます。

マスクなし (フル画像編集)

ユーザーが既存画像を特定の領域を指定せずに修正したい場合:

  1. 画像へのパスを指定して --input-image パラメータを使用
  2. プロンプトには編集指示が含まれる (例: 「空をより劇的に」「漫画風に変更」)
  3. 完全に透明なマスクが自動生成され、モデルが画像全体を編集できるようになります

マスクあり (精密なインペインティング)

ユーザーが特定の領域を編集したい場合:

  1. 画像へのパスを指定して --input-image パラメータを使用
  2. PNG マスクファイルのパスを指定して --mask パラメータを使用
  3. マスクは編集すべき領域で透明 (alpha=0) である必要があります
  4. プロンプトはマスク領域に表示されるべき内容を説明します

一般的な編集タスク: 要素の追加/削除、スタイル変更、色調整、背景置換など

プロンプトの処理

生成の場合: ユーザーの画像説明をそのまま --prompt に渡します。明らかに不十分な場合のみ修正してください。

編集の場合: --prompt に編集指示を渡す (例: 「空に虹を追加」「水彩画風にする」)

両方の場合でユーザーの創造的意図を保持してください。

出力

  • 現在のディレクトリに PNG を保存 (ファイル名がディレクトリを含む場合は指定されたパスに保存)
  • スクリプトは生成画像への完全パスを出力
  • 画像を読み直さない - 保存されたパスをユーザーに知らせるだけ

新しい画像を生成:

uv run ~/.claude/skills/gpt-image-1-5/scripts/generate_image.py --prompt "A serene Japanese garden with cherry blossoms" --filename "2025-12-17-14-23-05-japanese-garden.png" --quality high --size 1536x1024

透明背景で生成:

uv run ~/.claude/skills/gpt-image-1-5/scripts/generate_image.py --prompt "A cute cartoon cat mascot" --filename "2025-12-17-14-25-30-cat-mascot.png" --background transparent --quality high

既存画像を編集 (フル画像):

uv run ~/.claude/skills/gpt-image-1-5/scripts/generate_image.py --prompt "make the sky more dramatic with storm clouds" --filename "2025-12-17-14-27-00-dramatic-sky.png" --input-image "original-photo.jpg"

マスクで編集 (インペインティング):

uv run ~/.claude/skills/gpt-image-1-5/scripts/generate_image.py --prompt "a flamingo swimming" --filename "2025-12-17-14-30-00-lounge-flamingo.png" --input-image "lounge.png" --mask "mask.png"

ライセンス: CC0-1.0(寛容ライセンスのため全文を引用しています) · 原本リポジトリ

詳細情報

作者
intellectronica
リポジトリ
intellectronica/agent-skills
ライセンス
CC0-1.0
最終更新
不明

Source: https://github.com/intellectronica/agent-skills / ライセンス: CC0-1.0

関連スキル

OpenAILLM・AI開発⭐ リポ 6,054

agent-browser

AI エージェント向けのブラウザ自動化 CLI です。ウェブサイトとの対話が必要な場合に使用します。ページ遷移、フォーム入力、ボタンクリック、スクリーンショット取得、データ抽出、ウェブアプリのテスト、ブラウザ操作の自動化など、あらゆるブラウザタスクに対応できます。「ウェブサイトを開く」「フォームに記入する」「ボタンをクリックする」「スクリーンショットを取得する」「ページからデータを抽出する」「このウェブアプリをテストする」「サイトにログインする」「ブラウザ操作を自動化する」といった要求や、プログラマティックなウェブ操作が必要なタスクで起動します。

by JimmyLv
汎用LLM・AI開発⭐ リポ 1,982

anyskill

AnySkill — あなたのプライベート・スキルクラウド。GitHubを基盤としたリポジトリからエージェントスキルを管理、同期、動的にロードできます。自然言語でクラウドスキルを検索し、オンデマンドでプロンプトを自動ロード、カスタムスキルのアップロードと共有、スキルバンドルの一括インストールが可能です。OpenClaw、Antigravity、Claude Code、Cursorに対応しています。

by LeoYeAI
汎用LLM・AI開発⭐ リポ 1,982

engram

AIエージェント向けの永続的なメモリシステムです。バグ修正、意思決定、発見、設定変更の後はmem_saveを使用してください。ユーザーが「覚えている」「記憶している」と言及した場合、または以前のセッションと重複する作業を開始する際はmem_searchを使用します。セッション終了前にmem_session_summaryを使用して、コンテキストを保持してください。

by LeoYeAI
汎用LLM・AI開発⭐ リポ 21,584

skyvern

AI駆動のブラウザ自動化により、任意のウェブサイトを自動化できます。フォーム入力、データ抽出、ファイルダウンロード、ログイン、複数ステップのワークフロー実行など、ユーザーがウェブサイトと連携する必要があるときに使用します。Skyvernは、LLMとコンピュータビジョンを活用して、未知のサイトも自動操作可能です。Python SDK、TypeScript SDK、REST API、MCPサーバー、またはCLIを通じて統合できます。

by Skyvern-AI
汎用LLM・AI開発⭐ リポ 1,149

pinchbench

PinchBenchベンチマークを実行して、OpenClawエージェントの実世界タスクにおけるパフォーマンスを評価できます。モデルの機能テスト、モデル間の比較、ベンチマーク結果のリーダーボード提出、またはOpenClawのセットアップがカレンダー、メール、リサーチ、コーディング、複数ステップのワークフローにどの程度対応しているかを確認する際に使用します。

by pinchbench
汎用LLM・AI開発⭐ リポ 4,693

openui

OpenUIとOpenUI Langを使用してジェネレーティブUIアプリを構築できます。これらはLLM生成インターフェースのためのトークン効率的なオープン標準です。OpenUI、@openuidev、ジェネレーティブUI、LLMからのストリーミングUI、AI向けコンポーネントライブラリ、またはjson-render/A2UIの置き換えについて述べる際に使用します。スキャフォルディング、defineComponent、システムプロンプト、Renderer、およびOpenUI Lang出力のデバッグに対応しています。

by thesysdev
本サイトは GitHub 上で公開されているオープンソースの SKILL.md ファイルをクロール・インデックス化したものです。 各スキルの著作権は原作者に帰属します。掲載に問題がある場合は info@alsel.co.jp または /takedown フォームよりご連絡ください。
原作者: intellectronica · intellectronica/agent-skills · ライセンス: CC0-1.0