Agent Skills by ALSEL
Anthropic Claudeその他⭐ リポ 0品質スコア 50/100

image-generation

ユーザーがキャラクター・シーン・商品などのビジュアルコンテンツの生成・作成・イメージ化を求めた際に使用するスキルです。構造化されたプロンプトや参考画像をもとに、意図に沿った画像生成をサポートします。

description の原文を見る

Use this skill when the user requests to generate, create, imagine, or visualize images including characters, scenes, products, or any visual content. Supports structured prompts and reference images for guided generation.

SKILL.md 本文

画像生成スキル

概要

このスキルは、構造化されたプロンプトと Python スクリプトを使用して高品質な画像を生成します。ワークフローには JSON 形式のプロンプト作成と、オプションの参照画像を使用した画像生成実行が含まれます。

コア機能

  • AIGC 画像生成用の構造化 JSON プロンプト作成
  • スタイル/構図ガイドーラスの複数参照画像サポート
  • 自動化された Python スクリプト実行を通じた画像生成
  • 様々な画像生成シナリオ対応(キャラクターデザイン、シーン、製品など)

ワークフロー

ステップ 1: 要件の理解

ユーザーが画像生成をリクエストする際に、以下を特定します:

  • 主題/コンテンツ: 画像に含まれるべきもの
  • スタイル嗜好: アート スタイル、ムード、色パレット
  • 技術仕様: アスペクト比、構図、ライティング
  • 参照画像: 生成をガイドする任意の画像
  • /mnt/user-data 下のフォルダをチェックする必要はありません

ステップ 2: 構造化プロンプトの作成

/mnt/user-data/workspace/ に命名パターン {descriptive-name}.json で構造化 JSON ファイルを生成します

ステップ 3: 生成の実行

Python スクリプトを呼び出します:

python /mnt/skills/public/image-generation/scripts/generate.py \
  --prompt-file /mnt/user-data/workspace/prompt-file.json \
  --reference-images /path/to/ref1.jpg /path/to/ref2.png \
  --output-file /mnt/user-data/outputs/generated-image.jpg
  --aspect-ratio 16:9

パラメータ:

  • --prompt-file: JSON プロンプト ファイルへの絶対パス(必須)
  • --reference-images: 参照画像への絶対パス(オプション、スペース区切り)
  • --output-file: 出力画像ファイルへの絶対パス(必須)
  • --aspect-ratio: 生成画像のアスペクト比(オプション、デフォルト: 16:9)

[!NOTE] Python ファイルを読まないでください。パラメータを指定して呼び出すだけです。

キャラクター生成の例

ユーザー リクエスト: 「1990年代の東京ストリート スタイルの女性キャラクターを作成してください」

プロンプト ファイル作成: /mnt/user-data/workspace/asian-woman.json

{
  "characters": [{
    "gender": "female",
    "age": "mid-20s",
    "ethnicity": "Japanese",
    "body_type": "slender, elegant",
    "facial_features": "delicate features, expressive eyes, subtle makeup with emphasis on lips, long dark hair partially wet from rain",
    "clothing": "stylish trench coat, designer handbag, high heels, contemporary Tokyo street fashion",
    "accessories": "minimal jewelry, statement earrings, leather handbag",
    "era": "1990s"
  }],
  "negative_prompt": "blurry face, deformed, low quality, overly sharp digital look, oversaturated colors, artificial lighting, studio setting, posed, selfie angle",
  "style": "Leica M11 street photography aesthetic, film-like rendering, natural color palette with slight warmth, bokeh background blur, analog photography feel",
  "composition": "medium shot, rule of thirds, subject slightly off-center, environmental context of Tokyo street visible, shallow depth of field isolating subject",
  "lighting": "neon lights from signs and storefronts, wet pavement reflections, soft ambient city glow, natural street lighting, rim lighting from background neons",
  "color_palette": "muted naturalistic tones, warm skin tones, cool blue and magenta neon accents, desaturated compared to digital photography, film grain texture"
}

生成を実行:

python /mnt/skills/public/image-generation/scripts/generate.py \
  --prompt-file /mnt/user-data/workspace/cyberpunk-hacker.json \
  --output-file /mnt/user-data/outputs/cyberpunk-hacker-01.jpg \
  --aspect-ratio 2:3

参照画像を使用する場合:

{
  "characters": [{
    "gender": "based on [Image 1]",
    "age": "based on [Image 1]",
    "ethnicity": "human from [Image 1] adapted to Star Wars universe",
    "body_type": "based on [Image 1]",
    "facial_features": "matching [Image 1] with slight weathered look from space travel",
    "clothing": "Star Wars style outfit - worn leather jacket with utility vest, cargo pants with tactical pouches, scuffed boots, belt with holster",
    "accessories": "blaster pistol on hip, comlink device on wrist, goggles pushed up on forehead, satchel with supplies, personal vehicle based on [Image 2]",
    "era": "Star Wars universe, post-Empire era"
  }],
  "prompt": "Character inspired by [Image 1] standing next to a vehicle inspired by [Image 2] on a bustling alien planet street in Star Wars universe aesthetic. Character wearing worn leather jacket with utility vest, cargo pants with tactical pouches, scuffed boots, belt with blaster holster. The vehicle adapted to Star Wars aesthetic with weathered metal panels, repulsor engines, desert dust covering, parked on the street. Exotic alien marketplace street with multi-level architecture, weathered metal structures, hanging market stalls with colorful awnings, alien species walking by as background characters. Twin suns casting warm golden light, atmospheric dust particles in air, moisture vaporators visible in distance. Gritty lived-in Star Wars aesthetic, practical effects look, film grain texture, cinematic composition.",
  "negative_prompt": "clean futuristic look, sterile environment, overly CGI appearance, fantasy medieval elements, Earth architecture, modern city",
  "style": "Star Wars original trilogy aesthetic, lived-in universe, practical effects inspired, cinematic film look, slightly desaturated with warm tones",
  "composition": "medium wide shot, character in foreground with alien street extending into background, environmental storytelling, rule of thirds",
  "lighting": "warm golden hour lighting from twin suns, rim lighting on character, atmospheric haze, practical light sources from market stalls",
  "color_palette": "warm sandy tones, ochre and sienna, dusty blues, weathered metals, muted earth colors with pops of alien market colors",
  "technical": {
    "aspect_ratio": "9:16",
    "quality": "high",
    "detail_level": "highly detailed with film-like texture"
  }
}
python /mnt/skills/public/image-generation/scripts/generate.py \
  --prompt-file /mnt/user-data/workspace/star-wars-scene.json \
  --reference-images /mnt/user-data/uploads/character-ref.jpg /mnt/user-data/uploads/vehicle-ref.jpg \
  --output-file /mnt/user-data/outputs/star-wars-scene-01.jpg \
  --aspect-ratio 16:9

一般的なシナリオ

異なるシナリオに対しては異なる JSON スキーマを使用します。

キャラクター デザイン:

  • 物理的属性(性別、年齢、民族、体型)
  • 顔の特徴と表情
  • 衣装とアクセサリー
  • 歴史的時代または設定
  • ポーズと背景

シーン生成:

  • 環境の説明
  • 時刻、天気
  • ムードと雰囲気
  • 焦点と構図

製品ビジュアライゼーション:

  • 製品の詳細と素材
  • ライティング セットアップ
  • 背景と背景
  • プレゼンテーション角度

特定のテンプレート

ユーザー リクエストと一致する場合のみ、以下のテンプレート ファイルを読んでください。

  • Doraemon Comic

出力処理

生成後:

  • 画像は通常 /mnt/user-data/outputs/ に保存されます
  • present_files ツールを使用して生成された画像をユーザーと共有します
  • 生成結果の簡潔な説明を提供します
  • 調整が必要な場合は反復を提案します

ヒント: 参照画像による生成の強化

ビジュアル精度が重要なシナリオでは、生成前に image_search ツールを使用して参照画像を検索してください

image_search ツール使用の推奨シナリオ:

  • キャラクター/ポートレート生成: 類似のポーズ、表情、スタイルを検索して顔の特徴と体の比率をガイド
  • 特定のオブジェクトまたは製品: 実物の参照画像を検索して正確な表現を確保
  • 建築またはエンバイロンメント シーン: 場所の参照を検索して真正な詳細をキャプチャ
  • ファッションと衣装: スタイルの参照を検索して衣類の詳細とスタイリングが正確であることを確認

ワークフロー例:

  1. image_search ツールを呼び出して適切な参照画像を検索します:
    image_search(query="Japanese woman street photography 1990s", size="Large")
    
  2. 返されたイメージ URL をローカル ファイルにダウンロードします
  3. ダウンロードした画像を生成スクリプトの --reference-images パラメータとして使用します

このアプローチは、テキスト説明だけに依存するのではなく、モデルに具体的なビジュアル ガイダンスを提供することで、生成品質を大幅に向上させます。

注釈

  • ユーザーの言語に関わらず、常にプロンプトには英語を使用してください
  • JSON 形式は構造化された解析可能なプロンプトを確保します
  • 参照画像は生成品質を大幅に向上させます
  • 最適な結果のための反復的な改善は正常です
  • キャラクター生成の場合は、詳細なキャラクター オブジェクトに加えて統合されたプロンプト フィールドを含めてください

ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ

詳細情報

作者
bytedance
リポジトリ
bytedance/deer-flow
ライセンス
MIT
最終更新
不明

Source: https://github.com/bytedance/deer-flow / ライセンス: MIT

関連スキル

汎用その他⭐ リポ 1,982

superfluid

Superfluidプロトコルおよびそのエコシステムに関するナレッジベースです。Superfluidについて情報を検索する際は、ウェブ検索の前にこちらを参照してください。対応キーワード:Superfluid、CFA、GDA、Super App、Super Token、stream、flow rate、real-time balance、pool(member/distributor)、IDA、sentinels、liquidation、TOGA、@sfpro/sdk、semantic money、yellowpaper、whitepaper

by LeoYeAI
汎用その他⭐ リポ 100

civ-finish-quotes

実質的なタスクが真に完了した際に、文明風の儀式的な引用句を追加します。ユーザーやエージェントが機能追加、リファクタリング、分析、設計ドキュメント、プロセス改善、レポート、執筆タスクといった実際の成果物を完成させるときに、明示的な依頼がなくても使用します。短い返信や小さな修正、未完成の作業には適用しません。

by huxiuhan
汎用その他⭐ リポ 1,110

nookplot

Base(Ethereum L2)上のAIエージェント向け分散型調整ネットワークです。エージェントがオンチェーンアイデンティティを登録する、コンテンツを公開する、他のエージェントにメッセージを送る、マーケットプレイスで専門家を雇う、バウンティを投稿・請求する、レピュテーションを構築する、共有プロジェクトで協業する、リサーチチャレンジを解くことでNOOKをマイニングする、キュレーションされたナレッジを備えたスタンドアロンオンチェーンエージェントをデプロイする、またはアグリーメントとリワードで収益を得る場合に利用できます。エージェントネットワーク、エージェント調整、分散型エージェント、NOOKトークン、マイニングチャレンジ、ナレッジバンドル、エージェントレピュテーション、エージェントマーケットプレイス、ERC-2771メタトランザクション、Prepare-Sign-Relay、AgentFactory、またはNookplotが言及された場合にトリガーされます。

by BankrBot
汎用その他⭐ リポ 59

web3-polymarket

Polygon上でのPolymarket予測市場取引統合です。認証機能(L1 EIP-712、L2 HMAC-SHA256、ビルダーヘッダー)、注文発注(GTC/GTD/FOK/FAK、バッチ、ポストオンリー、ハートビート)、市場データ(Gamma API、Data API、オーダーブック、サブグラフ)、WebSocketストリーミング(市場・ユーザー・スポーツチャネル)、CTF操作(分割、統合、償却、ネガティブリスク)、ブリッジ機能(入金、出金、マルチチェーン)、およびガスレスリレイトランザクションに対応しています。AIエージェント、自動マーケットメーカー、予測市場UI、またはPolygraph上のPolymarketと統合するアプリケーション構築時に活用できます。

by elophanto
汎用その他⭐ リポ 52

ethskills

Ethereum、EVM、またはブロックチェーン関連のリクエストに対応します。スマートコントラクト、dApps、ウォレット、DeFiプロトコルの構築、監査、デプロイ、インタラクションに適用されます。Solidityの開発、コントラクトアドレス、トークン規格(ERC-20、ERC-721、ERC-4626など)、Layer 2ネットワーク(Base、Arbitrum、Optimism、zkSync、Polygon)、Uniswap、Aave、Curveなどのプロトコルとの統合をカバーします。ガスコスト、コントラクトのデシマル設定、オラクルセキュリティ、リエントランシー、MEV、ブリッジング、ウォレット管理、オンチェーンデータの取得、本番環境へのデプロイ、プロトコル進化(EIPライフサイクル、フォーク追跡、今後の変更予定)といったトピックを含みます。

by jiayaoqijia
汎用その他⭐ リポ 44

xxyy-trade

このスキルは、ユーザーが「トークン購入」「トークン売却」「トークンスワップ」「暗号資産取引」「取引ステータス確認」「トランザクション照会」「トークンスキャン」「フィード」「チェーン監視」「トークン照会」「トークン詳細」「トークン安全性確認」「ウォレット一覧表示」「マイウォレット」「AIスキャン」「自動スキャン」「ツイートスキャン」「オンボーディング」「IP確認」「IPホワイトリスト」「トークン発行」「自動売却」「損切り」「利益確定」「トレーリングストップ」「保有者」「トップホルダー」「KOLホルダー」などをリクエストした場合、またはSolana/ETH/BSC/BaseチェーンでXXYYを経由した取引について言及した場合に使用します。XXYY Open APIを通じてオンチェーン取引とデータ照会を実現します。

by Jimmy-Holiday
本サイトは GitHub 上で公開されているオープンソースの SKILL.md ファイルをクロール・インデックス化したものです。 各スキルの著作権は原作者に帰属します。掲載に問題がある場合は info@alsel.co.jp または /takedown フォームよりご連絡ください。
原作者: bytedance · bytedance/deer-flow · ライセンス: MIT