Agent Skills by ALSEL
Anthropic ClaudeLLM・AI開発⭐ リポ 0品質スコア 50/100

qwen-edit

Qwen-Image-Edit向けの画像編集プロンプトパターン集。人物の同一性を保ちながらの写真編集、トリミング画像の再フレーミング、衣装やアクセサリーの変更、ポーズ調整、スタイル変換、キャラクター変形などを行う際に活用できます。プロンプトのパターン、パラメータ調整のコツ、具体的な使用例を提供します。

description の原文を見る

AI image editing prompting patterns for Qwen-Image-Edit. Use when editing photos while preserving identity, reframing cropped images, changing clothing or accessories, adjusting poses, applying style transfers, or character transformations. Provides prompt patterns, parameter tuning, and examples.

SKILL.md 本文

Qwen-Image-Edit スキル

RunPod serverless 経由で Qwen-Image-Edit-2511 を使用した AI 画像編集。

ステータス: 進化中 - 実験を通じて学習内容をキャプチャ中

このスキルを使用する場合

ユーザーが以下の操作を希望する場合に使用してください:

  • アイデンティティを保持しながら写真を編集・変形させる
  • クロップされた画像を再フレーム化する (切れた頭部を修正など)
  • 衣服を変更したり、アクセサリーを追加する
  • ポーズを変更する (腕の位置、手の配置)
  • スタイル転送を適用する (サイバーパンク、アニメ、油絵)
  • ライティング/カラーグレーディングを調整する
  • オブジェクトを追加・削除する
  • キャラクター変形 (Bond, Neo など)

このスキルを使用しない場合

  • 背景置き換え (単一画像) - カットアウトアーティファクト、ハロー効果が生成される
  • 顔スワップ - リファレンスからアイデンティティを保持できない
  • アウトペイント - キャンバスを信頼性を持って拡張できない

注意して使用

  • マルチ画像合成 - 明示的なアイデンティティアンカーを使用することで動作可能 (プロンプトパターンについては examples.md を参照)。distinctive な特徴 (髪のテクスチャ/色、民族性、衣装) を記述し、ガイダンス ~2.0 を使用する必要があります
  • カメラアングルの変更 - 結果が不安定です。垂直角度 (低/高) は回転角度 (三角形ビュー) よりも適切に動作します

クイックリファレンス

# 基本的な編集
python tools/image_edit.py --input photo.jpg --prompt "Add sunglasses"

# ネガティブプロンプト使用 (推奨)
python tools/image_edit.py --input photo.jpg \
  --prompt "Reframe as portrait with full head visible" \
  --negative "blur, distortion, artifacts"

# スタイル転送
python tools/image_edit.py --input photo.jpg --style cyberpunk

# 背景 (慎重に使用 - よく失敗する)
python tools/image_edit.py --input photo.jpg --background office

# より高品質
python tools/image_edit.py --input photo.jpg --prompt "..." --steps 16 --guidance 3.0

# マルチ画像合成 (アイデンティティ保持)
python tools/image_edit.py --input person.jpg background.jpg \
  --prompt "The [ethnicity] [gender] with [hair description] from first image is now in [scene] from second image. Same [features], [outfit]." \
  --negative "different ethnicity, different hair color, different face shape, generic stock photo" \
  --steps 16 --guidance 2.0

キーファイル

  • prompting.md - プロンプトパターンと構造
  • examples.md - 実験による良い例・悪い例
  • parameters.md - steps、guidance、ネガティブプロンプトのチューニング

ツールの場所

tools/image_edit.py - RunPod エンドポイントの CLI ラッパー

関連ドキュメント

  • docs/qwen-edit-patterns.md - キャラクター変形パターン
  • .ai_dev/qwen-edit-research.md - リサーチノート

ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ

詳細情報

作者
digitalsamba
リポジトリ
digitalsamba/claude-code-video-toolkit
ライセンス
MIT
最終更新
不明

Source: https://github.com/digitalsamba/claude-code-video-toolkit / ライセンス: MIT

関連スキル

OpenAILLM・AI開発⭐ リポ 6,054

agent-browser

AI エージェント向けのブラウザ自動化 CLI です。ウェブサイトとの対話が必要な場合に使用します。ページ遷移、フォーム入力、ボタンクリック、スクリーンショット取得、データ抽出、ウェブアプリのテスト、ブラウザ操作の自動化など、あらゆるブラウザタスクに対応できます。「ウェブサイトを開く」「フォームに記入する」「ボタンをクリックする」「スクリーンショットを取得する」「ページからデータを抽出する」「このウェブアプリをテストする」「サイトにログインする」「ブラウザ操作を自動化する」といった要求や、プログラマティックなウェブ操作が必要なタスクで起動します。

by JimmyLv
汎用LLM・AI開発⭐ リポ 1,982

anyskill

AnySkill — あなたのプライベート・スキルクラウド。GitHubを基盤としたリポジトリからエージェントスキルを管理、同期、動的にロードできます。自然言語でクラウドスキルを検索し、オンデマンドでプロンプトを自動ロード、カスタムスキルのアップロードと共有、スキルバンドルの一括インストールが可能です。OpenClaw、Antigravity、Claude Code、Cursorに対応しています。

by LeoYeAI
汎用LLM・AI開発⭐ リポ 1,982

engram

AIエージェント向けの永続的なメモリシステムです。バグ修正、意思決定、発見、設定変更の後はmem_saveを使用してください。ユーザーが「覚えている」「記憶している」と言及した場合、または以前のセッションと重複する作業を開始する際はmem_searchを使用します。セッション終了前にmem_session_summaryを使用して、コンテキストを保持してください。

by LeoYeAI
汎用LLM・AI開発⭐ リポ 21,584

skyvern

AI駆動のブラウザ自動化により、任意のウェブサイトを自動化できます。フォーム入力、データ抽出、ファイルダウンロード、ログイン、複数ステップのワークフロー実行など、ユーザーがウェブサイトと連携する必要があるときに使用します。Skyvernは、LLMとコンピュータビジョンを活用して、未知のサイトも自動操作可能です。Python SDK、TypeScript SDK、REST API、MCPサーバー、またはCLIを通じて統合できます。

by Skyvern-AI
汎用LLM・AI開発⭐ リポ 1,149

pinchbench

PinchBenchベンチマークを実行して、OpenClawエージェントの実世界タスクにおけるパフォーマンスを評価できます。モデルの機能テスト、モデル間の比較、ベンチマーク結果のリーダーボード提出、またはOpenClawのセットアップがカレンダー、メール、リサーチ、コーディング、複数ステップのワークフローにどの程度対応しているかを確認する際に使用します。

by pinchbench
汎用LLM・AI開発⭐ リポ 4,693

openui

OpenUIとOpenUI Langを使用してジェネレーティブUIアプリを構築できます。これらはLLM生成インターフェースのためのトークン効率的なオープン標準です。OpenUI、@openuidev、ジェネレーティブUI、LLMからのストリーミングUI、AI向けコンポーネントライブラリ、またはjson-render/A2UIの置き換えについて述べる際に使用します。スキャフォルディング、defineComponent、システムプロンプト、Renderer、およびOpenUI Lang出力のデバッグに対応しています。

by thesysdev
本サイトは GitHub 上で公開されているオープンソースの SKILL.md ファイルをクロール・インデックス化したものです。 各スキルの著作権は原作者に帰属します。掲載に問題がある場合は info@alsel.co.jp または /takedown フォームよりご連絡ください。
原作者: digitalsamba · digitalsamba/claude-code-video-toolkit · ライセンス: MIT