flux-2-klein
RunComfy上でFlux 2 Klein(Black Forest Labs製の高速蒸留モデル)を使って画像を生成します。モデル固有のプロンプティングパターンを内蔵しており、サブ秒レイテンシや複数リファレンスによるブランドスタイリング、主語先行の宣言的プロンプト構造など、Flux 2 Kleinの強みを最大限に引き出した高品質な出力が可能です。「flux 2 klein」「flux klein」「BFL flux 2」などの指示、またはこのモデルでの生成リクエストをトリガーに、ローカルのRunComfy CLIを通じて`runcomfy run blackforestlabs/flux-2-klein/9b/text-to-image`(または`/4b/`)を呼び出します。
description の原文を見る
> Generate images with Flux 2 Klein (Black Forest Labs' distilled fast variant of Flux 2) on RunComfy — bundled with the model's documented prompting patterns so the skill gets sharper output than naive prompting against the same model. Documents Flux 2 Klein's strengths (sub-second latency, multi-reference brand styling, declarative subject-first prompts), the step-count strategy (4–8 for fast iteration, ~25 for polish), the 9B vs 4B variant trade-off, and when to route to Flux 2 Pro / Seedream 5 / GPT Image 2 instead. Calls `runcomfy run blackforestlabs/flux-2-klein/9b/text-to-image` (or `/4b/`) through the local RunComfy CLI. Triggers on "flux 2 klein", "flux-2-klein", "flux klein", "BFL flux 2", or any explicit ask to generate with this model.
SKILL.md 本文
Flux 2 Klein — Pro Pack on RunComfy
runcomfy.com · 9B model · 4B model · GitHub
Black Forest Labs の Flux 2 Klein (Flux 2 の蒸留版で低レイテンシ) を RunComfy Model API でホストしています。API キー不要、非同期 REST です。
npx skills add agentspace-so/runcomfy-skills --skill flux-2-klein -g
このモデルを選ぶべき場面(兄弟モデルとの比較)
Flux 2 Klein の独自の強みは レイテンシ優先のクリエイティブ反復 です。1 秒未満のフィードバックにより、ライブアートディレクションセッションと高速なプロダクト可視化が可能になり、バッチ型モデルでは実現できません。反復速度が最大解像度より重要 な場合に選択してください。
| 実現したいこと | 使用モデル |
|---|---|
| リアルタイム / ライブアートディレクションセッション | Flux 2 Klein 4B |
| 最後に高い詳細度を備えた高速反復 | Flux 2 Klein 9B |
| マルチリファレンスブランドスタイリングと一貫した見た目 | Flux 2 Klein |
| 2K–4K のヒーロー画像、最大解像度 | Seedream 5 |
| 最大プロンプト準拠と極度の詳細度 | Flux 2 Pro |
| 埋め込みテキスト、ロゴ、多言語表示 | GPT Image 2 |
| ハイパーリアルな人物ポートレート | Nano Banana Pro |
ユーザーが「Flux 2 Klein」「BFL Klein」「flux klein」と明示的に言及した場合は、関係なくここにルーティングしてください。「Flux 2」と一般的に言及した場合は、Klein(高速)か Pro(最高品質)かを確認してから、デフォルトに決定してください。
前提条件
- RunComfy CLI —
npm i -g @runcomfy/cli - RunComfy アカウント —
runcomfy loginでブラウザのデバイスコードフローが開きます。 - CI / コンテナ — 代わりに
RUNCOMFY_TOKEN=<token>を設定してください。
エンドポイント + 入力スキーマ
2 つのバリアント、同じエンドポイント構造、同じプロンプト文法。
blackforestlabs/flux-2-klein/9b/text-to-image
忠実度優先のバリアント。仕上げ / 最終出力に使用します。
| フィールド | 型 | 必須 | デフォルト | 注記 |
|---|---|---|---|---|
prompt | string | yes | — | 最大約 512 トークン。長くなると品質低下。 |
steps | int | no | 25 | 4–50。ステップ蒸留アーキテクチャ — 4–8 でコンセプティング足りる;約 25 で仕上げ;25 以上はほぼ効果なし。 |
width | int | no | 1024 | 512–1536 典型。アスペクト比は 16:9 が上限、最大約 2K。 |
height | int | no | 1024 | width のアスペクト比意図に合わせてください。 |
blackforestlabs/flux-2-klein/4b/text-to-image
レイテンシ優先のバリアント。1 秒未満の 4 ステップ推論。ライブ反復 / コンセプティングに使用します。
9B と同じフィールド構成。デフォルト steps は事実上 4 — このバリアントはそのステップ数用に構築されています。
リファレンス画像(両バリアント)
同じエンドポイント上で、スタイル転送 / ガイド付きコンポジション用に最大 4 つの同時リファレンス画像 がサポートされます。JSON ボディの正確なフィールド名は モデルの API タブ に記載されています。CLI 経由でそのまま渡してください。リファレンス画像の使用により、別の /edit エンドポイントなしで編集スタイルのワークフローが可能になります。
呼び出し方法
高速コンセプティング(4B、1 秒未満):
runcomfy run blackforestlabs/flux-2-klein/4b/text-to-image \
--input '{"prompt": "<user prompt>"}' \
--output-dir <absolute/path>
仕上げ / 最終版(9B、約 25 ステップ):
runcomfy run blackforestlabs/flux-2-klein/9b/text-to-image \
--input '{
"prompt": "<user prompt>",
"steps": 25,
"width": 1024,
"height": 1024
}' \
--output-dir <absolute/path>
ワイドフォーマットポスター:
runcomfy run blackforestlabs/flux-2-klein/9b/text-to-image \
--input '{"prompt": "<user prompt>", "width": 1536, "height": 864}' \
--output-dir <absolute/path>
CLI は投入、2 秒ごとにポーリングして終了まで待機し、結果から *.runcomfy.net / *.runcomfy.com URL を --output-dir にダウンロードします。標準出力は結果 JSON です。標準エラーは進捗です。
パイプフレンドリーな用法:
runcomfy --output json run blackforestlabs/flux-2-klein/4b/text-to-image \
--input '{"prompt":"..."}' --no-wait | jq -r .request_id
プロンプティング — 実際に機能するもの
これらはモデル固有のパターンで、実験的に出力品質を改善します。
サブジェクトファースト宣言型文法。 Flux 2 Klein が訓練されている構造は 「主体 + 動作 + シーン + スタイル + ライティング + カメラ + 品質」 です。主体を前面に出し、末尾に指示を付けます。例:"A vibrant hummingbird mid-flight sipping nectar from a bright pink hibiscus, iridescent feathers in morning sun, soft bokeh tropical garden, macro photography, razor-sharp detail, cinematic lighting".
流暢な言語より具体性が有効。 「4k product photo, softbox lighting, reflective table, 35mm, f/2.8」は予測可能にガイドします。「本当にきれいなプロダクト画像」はガイドになりません。
ステップ数をフェーズ別に。
- コンセプティング: 4B バリアントで 4–8 ステップ — ライブ探索のための 1 秒未満フィードバック。
- 精緻化: 4B で 8–15 ステップもまだ有効、主体 + フレーミングをロック。
- 仕上げ: 9B バリアントで約 25 ステップ — テクスチャ、マイクロディテール、微細なタイポグラフィ。
マルチリファレンス調整。 リファレンス画像を渡すときは、その美学をそろえてください。同じ呼び出しで水彩 + フォトリアル + 3D レンダリングを混ぜるとエディタが混乱します。すべてのリファレンスで 1 つの一貫した視覚登録を選択してください。
条件付き編集: 何が変わらないかを述べ、次に何が変わるかを述べます。「リファレンスと同じコンポジションとライティングですが、背景をビーチからマウンテンスタジオに変更してください。」 このパターンはコンポジションを安定に保ちます。
テキストレンダリング用(Klein は 8B の Qwen3 エンベッダを持っており、悪くはありませんが GPT Image 2 レベルではありません):「crisp typography, high-contrast label」を追加し、テキストが柔らかく出た場合はステップを約 25 にバンプしてください。画像内のテキストが多い、または多言語レンダリングの場合は、代わりに GPT Image 2 にルーティングしてください。
アンチパターン:
- 矛盾する形容詞は避けてください。「minimalist + ornate」はキャンセルされます。
- 約 512 トークンを超えないでください。モデルが低下し、優雅に切り詰めません。
- 4K を求めないでください — モデルの解像度上限は約 2K です。
- 超ワイド(16:9 超)を求めないでください — モデルがクロップします。
その強み
| ユースケース | Flux 2 Klein が活躍する理由 |
|---|---|
| ライブアートディレクションセッション | 1 秒未満のフィードバック(4B)でリアルタイム反復を実現 |
| インタラクティブプロダクト可視化 | バッチ待機なし高速 UI プレビューとプロダクトコンプ |
| マルチリファレンスブランドスタイリング | リファレンス間の強いスタイル一貫性で統一アセットパック実現 |
| 高速コンセプティング → 仕上げワークフロー | 4B 探索、9B 最終パス — 全体でプロンプト文法統一 |
| コンシューマー GPU フレンドリー推論 | 4B バリアント軽量ハードウェア実行;自ホスト比較で関連だが RunComfy ホスト問題なし |
サンプルプロンプト(高品質結果確認済み)
モデルページから(BFL 例):
A vibrant hummingbird mid-flight sipping nectar from a bright pink hibiscus
flower, iridescent emerald and sapphire feathers catching the morning sun,
soft bokeh tropical garden background, macro photography, razor-sharp
detail, cinematic lighting
プロダクト写真パターン:
A matte ceramic mug on a reclaimed-wood table, soft northern window light
from the left, shallow depth of field, 50mm prime, f/2.0, neutral
background, e-commerce ready, 4K product photography
ブランド一貫ペア(マルチリファレンス):
Same composition and lighting as the reference image, but the bottle
label is now blue with white sans-serif typography reading "AURA";
keep the bottle silhouette, table, and shadow exactly as in the reference
制限事項
- 解像度上限約 2K — より高いネイティブ解像度については、Seedream 5 にルーティングしてください。
- アスペクト比上限 16:9 — 極度のワイド/トール比はクロップされます。
- プロンプト上限約 512 トークン — より長いと品質低下;優雅に切り詰めません。
- リファレンス画像上限 4 — 4 以上でレイテンシ増加とガイダンス希薄化。
- テキストレンダリング — 8B Qwen3 エンベッダは助けになりますが GPT Image 2 は埋め込みテキスト精度ではまだ優位です。
終了コード
runcomfy CLI は sysexits 形式コードを使用:
| コード | 意味 |
|---|---|
| 0 | 成功 |
| 64 | CLI 引数が不正 |
| 65 | 入力 JSON / スキーマ不一致(例:width: 4096 で 422 エラー) |
| 69 | アップストリーム 5xx |
| 75 | 再試行可能:タイムアウト / 429 |
| 77 | 未サインインまたはトークン拒否 |
完全リファレンス: docs.runcomfy.com/cli/troubleshooting.
動作原理
- スキルは JSON ボディでスキーマにマッチさせ、
runcomfy run blackforestlabs/flux-2-klein/<variant>/text-to-imageを呼び出します。 - CLI が user のベアラートークン付きで
https://model-api.runcomfy.net/v1/models/blackforestlabs/flux-2-klein/<variant>/text-to-imageに POST します。 - Model API は
request_idを返します;CLI はGET .../requests/<id>/statusを 2 秒ごとにポーリングします。 - 終了ステータスで、CLI は
GET .../requests/<id>/resultを取得し、ホストが.runcomfy.netまたは.runcomfy.comで終わる URL を--output-dirにダウンロードします。その他の URL はリストされますがフェッチされません。 - ポーリング中の
Ctrl-CでPOST .../requests/<id>/cancelを送信し、停止した GPU に課金されません。
このスキルではないもの
セルフホスト型 Flux ランナーではありません。権限付与ではなく、動作する RunComfy アカウントが必要です。マルチテナントではありません。
セキュリティ & プライバシー
- トークンストレージ:
runcomfy loginは API トークンを~/.config/runcomfy/token.jsonにモード 0600(所有者のみ読み書き)で書き込みます。CI / コンテナ内でファイル全体をバイパスするにはRUNCOMFY_TOKEN環境変数を設定してください。 - 入力境界: ユーザープロンプトは
--input経由で JSON 文字列として CLI に渡されます。CLI はプロンプトをシェル展開せず;JSON ボディを直接 HTTPS 経由で Model API に送信します。プロンプト内容からのシェルインジェクション表面ありません。 - サードパーティコンテンツ: 渡す画像 / マスク / ビデオ URL は、CLI ではなく RunComfy モデルサーバーでフェッチされます。外部 URL を信頼できないものとして扱ってください;画像ベースのプロンプトインジェクションは画像編集 / ビデオ編集モデルの既知リスクです。
- アウトバウンドエンドポイント:
model-api.runcomfy.net(リクエスト投入)と*.runcomfy.net/*.runcomfy.com(生成出力用ダウンロードホワイトリスト)のみ。テレメトリ、コールバックなし。 - 生成ファイルサイズ上限: CLI は 2 GiB を超える単一ダウンロードを中止し、悪意ある、またはランナウェイモデル出力からのディスク満杯を防ぎます。
ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ
詳細情報
- 作者
- agentspace-so
- ライセンス
- MIT
- 最終更新
- 不明
Source: https://github.com/agentspace-so/runcomfy-agent-skills / ライセンス: MIT
関連スキル
agent-browser
AI エージェント向けのブラウザ自動化 CLI です。ウェブサイトとの対話が必要な場合に使用します。ページ遷移、フォーム入力、ボタンクリック、スクリーンショット取得、データ抽出、ウェブアプリのテスト、ブラウザ操作の自動化など、あらゆるブラウザタスクに対応できます。「ウェブサイトを開く」「フォームに記入する」「ボタンをクリックする」「スクリーンショットを取得する」「ページからデータを抽出する」「このウェブアプリをテストする」「サイトにログインする」「ブラウザ操作を自動化する」といった要求や、プログラマティックなウェブ操作が必要なタスクで起動します。
anyskill
AnySkill — あなたのプライベート・スキルクラウド。GitHubを基盤としたリポジトリからエージェントスキルを管理、同期、動的にロードできます。自然言語でクラウドスキルを検索し、オンデマンドでプロンプトを自動ロード、カスタムスキルのアップロードと共有、スキルバンドルの一括インストールが可能です。OpenClaw、Antigravity、Claude Code、Cursorに対応しています。
engram
AIエージェント向けの永続的なメモリシステムです。バグ修正、意思決定、発見、設定変更の後はmem_saveを使用してください。ユーザーが「覚えている」「記憶している」と言及した場合、または以前のセッションと重複する作業を開始する際はmem_searchを使用します。セッション終了前にmem_session_summaryを使用して、コンテキストを保持してください。
skyvern
AI駆動のブラウザ自動化により、任意のウェブサイトを自動化できます。フォーム入力、データ抽出、ファイルダウンロード、ログイン、複数ステップのワークフロー実行など、ユーザーがウェブサイトと連携する必要があるときに使用します。Skyvernは、LLMとコンピュータビジョンを活用して、未知のサイトも自動操作可能です。Python SDK、TypeScript SDK、REST API、MCPサーバー、またはCLIを通じて統合できます。
pinchbench
PinchBenchベンチマークを実行して、OpenClawエージェントの実世界タスクにおけるパフォーマンスを評価できます。モデルの機能テスト、モデル間の比較、ベンチマーク結果のリーダーボード提出、またはOpenClawのセットアップがカレンダー、メール、リサーチ、コーディング、複数ステップのワークフローにどの程度対応しているかを確認する際に使用します。
openui
OpenUIとOpenUI Langを使用してジェネレーティブUIアプリを構築できます。これらはLLM生成インターフェースのためのトークン効率的なオープン標準です。OpenUI、@openuidev、ジェネレーティブUI、LLMからのストリーミングUI、AI向けコンポーネントライブラリ、またはjson-render/A2UIの置き換えについて述べる際に使用します。スキャフォルディング、defineComponent、システムプロンプト、Renderer、およびOpenUI Lang出力のデバッグに対応しています。