higgsfield-prompt
Higgsfield AIプロンプトの構築、作成、改善、構造化を行う際に使用します。MCSLA式、プロンプト構造、ナラティブ形式とタイムスタンプ形式、テキスト・トゥ・ビデオおよび画像・トゥ・ビデオワークフローの両方に対応した記述方法をカバーしています。
description の原文を見る
Use when building, writing, refining, or structuring a Higgsfield AI prompt. Covers the MCSLA formula, prompt structure, narrative vs. timestamped formats, and how to write for both text-to-video and image-to-video workflows.
SKILL.md 本文
Higgsfield プロンプト エンジニアリング
MCSLA フォーミュラ
高性能な Higgsfield プロンプトはすべて 5 つのレイヤーで構成されています。これをシネマトグラファーのチェックリストと考えてください。各レイヤーを埋めれば、モデルは必要なすべての情報を得られます。
| 文字 | 要素 | 説明 | 例 |
|---|---|---|---|
| M | Model | どの生成エンジンを使用するか | "Use Kling 2.6" |
| C | Camera | 名前付きカメラコントロール | "FPV Drone shot weaving through the alley" |
| S | Subject | 誰/何 + 外観 | "A woman in a sand-colored suit, sharp eyes" |
| L | Look | スタイル + 色 + ライティング | "Cinematic, golden hour, anamorphic flare" |
| A | Action | シーン内で何が起こるか | "She turns slowly, wind lifting her coat" |
プロンプトタイプ
テキスト・トゥ・ビデオ (T2V)
何もない状態から始まります。シーン全体を一から説明します。 最適な用途:シーンの確立、抽象的な概念、特定のキャラクターがいない環境。
[Subject + appearance].
[Environment — location, time, weather, atmosphere].
[Action — what happens and how].
[Camera — named control].
[Look — style + color grade].
例:
A lone astronaut stands on the surface of a red desert planet, helmet visor reflecting
twin moons rising on the horizon. Dust spirals slowly in the thin atmosphere.
She turns to face the camera, gloved hand raised in a slow salute.
Camera: slow Crane Up revealing the vast emptiness behind her.
Style: Cinematic, desaturated orange and deep blue, 2.35:1 anamorphic.
画像・トゥ・ビデオ (I2V)
提供されたスチル画像をアニメーション化します。画像は開始フレームを定義します。 最適な用途:キャラクターの一貫性、製品ショット、ポートレートアニメーション、ストーリーボードの実現。
[Reference the input image as the first frame].
[Describe what should move, change, or animate — not what is already visible].
[Camera — named control].
[Style/atmosphere cues].
例:
Starting from the provided image as the first frame.
The woman's hair lifts gently in the wind. She blinks slowly and turns her gaze
slightly to the left, a faint smile forming.
Camera: subtle Dolly In toward her face.
Style: Cinematic, warm afternoon light, shallow depth of field.
I2V の重要ルール: 画像に既に存在するものを説明し直さないでください。変わるまたはアニメーション化すべきものだけを説明してください。静的な要素を過度に説明すると、モデルが混乱します。これは Seedance/Cinema Studio 3.0 の @ Image参照にも同等に適用されます。既に見えているものは説明せず、モーションとカメラムーブメントだけを説明してください。
ナラティブ構造
流動的なナラティブ(ほとんどのユースケースで推奨)
シーンを継続的なアクションとして書きます。タイムスタンプはありません。Higgsfield にとって最も自然です。
A detective pushes open the door to the rain-soaked rooftop, coat whipping in the wind.
She steps to the edge and looks down at the city below — a thousand lights blurring
through the downpour. Camera dollies slowly behind her, then cranes up to reveal the
skyline. Cinematic style, cold blue tones, 16:9.
タイムスタンプ付き(正確なマルチビート シーケンスでのみ使用)
個別のアクションのタイミングが正確に重要な場合にのみ使用します。例えば、変身、マルチフェーズのアクションシーケンス、またはビート同期のミュージックビデオ。Cinema Studio 3.0 のカスタムマルチショットモードにマッピングされます。
0–3s: Wide establishing shot. The fighter stands alone in the ring, chest heaving.
3–6s: Crash Zoom In on his face. Sweat on his brow, jaw clenched.
6–10s: 360 Orbit as he raises his fists. Crowd noise rises.
高パフォーマンスプロンプト パターン
ビデオプロンプティングの #1 の間違い: 外観の過剰説明と行動の過少説明です。被写体に何かをすることを与えてください。見える行動を作成する内部状態を与えてください。モーションまたは意図を説明する動詞は、形容詞より重要です。
一般性より具体性:
- ❌ "the camera moves dramatically"
- ✅ "camera Dolly Zoom In — subject stays the same size as the background rushes forward"
能動的な動詞がシーンを推進します:
- ❌ "a woman is in an alley"
- ✅ "a woman darts through a rain-soaked alley, coat flapping, boots splashing"
カメラコントロールに名前をつけます: Higgsfield は独自のプリセット名を理解しています。常に明示的に使用してください。
- ❌ "the camera slowly circles"
- ✅ "360 Orbit around the subject"
被写体から始めて、スタイルで終わります: Subject → Action → Camera → Style の順序が最も信頼性があります。
200 語以下に保ちます: 集中したプロンプトは詳細なものより優れています。1 つの明確な意図 > 10 の曖昧な詳細。
Cinema Studio: 512 文字以下に保ちます: Cinema Studio には、プロンプトに対するハード512文字制限があります(2.5 と 3.0 の両方)。
- 2.5: @ Element チップは ~80–100 の隠れた文字を消費します。2 つの @ タグで、表示テキストを ~250 字以下に保ちます。
- 3.0: @ 参照(画像/ビデオ/オーディオ)はインラインメタデータではなくメディアアタッチメントです。隠れたスペースの消費が少なくなります。参照付きで表示テキストを ~350–400 字、参照なしで ~450–500 字に保ちます。 Cinema Studio スキルで完全な文字予算の詳細を参照してください。
プリプロンプト チェックリスト
プロンプトを書く前に、これら 5 つの質問に答えてください。「何か映画的なものをくれ」のような曖昧なプロンプトは AI に何も伝えません。
| 質問 | 指定すること |
|---|---|
| 誰? | 被写体 + 外観(例:"a man in a leather jacket") |
| どこで? | 環境 + 雰囲気(例:"in a narrow aircraft galley, cold blue light") |
| 何が起きているか? | 1 つのプライマリアクション(例:"punches his opponent") |
| カメラムーブメント? | 名前付きプリセット(例:"Handheld")または Cinema Studio Director Panel |
| ムード/ジャンル? | スタイル + カラーグレード、または Cinema Studio ジャンル選択 |
1 シーンあたり 1 つのアクション
AI モデルは現実の物理を複製できます。ただし、同時に複数の複雑なアクションを要求すると、モデルが過負荷になります。
ルール: 1 クリップあたり 1 つのプライマリアクション、最大 1–2 つのセカンダリアクション。
複雑なシーケンスを別々のショットに分割して、ビデオエディタでつなぎます。または、Multi-Shot Manual モード を使用して各シーンを個別にプロンプトします。
高速モーショントリック: 高速モーションが変形し続けたり壊れたりする場合、まず Slow Mo でシーンを生成し、その後 post(CapCut、Premiere、DaVinci)で高速化します。モデルは低速モーションでより清潔な物理を描画します。
身元 vs. モーションの分離ルール
プロンプトに Soul ID または複数のショット全体で一貫している必要があるキャラクターが含まれる場合、常に出力を 2 つの明確にラベルされたブロックに分割します:
Identity Block — 静的な視覚記述子のみ
- 顔の特徴、肌のトーン、体型、特徴的なマーク
- 衣服、アクセサリー、カラーパレット
- モーションなし、カメラなし、時間言語なし
Motion Block — 時間的およびカメラのみ
- カメラムーブメント、アクション振付、速度
- 環境モーション、大気の変化
- キャラクターの外観の繰り返しなし
悪い例(混合)— 身元がドリフトする:
A woman with sharp cheekbones and auburn hair in a blue trench coat runs through
a rain-soaked alley, her coat flapping, sharp cheekbones catching the neon light,
camera chasing her at full speed, her auburn hair streaming behind her.
良い例(分離)— 身元がロックされたまま:
Identity Block:
The Soul ID character — sharp cheekbones, auburn hair shoulder-length,
wearing a blue trench coat with silver buttons, lean athletic build.
Motion Block:
She runs through a rain-soaked alley, coat flapping behind her.
Camera: Action Run — low behind, matching pace.
Neon reflections streak across wet concrete.
Style: Cinematic, cold blue shadows, warm neon accents. 16:9.
このルールを適用する場合:
- Soul ID がアクティブな場合は常に
- 同じキャラクターが表示されるマルチショットシーケンスでは常に
- カメラムーブメントがキャラクターと一緒に関与する場合は常に
- Cinema Studio では、身元は @ Element 定義に入り、モーションはプロンプトに入ります
よくあるプロンプトの間違い
| 間違い | 修正 |
|---|---|
| I2V で画像を再説明する | 変わる/動く部分だけを説明 |
| 一般的なカメラ言語 | 正確なプリセット名を使用 |
| スタイルが指定されていない | 常に視覚的スタイル + カラーグレードを含める |
| 1 つのショットに多すぎるアクション | 個別に生成してチェーンする |
| 矛盾したムーブメント | 同じショットで Dolly In + Dolly Out を組み合わせない |
| プロンプトが 512 字を超える(Cinema Studio) | テキストを削減、@ タグを削減、代名詞を使用 |
| アクション前の影響を説明する | アクションだけを説明し、AI に結果をレンダリングさせる |
| 特定の格闘技の動き | 名前付きの動きの代わりに一般的な格闘エネルギーを使用 |
| アクションシーンで複数の @ Elements | 静的シーンで @ を使用、アクションはプレーンテキスト |
| 1 つのブロックで身元 + モーションを混ぜる | Identity Block + Motion Block に分離(上記参照) |
ネガティブ制約: 回避する成果物(浮いた四肢、顔の歪み、ちらつくテクスチャなど)と、それらを防ぐプロンプト表現の包括的なリストについては、
../shared/negative-constraints.mdを参照してください。常にプロンプトタイプの関連カテゴリを確認してください。
イテレーション ルール — 一度に 1 つの変数を変更
プロンプトが近いが正確ではなく、再生成しようとしている場合は、試行ごとに正確に 1 つの変数を変更してください。被写体の詳細、構図、モーション動作、ライティング、またはスタイル。正しくないもの 1 つを選び、それだけを変更し、再生成します。
重要な理由: 2 つの変数を変更して結果が改善された場合、どの変更が改善をもたらしたかわかりません。結果が低下した場合、どの変更が問題を引き起こしたかわかりません。どちらの場合も、生成を費やしており、プロンプトについて何も学んでいません。単一変数イテレーションは、すべての再生成に明確な因果関係シグナルを与えます。機能するものを保持し、機能しないものを削除し、正しいプロンプトに素早く収束します。
例外: プロンプトがロックされ、純粋にスタイル探索をしている場合(例えば、既に承認されたシーンの 5 つのライティングバリアント)、変更をバッチ処理することは問題ありません。ルールは改善中に適用され、ファンアウト中ではありません。
ワークフロー:
- ベースラインを生成します。
- 何が間違っているか識別します。1 つの具体的なことを選びます。
- プロンプトでその変数だけを変更し、他はすべてそのまま残します。
- 再生成します。
- ベースラインと比較します。対象の変更は期待通りに結果を動かしましたか?
- その変更をロックします。次の問題を識別します。繰り返します。
「すべてを一度に修正する」必要があると感じたら、立ち止まって、どの修正が最も重要かを尋ねてください。その 1 つがこの再生成に入ります。残りは番を待ちます。
何が間違っているかまだわからない場合 — 6-Pass Diagnostic Sequence
上記のイテレーション ルールは、変更する 1 つの変数を特定できることを前提としています。できない場合(プロンプトがぼんやりと間違った出力を生成し、理由を名付けることができない場合)、6-Pass Diagnostic Sequence を実行して検出します。各パスは 1 つの変数を分離し、順番に、移動する前にテストします。
順序は任意ではありません。被写体とアクションは最も重い トークンウェイト(早期プロンプト配置)を持ちます。カメラとスタイルは次に来ます。オーディオと出力コントロールは周辺に位置します。この順序で診断すると、最もレバレッジが高い問題が最初に表示され、本当の問題が 3 層上の被写体説明にある場合のスタイルパス修正の追求を防ぎます。
| パス | 変数 | 質問 |
|---|---|---|
| 1 | Subject | キャラクター/オブジェクト/焦点要素は明確に説明されていますか? |
| 2 | Action | アクションは具体的な(物理ベース)で、ショットに対して単数ですか? |
| 3 | Camera | カメラムーブメントは名前付き(Director Panel プリセットまたは特定の動詞)で、暗黙ではありませんか? |
| 4 | Style | ルックはアンカー(パレット、グレード、レンズ、ライティング)で、形容詞のみではありませんか? |
| 5 | Audio | オーディオが出力の一部である場合、具体的な音を含む平行トラックとして説明されていますか? |
| 6 | Output | アスペクト比、期間、解像度は、ショットのニーズに応じて意図的に設定されていますか? |
使い方: パス 1 から始めます。被写体を鋭くしたときに結果が改善された場合、変数が見つかりました。イテレーション ルール ループに戻り、続けます。パス 1 が結果を動かさない場合、被写体をロックし、パス 2 に進めなど。シーケンスはファインダーであり、改善ループではありません。どの変数が間違っているかわかったら、イテレーション ルールが引き継ぎます。
すべての 6 パスを盲目的に実行しないでください。 6 回の再生成は 6 クレジットかかります。シーケンスの価値は順序です。早期プロンプトトークンが支配するため、ほとんどのプロンプト失敗はパス 1 またはパス 2 に置かれます。パス 4 に到達してもまだ結果を動かしていない場合、プロンプトはイテレーションではなく構造的な書き直しが必要な可能性があります。
Seedance 2.0 プロンプティング ベストプラクティス
これらのベストプラクティスは、Cinema Studio 3.0 の生成エンジン(Business/Team プラン)に適用され、上記の MCSLA フォーミュラを補完します。これは置き換えではありません。MCSLA をプライマリフレームワークとして使用し、次にこれらの改善を適用します。
MCSLA の上に位置するユーザーインテント層(実行中のワーキングモード(Exploration / Continuation / Bridging / Repair)と各モードが Seedance のプロンプトモードをどのようにルーティングするか)については、
../higgsfield-seedance/SKILL.md§ Working Modes を参照してください。ワーキングモードとプロンプトモード間の曖昧さの排除は同じファイルにあり、すぐ上にあります。
正確さより意図
モデルに何が欲しいかとどのように感じるべきかを伝え、すべてのマイクロディテールを伝えません。短いプロンプト(30–100 語)は常に長いプロンプトより優れています。モデルは、描画エンジンではなく、コラボレートする AI ディレクターです。
Director's Formula → MCSLA マッピング
Director's Formula は MCSLA に直接マップします:
| Director's Formula | MCSLA Layer | 優先度 |
|---|---|---|
| Subject | S (Subject) | 最初の 20–30 語(早期トークンは大きな重みを持つ) |
| Action | A (Action) | 最初の 20–30 語 |
| Scene | — (Context) | サポート詳細 |
| Camera | C (Camera) | 被写体 + アクション後 |
| Style | L (Look) | カメラ後 |
| Constraints | — (Guardrails) | プロンプト末尾 |
主要な洞察: Subject + Action はすべてのプロンプトの最初の 20–30 語に表示される必要があります。早期トークンは生成エンジンで不均衡な重みを持ちます。
ジャンル ルーター — プロンプト長とリード・ウィズ・ターゲット
異なるジャンルはさまざまなプロンプト長とリード要素で最適に機能します:
| ジャンル | リードは | 対象長 | リード例 |
|---|---|---|---|
| Product / E-commerce | Subject | 30–50 字 | "A matte-black wireless earbud case rotates slowly on a marble pedestal..." |
| Lifestyle / Social | Action | 40–60 字 | "She reaches for the coffee mug, steam curling upward..." |
| Drama / Narrative | Scene | 60–100 字 | "Rain hammers a narrow Tokyo alley at 2 AM, neon signs reflecting in puddles..." |
| Music Video | Style | 50–80 字 | "Anamorphic flares, crushed blacks, 16mm grain..." |
| Landscape / Travel | Scene | 30–60 字 | "Dawn breaks over a volcanic ridge, mist pouring through the caldera..." |
| Commercial / Brand | Style | 40–70 字 | "Clean white studio, soft even lighting, product hero moment..." |
| Anime / Artistic | Style | 50–90 字 | "Cel-shaded lines, saturated palette, Studio Ghibli cloud physics..." |
アンチ・スロップ・ボキャブラリー
これらの言葉を削除します。情報をまったく追加せず、トークンを無駄にします:
| Slop Word | 置き換え |
|---|---|
| beautiful | (削除 — 具体的なビジュアルの代わりに説明) |
| stunning | (削除 — 何が印象的かを説明) |
| epic | large-scale, sweeping, towering |
| amazing | (削除 — 見せて、言わない) |
| dynamic | fast-tracking, whip-pan, handheld |
| energetic | sprinting, jumping, arms pumping |
| cinematic camera movement | slow dolly push / crane up / tracking shot |
| cool transition | match-cut / whip pan / smash cut |
物理言語
気分の言葉の代わりに、具体的な物理的結果を使用してください。モデルは観察可能で物理的なディテールに応答します:
"powerful punch"→fist connects, sweat flies off in slow motion, opponent's head snaps back"dramatic entrance"→door slams open, dust erupts from the frame, light floods the dark room"fast car"→tires spin, gravel sprays backward, chassis drops as acceleration kicks in
Degree Adverbs
モデルは画像だけから強度を推測できません。解釈をガイドするために副詞を使用します:
slowly, dramatically, violently, gently, frantically, deliberately, cautiously, explosively
例: "She turns slowly, eyes narrowing deliberately, then explosively lunges forward."
アクション向け 3 幕リズム
すべてのアクションプロンプトはこのアークに従う必要があります:
- Charge-up — 緊張が高まり、エネルギーが集まる
- Burst — アクションが爆発する
- Aftermath — 物理的結果が再生される
例: "The fighter plants her feet, fists clenching (charge-up). She throws a spinning kick that connects with the sandbag (burst). The bag swings violently, chain rattling, sand dust puffing from the seams (aftermath)."
ネガティブプロンプトなし
Cinema Studio 3.0 の生成エンジンはネガティブプロンプト構文をサポートしていません。「blur なし」や「shaky camera を避ける」と書かないでください。代わりに、正のコンストレイントを使用します。あなたが望むものを説明してください:
"no shaky camera"→locked-off static camera, no movement"no blur"→sharp focus throughout, deep depth of field"don't make it dark"→bright, evenly lit, overcast daylight
第一級要素としてのオーディオ
プロンプトでオーディオを個別に説明してください。BGM、アンビエント SFX、ダイアログは、デュアルチャネルステレオ生成を介して平行トラックとして処理されます:
A barista grinds coffee beans, pours steaming water over the filter.
Camera: tight close-up, slow dolly across the counter.
Style: warm tones, shallow depth of field.
Audio: the whir of the grinder, water bubbling through the filter,
ceramic mug placed on a wooden counter with a soft clink.
Soft jazz piano in the background, barely audible.
「frosted glass をスクラッチ、plush fabric のそよ風、acrylic への優しいタップ」のようなサウンドデザイン説明は、生成されたオーディオ出力に直接影響を与えます。
Seedance 2.0 シーン アーキタイプ ルーター
Seedance プロンプトを書く前に、シーンが適合するアーキタイプを特定します。アーキタイプはカメラの動作、空間ロジック、時間全体での変化を指定します。これは MCSLA の上のプランニングレイヤーです。最初にアーキタイプを選び、次に MCSLA に入力します。
アクション アーキタイプ
| アーキタイプ | カメラフォーカス | 空間ダイナミクス |
|---|---|---|
| Pursuit | 距離が閉じる/開く。フレーム内で追跡された先、その後ろの追跡者 | 経路が狭まる/開く |
| Duel | 優位な側でカメラが低い;優位は必ず交代する | ファイター位置を交換 |
| Impact | ビルドアップ遅い → ヒット速い → アフターマス遅い | 接触点 = センター |
Decision tree: Chase? → Pursuit. Two opponents trading advantage? → Duel. Single decisive contact moment? → Impact. None → default Duel.
Duel ルール: どちらかのサイドが 1 つ以上の連続したビートを支配することはありません。1 つのファイターが全体シーンを支配する場合、決闘ではなく一方的な襲撃として説明してください。
一般 アーキタイプ
| アーキタイプ | 変わること | カメラシグネチャ |
|---|---|---|
| Journey | 空間内の位置 — 道、飛行、歩行 | Tracking, aerial, traveling alongside. Landscapes pass. |
| Atmosphere | 何も変わらない — ムードが内容である。ガラスの雨、空の通り。 | Minimal movement. Slow push-in or static hold. Micro-changes carry all drama. |
| Reveal | 隠れている → 見える。ドアが開く、霧が晴れる、カメラが角を曲がる。 | Pan, crane, dolly reveal. Camera controls WHEN viewer sees the subject. |
Decision tree: Subject moves through space? → Journey. Something hidden becomes visible? → Reveal. Nothing changes, mood is the content? → Atmosphere. None → default Atmosphere.
ダイアログ アーキタイプ
| アーキタイプ | パワーダイナミクス | カメラシグネチャ |
|---|---|---|
| Confrontation | Shifting — both push. Dominance trades per exchange. | Tight OTS, camera crosses axis on power shift. |
| Interrogation | Asymmet |
ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ
詳細情報
- 作者
- OSideMedia
- ライセンス
- MIT
- 最終更新
- 2026/5/12
Source: https://github.com/OSideMedia/higgsfield-ai-prompt-skill / ライセンス: MIT