happyhorse-1-0
RunComfy上でHappyHorse 1.0を使用してテキストからビデオを生成します。HappyHorse 1.0はArtificial Analysis Video Arenaで1位を獲得しており、ネイティブ1080p・音声同期・複数ショットでのキャラクター一貫性・6言語プロンプト対応などの強みを持ち、尺・アスペクト比・解像度の設定スキーマや、Wan 2.7 / Seedance 2 / LTX 2への切り替え判断基準も網羅しています。「happyhorse」「happy horse」「happyhorse 1.0」などのキーワード、またはこのモデルでの動画生成リクエストをトリガーに、ローカルのRunComfy CLIを通じて`runcomfy run happyhorse/happyhorse-1-0/text-to-video`を実行します。
description の原文を見る
> Generate text-to-video with HappyHorse 1.0 on RunComfy. Documents HappyHorse 1.0's strengths (#1 on Artificial Analysis Video Arena, native 1080p with in-pass synchronized audio, multi-shot character consistency, 6-language prompt support), the duration / aspect-ratio / resolution schema, and when to route to Wan 2.7 / Seedance 2 / LTX 2 instead. Calls `runcomfy run happyhorse/happyhorse-1-0/text-to-video` through the local RunComfy CLI. Triggers on "happyhorse", "happy horse", "happyhorse 1.0", "happyhorse video", or any explicit ask to generate video with this model.
SKILL.md 本文
HappyHorse 1.0 — Pro Pack on RunComfy
runcomfy.com · Text-to-video · GitHub
HappyHorse 1.0 — 現在 Artificial Analysis Video Arena で #1(Elo 1333 t2v / 1392 i2v)— RunComfy Model API でホストされています。ネイティブ 1080p ビデオに インパス同期オーディオ(ダイアログ、環境音、Foley)と複数ショットのキャラクター一貫性があります。
npx skills add agentspace-so/runcomfy-skills --skill happyhorse-1-0 -g
このモデルを選ぶべき場合(兄弟モデルとの比較)
| ご要望 | 選択肢 |
|---|---|
| キャラクター / 衣装一貫性のある複数ショットストーリー | HappyHorse 1.0 |
| 同じ生成パスでネイティブオーディオ | HappyHorse 1.0 |
| 現在 #1 のブラインド投票ビデオモデル | HappyHorse 1.0 |
| 詳細なリップシンク済みダイアログ + 参考ビデオ | Seedance 2.0 Pro |
| 細かいモーション制御 + 複数参考条件付け | Wan 2.7 |
| 超高速イテレーション(フレームあたり 1 秒未満) | LTX 2 |
| 既存映像のシネマティック モーション編集 | Kling Video O1 |
ユーザーが明示的に「HappyHorse」「happy horse video」と言った場合は、関係なくここにルーティングしてください。
前提条件
- RunComfy CLI —
npm i -g @runcomfy/cli - RunComfy アカウント —
runcomfy loginがブラウザデバイスコードフローを開きます。 - CI / コンテナ —
RUNCOMFY_TOKEN=<token>を代わりに設定してください。
エンドポイント + 入力スキーマ
happyhorse/happyhorse-1-0/text-to-video
| フィールド | 型 | 必須 | デフォルト | 注記 |
|---|---|---|---|---|
prompt | string | はい | — | 最大 2,500 文字。6 言語対応(CN/EN/JP/KR/DE/FR)。 |
aspect_ratio | enum | いいえ | 16:9 | 16:9、9:16、1:1、4:3、3:4 のみ。 |
resolution | enum | いいえ | 1080P | 720P または 1080P。 |
duration | int | いいえ | 5 | 3~15 秒。 |
seed | int | いいえ | 0 | 0..2^31-1。バリエーション比較に再利用可能。 |
watermark | bool | いいえ | true | プロバイダーのウォーターマーク。 |
呼び出し方法
デフォルト(16:9 1080p 5s):
runcomfy run happyhorse/happyhorse-1-0/text-to-video \
--input '{"prompt": "<user prompt>"}' \
--output-dir <absolute/path>
垂直ショート(9:16、8s、ウォーターマークなし):
runcomfy run happyhorse/happyhorse-1-0/text-to-video \
--input '{
"prompt": "<user prompt>",
"aspect_ratio": "9:16",
"duration": 8,
"watermark": false
}' \
--output-dir <absolute/path>
低コストテストパス(720p):
runcomfy run happyhorse/happyhorse-1-0/text-to-video \
--input '{"prompt": "<user prompt>", "resolution": "720P", "duration": 3}' \
--output-dir <absolute/path>
CLI は送信し、ターミナルまで 2 秒ごとにポーリングし、結果から *.runcomfy.net / *.runcomfy.com URL を --output-dir にダウンロードします。標準出力は結果 JSON です。標準エラーは進行状況です。
プロンプティング — 実際に機能する方法
静止画ではなく、時間経過に伴うモーションを説明します。 「女性が窓から振り向き、2 歩デスクへ歩き、カップを拾い、顔に持ち上げ、一口飲む」は「女性がコーヒーを飲んでいる」より優れています。
カメラ + ショットを平易な英語で。 ショットを前置きしてください:"Wide shot. ..."/"Tracking shot. ..."/"Locked tripod, low angle. ..." は実際のディレクティブとして機能します。レンズの雰囲気を指定してください:"35mm anamorphic"、"shallow DOF"、"crushed shadows"。
イテレーション時に 1 つのビジュアルビート。 「彼女が歩き、犬が走り、車が通過する」と積み重ねないでください。ビートを選んで、それをシャープにしてから、複数ショットプロンプトで層を重ねてください。
複数ショット一貫性 — 2 つのビートを説明する際、各ショットでアンカーを繰り返してください:"Shot 1: 赤いウールコートと青いスカーフを着た背の高い女性が雨の路地で。Shot 2: 赤いコート/青いスカーフを着た同じ女性、今は軒下に身をかがめている。" HappyHorse は外見を保持しますが、アンカーが必要です。
オーディオディレクション — 聞きたいことを言ってください:"遠い寺の鐘、湿った舗装の上の足音、ダイアログなし" または "温かみのある親しみやすいトーン、英語"。
アンチパターン:
- 静止フレーム説明(時間動詞がない)→ モーションは曖昧になります。
- 競合するスタイル方向 → キャンセルされます。
- 2500 文字を超えるプロンプト → 品質が低下します。
- サポートされている 5 つ以外のアスペクト比 → 422 エラー。
活躍する場面
| ユースケース | HappyHorse 1.0 が選ばれる理由 |
|---|---|
| 1 つの一貫したキャラクターを持つ複数ショットブランドストーリー | ネイティブなショット間アイデンティティ保存 |
| クリップ内ボイスオーバー + 環境音が必要な話し手説明者 | 同じパスでの同期オーディオ |
| 多言語短編動画広告 | 6 言語プロンプト、スクリプト品質低下なし |
| シネマティック 1080p 配信 | ネイティブ 1080p 出力、放送品質 |
| 一般的なビデオ品質のブラインド投票リーダー | Artificial Analysis Video Arena で #1 |
サンプルプロンプト(強い結果が確認されています)
モデルページから(シネマティック スコープ):
Wide shot. A lone astronaut in dusty orange suit with blue-gray harness
skis across lunar plain, leaving parallel tracks in gray regolith.
Mid-stride, poles planted, pushing in 1/6th gravity with subtle upward
drift. Fine dust haze along ski tracks. Crescent Earth above lunar
horizon, blue-white glow against black sky. Raw sunlight, crushed
shadows, no fill. 8K photorealistic.
複数ショット一貫性:
Shot 1: Medium close-up. A woman in a navy trench coat enters a
rain-slick neon-lit Tokyo alley, looks left, holds up an umbrella.
Shot 2: Same woman in same navy trench, now under the awning of a
ramen shop, shaking water off the umbrella. Warm interior glow, soft
chatter, gentle rain on metal roof in the audio.
垂直プラットフォームネイティブ:
9:16 vertical short. A barista in a black apron pulls a single
espresso shot, steam rising into the morning sun, rich crema slowly
forming. Close-up handheld, shallow DOF, warm cafe ambience and the
hiss of the steam wand.
制限事項
- 期間上限 15 秒 — より長いナレーティブの場合、複数ショットプロンプトに分割して継ぎ合わせてください。
- アスペクト比 — ドキュメント済みの 5 つの値のみ。超ワイドシネマティックはクロップされるか拒否されます。
- オーディオはインパスのみ — 外部オーディオを渡してリップシンクを駆動することはできません。オーディオ駆動リップシンク用には、Wan 2.7(
audio_urlを受け取る)または Seedance 2.0 Pro を使用してください。 - このテンプレートに無料の画像からビデオへの変換はありません — i2v は HappyHorse でサポートされており、別のパイプライン経由です。ここの t2v エンドポイントはテキストのみです。
終了コード
runcomfy CLI は sysexits スタイルのコードを使用します:
| コード | 意味 |
|---|---|
| 0 | 成功 |
| 64 | 不正な CLI 引数 |
| 65 | 不正な入力 JSON / スキーマ不一致(例:duration: 30 は 422 になります) |
| 69 | アップストリーム 5xx |
| 75 | 再試行可能:タイムアウト / 429 |
| 77 | サインインしていないか、トークンが拒否されました |
完全なリファレンス:docs.runcomfy.com/cli/troubleshooting。
動作方法
- このスキルは
runcomfy run happyhorse/happyhorse-1-0/text-to-videoをスキーマと一致する JSON 本文で呼び出します。 - CLI は
https://model-api.runcomfy.net/v1/models/happyhorse/happyhorse-1-0/text-to-videoにユーザーのベアラートークンを使用して POST します。 - Model API は
request_idを返し、CLI は 2 秒ごとGET .../requests/<id>/statusをポーリングします。 - ターミナルステータス時、CLI は
GET .../requests/<id>/resultを取得し、ホストが.runcomfy.netまたは.runcomfy.comで終わる URL を--output-dirにダウンロードします。他の URL はリストされますがフェッチされません。 - ポーリング中に
Ctrl-Cを押すと、POST .../requests/<id>/cancelが送信され、停止した GPU の料金が請求されないようにします。
このスキルではないもの
自ホスト型ビデオランナーではありません。機能許可ではありません — 機能するRunComfy アカウントが必要です。
セキュリティ & プライバシー
- トークンストレージ:
runcomfy loginは API トークンを~/.config/runcomfy/token.jsonにモード 0600(所有者のみ読み取り/書き込み)で書き込みます。CI / コンテナでファイルをバイパスするにはRUNCOMFY_TOKEN環境変数を設定してください。 - 入力境界: ユーザープロンプトは JSON 文字列として CLI に
--input経由で渡されます。CLI はプロンプトをシェル展開しません。JSON 本文を HTTPS 経由で直接 Model API に送信します。プロンプトコンテンツからのシェルインジェクション表面はありません。 - サードパーティコンテンツ: 渡す画像 / マスク / ビデオ URL は、CLI がマシン上で取得するのではなく、RunComfy モデルサーバーで取得されます。外部 URL を信頼されていないものとして扱う。画像ベースのプロンプトインジェクションは、画像編集 / ビデオ編集モデルの既知のリスクです。
- アウトバウンドエンドポイント:
model-api.runcomfy.net(リクエスト送信)および*.runcomfy.net/*.runcomfy.com(生成出力のダウンロードホワイトリスト)のみ。テレメトリやコールバックなし。 - 生成ファイルサイズ上限: CLI は 2 GiB を超える単一ダウンロードを中止し、悪意のあるまたは暴走モデル出力からのディスク満杯を防ぎます。
ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ
詳細情報
- 作者
- agentspace-so
- ライセンス
- MIT
- 最終更新
- 不明
Source: https://github.com/agentspace-so/runcomfy-agent-skills / ライセンス: MIT
関連スキル
agent-browser
AI エージェント向けのブラウザ自動化 CLI です。ウェブサイトとの対話が必要な場合に使用します。ページ遷移、フォーム入力、ボタンクリック、スクリーンショット取得、データ抽出、ウェブアプリのテスト、ブラウザ操作の自動化など、あらゆるブラウザタスクに対応できます。「ウェブサイトを開く」「フォームに記入する」「ボタンをクリックする」「スクリーンショットを取得する」「ページからデータを抽出する」「このウェブアプリをテストする」「サイトにログインする」「ブラウザ操作を自動化する」といった要求や、プログラマティックなウェブ操作が必要なタスクで起動します。
anyskill
AnySkill — あなたのプライベート・スキルクラウド。GitHubを基盤としたリポジトリからエージェントスキルを管理、同期、動的にロードできます。自然言語でクラウドスキルを検索し、オンデマンドでプロンプトを自動ロード、カスタムスキルのアップロードと共有、スキルバンドルの一括インストールが可能です。OpenClaw、Antigravity、Claude Code、Cursorに対応しています。
engram
AIエージェント向けの永続的なメモリシステムです。バグ修正、意思決定、発見、設定変更の後はmem_saveを使用してください。ユーザーが「覚えている」「記憶している」と言及した場合、または以前のセッションと重複する作業を開始する際はmem_searchを使用します。セッション終了前にmem_session_summaryを使用して、コンテキストを保持してください。
skyvern
AI駆動のブラウザ自動化により、任意のウェブサイトを自動化できます。フォーム入力、データ抽出、ファイルダウンロード、ログイン、複数ステップのワークフロー実行など、ユーザーがウェブサイトと連携する必要があるときに使用します。Skyvernは、LLMとコンピュータビジョンを活用して、未知のサイトも自動操作可能です。Python SDK、TypeScript SDK、REST API、MCPサーバー、またはCLIを通じて統合できます。
pinchbench
PinchBenchベンチマークを実行して、OpenClawエージェントの実世界タスクにおけるパフォーマンスを評価できます。モデルの機能テスト、モデル間の比較、ベンチマーク結果のリーダーボード提出、またはOpenClawのセットアップがカレンダー、メール、リサーチ、コーディング、複数ステップのワークフローにどの程度対応しているかを確認する際に使用します。
openui
OpenUIとOpenUI Langを使用してジェネレーティブUIアプリを構築できます。これらはLLM生成インターフェースのためのトークン効率的なオープン標準です。OpenUI、@openuidev、ジェネレーティブUI、LLMからのストリーミングUI、AI向けコンポーネントライブラリ、またはjson-render/A2UIの置き換えについて述べる際に使用します。スキャフォルディング、defineComponent、システムプロンプト、Renderer、およびOpenUI Lang出力のデバッグに対応しています。