Agent Skills by ALSEL
Anthropic Claude音声・動画・メディア⭐ リポ 0品質スコア 50/100

minimax-music-gen

音楽・楽曲・オーディオトラックの生成を行いたいときに使用するスキルです。歌詞の作成、既存の歌詞からの楽曲化、ムードやシーンに合ったBGMの生成など、音楽制作に関わるあらゆるリクエストに対応します。既存ファイルの再生、音楽理論の質問、生成を伴わない楽曲レコメンドには使用しないでください。

description の原文を見る

> Use when user wants to generate music, songs, or audio tracks. Triggers on any request involving music creation, song writing, lyrics generation, audio production, or covers. Also triggers when user provides lyrics and wants them turned into a song, or describes a mood/scene and wants background music. Supports multilingual triggers — match equivalent phrases in any language. Do NOT use for music playback of existing files, music theory questions, or music recommendation without generation.

SKILL.md 本文

MiniMax Music Generation Skill

MiniMax Music API を使用して曲(ボーカル またはインストルメンタル)を生成します。2つの作成モードに対応しています:Basic(1文入力で曲が出力)およびAdvanced Control(歌詞編集、プロンプト調整、生成前計画)。

前提条件

  • mmx CLI(必須):音楽生成は mmx コマンドラインツールを使用します。

    インストール確認:

    command -v mmx && mmx --version || echo "mmx not found"
    

    インストール(Node.js が必要):

    npm install -g mmx-cli
    

    認証(初回のみ):

    mmx auth login --api-key <your-minimax-api-key>
    

    API キーは MiniMax Platform から取得できます。 認証情報は ~/.mmx/credentials.json に保存され、セッション間で永続化されます。

    確認:

    mmx quota show
    
  • オーディオプレイヤー(推奨):ローカル再生用に mpvffplay、または afplay(macOS 組み込み)。 mpv がインタラクティブコントロール用に推奨されています。

CLI ツール

このスキルはすべての音楽生成に mmx CLI を使用します:

  • 音楽生成mmx music generate — モデル:music-2.6-free

    • プロンプトから歌詞を自動生成する --lyrics-optimizer をサポート
    • インストルメンタルトラック用の --instrumental をサポート
    • ユーザー提供の歌詞用の --lyrics をサポート
    • 構造化パラメータ:--genre--mood--vocals--instruments--bpm--key--tempo--structure--references
  • カバーmmx music cover — モデル:music-cover-free

    • --audio-file <path> または --audio <url> を介してレファレンスオーディオを取得
    • --prompt でターゲットカバースタイルを説明

エージェントフラグ:エージェントから mmx を呼び出すときは常に --quiet --non-interactive を追加してください。

パイプライン

  • ボーカル:ユーザー説明 -> mmx music generate --lyrics-optimizer -> MP3
  • インストルメンタル:ユーザー説明 -> mmx music generate --instrumental -> MP3
  • カバー:ソースオーディオ + スタイル -> mmx music cover -> MP3

ストレージ

生成されたすべての音楽は ~/Music/minimax-gen/ に保存されます。ディレクトリが存在しない場合は作成してください。ファイルはタイムスタンプとプロンプトから派生した短いスラッグで名付けられます: YYYYMMDD_HHMMSS_<slug>.mp3


言語とインタラクション

ユーザーの最初のメッセージから言語を検出し、セッション全体でその言語で応答してください。これはすべてのインタラクションテキスト、質問、確認、およびフィードバックプロンプトに適用されます。

ユーザー向けテキストのローカライズルール

  • プレビューラベル、フィールド名、確認、ステータスメッセージ、再生情報、フィードバックプロンプト、およびプロンプト/説明プレビューを含む、ユーザーに表示されるすべてのテキストは、ユーザーの言語に完全に翻訳する必要があります。
  • API に送信されるプロンプトは、最高の生成品質のため常に英語で作成する必要があります。ただし、ユーザーにプロンプトをプレビューする際には、生の英語プロンプトではなく、ユーザーの言語でローカライズされた説明を表示します。英語のプロンプトは内部実装の詳細であり、ユーザーは見る必要がありません。
  • 以下のテンプレートは参考として英語で記述されています。実行時には、すべてのラベルとメッセージをユーザーの検出された言語に翻訳してください。

歌詞言語ルール

  • デフォルトの歌詞言語 = ユーザーの言語。中国語を話すユーザーは中国語の歌詞を取得し、英語を話すユーザーは英語の歌詞を取得します。
  • ユーザーが明示的にリクエストした場合のみ、別の言語で歌詞を生成してください。
  • 別の歌詞言語が必要な場合は、それをボーカル説明またはジャンル説明に自然に埋め込みます。例えば、「韓国語の歌詞付き」と付加するのではなく、「韓国人の女性ボーカル」を使用するか、言語を暗示するジャンルを指定してください(例:「K-pop」「J-rock」「Mandopop」「Latin pop」)。

ワークフロー

ステップ 0:インテント検出

ユーザーのメッセージを解析して次のことを判断します:

  1. 曲のカテゴリ:ボーカル(歌詞付き)、インストルメンタル(ボーカルなし)、またはカバー
  2. 作成モード選択:詳細な要件(Advanced)を提供したか、それともカジュアルな1行(Basic)か?

曖昧な場合は、この決定木を使用して質問してください:

Q1:どのような音楽?
  - ボーカル(歌詞付き)
  - インストルメンタル(ボーカルなし)
  - カバー

Q2:作成モード?
  - Basic — 1行の説明、自動生成
  - Advanced — 歌詞編集、プロンプト調整、計画

ユーザーが「悲しいピアノ曲を作って」のような明確な1行のリクエストをした場合は、質問をスキップして、インストルメンタル + Basic モードを推測して進めてください。


ステップ 1:Basic モード

目標:ユーザーが短い説明を提供し、スキルが自動的にすべてを生成してから API を呼び出します。

  1. 説明をプロンプトに展開する:ユーザーの1行をリッチな音楽プロンプトに展開します。このドキュメント末尾のプロンプト作成ガイド付録を参照して、スタイル語彙、ジャンル/楽器リファレンス、およびプロンプト構造を参照してください。 API プロンプトは常に英語で作成する必要があります。生成品質を最高にするため、ユーザーの言語に関係なく。

    このパターンに従ってください:

    A [mood] [BPM optional] [genre] song, featuring [vocal description],
    about [narrative/theme], [atmosphere], [key instruments and production].
    
  2. 生成前にユーザーにプレビューを表示してください。すべてのラベルおよびプロンプト説明をユーザーの言語に翻訳してください。英語のプロンプトは API を呼び出すときにのみ内部で使用され、ユーザーが見ることはありません。テンプレート例(英語リファレンス — 実行時にすべてをローカライズしてください):

    生成しようとしています:
    タイプ:ボーカル / インストルメンタル
    説明:インディーフォーク、メランコリック、アコースティックギター、やさしい女性ボーカル
    歌詞:自動生成(--lyrics-optimizer)
    
    確認しますか?(確認するには Enter キーを押すか、変更内容を教えてください)
    
  3. mmx を呼び出す:音楽を直接生成します。


ステップ 2:Advanced Control モード

目標:ユーザーは生成前にすべてのパラメータを完全に制御できます。

  1. 歌詞フェーズ

    • ユーザーが歌詞を提供した場合:セクションマーカー付きでフォーマットして表示し、編集を求めます。最終的な歌詞は --lyrics を介して mmx に渡されます。
    • ユーザーがテーマを持っているが歌詞がない場合:--lyrics-optimizer を使用して自動生成します。
    • 反復編集をサポート:「2番目のコーラスを変更してください」 -> そのセクションのみを書き直します。
    • ユーザーは自分で歌詞を書いて --lyrics を介して渡すこともできます。
  2. プロンプトフェーズ

    • 歌詞のムードと内容に基づいて推奨プロンプトを生成します。
    • ユーザーが追加/削除/編集できる編集可能なタグとして提示します。
    • 完全な語彙については、プロンプト作成ガイド付録を参照してください。
  3. Advanced 計画(オプション、強制はしません):

    • 曲構造:Verse-Chorus-Verse-Chorus-Bridge-Chorus またはカスタム
    • BPM 提案(プロンプトにテンポ記述として符号化)
    • リファレンススタイル:「X スタイルのような何か」 -> プロンプトタグにマッピング
    • ボーカルキャラクター説明
  4. 最終確認:完全なパラメータサマリーを表示してから生成します。


ステップ 3:mmx を呼び出す

mmx CLI を使用して音楽を生成します:

自動生成歌詞付きボーカル:

mmx music generate \
  --prompt "<prompt>" \
  --lyrics-optimizer \
  --genre "<genre>" --mood "<mood>" --vocals "<vocal style>" \
  --instruments "<instruments>" --bpm <bpm> \
  --out ~/Music/minimax-gen/<filename>.mp3 \
  --quiet --non-interactive

ユーザー提供歌詞付きボーカル:

mmx music generate \
  --prompt "<prompt>" \
  --lyrics "<lyrics with section markers>" \
  --genre "<genre>" --mood "<mood>" --vocals "<vocal style>" \
  --out ~/Music/minimax-gen/<filename>.mp3 \
  --quiet --non-interactive

インストルメンタル(ボーカルなし):

mmx music generate \
  --prompt "<prompt>" \
  --instrumental \
  --genre "<genre>" --mood "<mood>" --instruments "<instruments>" \
  --out ~/Music/minimax-gen/<filename>.mp3 \
  --quiet --non-interactive

構造化フラグ(--genre--mood--vocals--instruments--bpm--key--tempo--structure--references--avoid--use-case)を使用して、すべてを --prompt に詰め込むのではなく API に細かい制御を与えてください。

待機中はプログレスインジケータを表示してください。一般的な生成には 30~120 秒かかります。


ステップ 4:再生

生成後、利用可能なオーディオプレイヤーを検出してファイルを再生します。

プレイヤー検出:

command -v mpv || command -v ffplay || command -v afplay

検出されたプレイヤーに基づいて再生(優先順):

プレイヤーコマンドコントロール
mpv(推奨)mpv --no-video ~/Music/minimax-gen/<filename>.mp3space = 一時停止/再開、q = 終了、左右 = シーク
ffplayffplay -nodisp -autoexit ~/Music/minimax-gen/<filename>.mp3q = 終了
afplay(macOS)afplay ~/Music/minimax-gen/<filename>.mp3Ctrl+C = 停止
なし再生を試行しないでくださいファイルパスのみ表示

再生開始後、ユーザーに通知します(すべてのテキストをローカライズしてください):

再生中:<filename>.mp3
保存先:~/Music/minimax-gen/<filename>.mp3

再生コントロール(例:キーボードショートカット)を表示しないでください — プレイヤーがバックグラウンドで実行されるため、この環境では機能しません。

プレイヤーが見つからない場合(すべてのテキストをローカライズしてください):

オーディオプレイヤーが見つかりません。
ファイルが保存されました:~/Music/minimax-gen/<filename>.mp3
ヒント:最高の再生体験のために mpv をインストールしてください(brew install mpv)。

ステップ 5:フィードバックと反復

再生後、フィードバックを求めます:

この曲はいかがでしたか?
  1. 大好き、これでいい!
  2. ちょっと違う、調整して再生成
  3. 歌詞/スタイルを微調整して再生成
  4. いらない、最初からやり直す

フィードバックに基づいて:

  • 満足:完了。ファイルパスを再度メンションします。
  • 調整して再生成:何を変更するか(プロンプト?歌詞?スタイル?)を聞き、編集を適用して、生成を再実行します。比較用に古いファイルを _v1 サフィックスで保持します。
  • 微調整:現在のパラメータを事前入力した Advanced Control モードに入ります。
  • 削除と再開始:ファイルを削除し、ステップ 0 に戻ります。

カバーモード

レファレンスオーディオに基づいて曲のカバーバージョンを生成します。モデル:music-cover-free

レファレンスオーディオの要件:mp3、wav、flac — 6秒~6分の期間、最大 50MB。 歌詞が提供されない場合、元の歌詞は ASR を介して自動的に抽出されます。

ワークフロー

ユーザーが カバーモードを選択した場合:

  1. ソースオーディオの提供を求めます — ローカルファイルパスまたは URL
  2. ターゲットカバースタイルを求めます(例:「アコースティックカバー、シンプル、親密なボーカル」)
  3. オプションでカスタム歌詞または歌詞ファイルを求めます

コマンド

ローカルファイルからのカバー:

mmx music cover \
  --prompt "<cover style description>" \
  --audio-file <source.mp3> \
  --out ~/Music/minimax-gen/<filename>.mp3 \
  --quiet --non-interactive

URL からのカバー:

mmx music cover \
  --prompt "<cover style description>" \
  --audio <source_url> \
  --out ~/Music/minimax-gen/<filename>.mp3 \
  --quiet --non-interactive

カスタム歌詞(テキスト)付き:

mmx music cover \
  --prompt "<style>" \
  --audio-file <source.mp3> \
  --lyrics "<custom lyrics>" \
  --out ~/Music/minimax-gen/<filename>.mp3 \
  --quiet --non-interactive

カスタム歌詞(ファイル)付き:

mmx music cover \
  --prompt "<style>" \
  --audio-file <source.mp3> \
  --lyrics-file <lyrics.txt> \
  --out ~/Music/minimax-gen/<filename>.mp3 \
  --quiet --non-interactive

オプションフラグ

フラグ説明
--seed <number>ランダムシード 0-1000000(再現可能な結果用)
--channel <n>1(モノラル)または 2(ステレオ、デフォルト)
--format <fmt>mp3(デフォルト)、wavpcm
--sample-rate <hz>サンプルレート(デフォルト:44100)
--bitrate <bps>ビットレート(デフォルト:256000)

生成後

通常の再生とフィードバックフロー(ステップ 4 & 5)に進みます。


エラーハンドリング

エラーアクション
mmx が見つからないnpm install -g mmx-cli
mmx auth エラー(終了コード 3)mmx auth login
クォータ超過(終了コード 4)クォータ制限を報告し、待機またはアップグレードを提案
API タイムアウト(終了コード 5)1回再試行してから失敗を報告
コンテンツフィルタ(終了コード 10)フィルタリングされたコンテンツを避けるようプロンプトを調整
無効な歌詞形式セクションマーカーを自動修正し、ユーザーに警告
オーディオプレイヤーが見つからないファイルを保存し、ユーザーにパスを通知し、mpv インストールを提案
ネットワークエラーエラーの詳細を表示し、接続を確認するよう提案

重要な注記

  • 著作権で保護されている歌詞を再現しないでください。 カバーを行う場合は、曲のテーマに刺激を受けた元の歌詞を常に作成してください。これをユーザーに説明してください。
  • プロンプト言語:API プロンプトは英語タグで最適に機能します。中国語タグも受け入れられます。混在は問題ありません。
  • 歌詞内のセクションマーカー:API は [verse][chorus][bridge][outro][intro] を認識します。--lyrics を提供するときは常にそれらを含めてください。
  • ファイル管理~/Music/minimax-gen/ に 50 ファイル以上ある場合、新しいセッション開始時にクリーンアップを提案してください。
  • 構造化パラメータ:すべてを --prompt に埋め込むのではなく、--genre--mood--vocals--instruments--bpm などの使用を優先してください。これは API により良い制御を与えます。
  • 言語別の歌詞スタイル:ユーザーが特定の言語の歌詞を希望する場合、プロンプトにリスト型言語指示を追加するのではなく、ボーカル説明またはジャンルを通じてそれを表現してください(例:「日本人の女性ボーカル」「Mandopop バラード」)。

付録:プロンプト作成ガイド

ジャンル/ボーカル/楽器リファレンスと BPM テーブルを含む完全なプロンプト作成ガイドについては references/prompt_guide.md を参照してください。

ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ

詳細情報

作者
minimax-ai
リポジトリ
minimax-ai/skills
ライセンス
MIT
最終更新
不明

Source: https://github.com/minimax-ai/skills / ライセンス: MIT

関連スキル

汎用音声・動画・メディア⭐ リポ 1,982

listenhub

あらゆることを説明できます。アイデアをポッドキャスト、解説動画、または音声ナレーションに変換します。 ユーザーが「ポッドキャストを作りたい」「解説動画を作成したい」「これを読み上げてほしい」「画像を生成したい」、または知識を音声・映像形式で共有したいときに使用します。トピックの説明、YouTubeリンク、記事URL、プレーンテキスト、画像プロンプトに対応しています。

by LeoYeAI
汎用音声・動画・メディア⭐ リポ 1,982

best-youtube-video-editor

ClawHub上の「best-youtube-video-editor」スキルは、YouTube クリエイターのコンテンツ制作を革新します。タイムラインや複雑なソフトウェアを必要とせず、会話形式のAI駆動型ビデオ編集が可能です。無音部分のカット、チャプターマーカーの追加、字幕の挿入、ペーシングの調整、エクスポートの最適化——すべてが自然言語の指示で実現します。初回使用時には NemoVideo API を通じて認証情報を自動設定するため、有効化後数秒で編集を開始できます。YouTuber、教育関係者、ポッドキャスター、ブランドチャネル向けに開発され、品質を損なわず高速な納期対応が必要な方に最適です。mp4、mov、avi、webm、mkv 形式に対応しています。

by LeoYeAI
汎用音声・動画・メディア⭐ リポ 27,990

video

ユーザーがAIツールやプログラマティックフレームワークを使用してビデオコンテンツを作成、生成、または制作したい場合に使用します。また、ユーザーが「ビデオ制作」「AIビデオ」「Remotion」「Hyperframes」「HeyGen」「Synthesia」「Veo」「Runway」「Kling」「Pika」「ビデオ生成」「AIアバター」「トーキングヘッドビデオ」「プログラマティックビデオ」「ビデオテンプレート」「解説ビデオ」「プロダクトデモビデオ」「ビデオパイプライン」または「ビデオを作ってほしい」と言及している場合にも使用します。ビデオ作成、生成、制作のワークフロー全般に対応できます。ビデオコンテンツの戦略や投稿内容については「social-content」を、有料ビデオ広告クリエイティブについては「ad-creative」をご参照ください。

by coreyhaines31
汎用音声・動画・メディア⭐ リポ 317

clipify

ビデオから最も面白い瞬間を検出し、スタンドアロンクリップとしてカットできます。オプションで16:9から9:16へのリフォーマット(フェイスパンまたはスプリットスクリーン)に対応し、Opus風の単語ごとのキャプションを焼き込みます。ユーザーが「clipify」「このビデオからクリップをカットして」「これからショーツを作って」「面白い瞬間を見つけて」「9:16にリフレーミングして」「縦型クリップ」と言及したり、ビデオファイルパスを貼り付けてSNS対応のクリップを求める場合に使用します。

by louisedesadeleer
OpenAI音声・動画・メディア⭐ リポ 18,898

speech

ユーザーが音声生成、ナレーション、アクセシビリティ対応の読み上げ、音声プロンプト、またはOpenAI Audio APIによるバッチ音声生成をリクエストした場合に使用します。組み込みボイスを備えたバンドルCLI(`scripts/text_to_speech.py`)を実行でき、ライブ呼び出しには`OPENAI_API_KEY`が必要です。カスタムボイスの作成には対応していません。

by openai
汎用音声・動画・メディア⭐ リポ 2,743

depth-estimation

Depth Anything v2を使用したリアルタイム深度マップのプライバシー変換(CoreML + PyTorch対応) このスキルは、Depth Anything v2モデルを活用して、画像やビデオから取得した深度情報をリアルタイムで処理し、プライバシーを保護しながら変換します。CoreMLとPyTorchの両方に対応しており、エッジデバイスでの高速処理とクラウド環境での柔軟な運用が可能です。顔認識データのぼかしや背景の匿名化など、プライバシー関連の処理を効率的に実行できます。

by SharpAI
本サイトは GitHub 上で公開されているオープンソースの SKILL.md ファイルをクロール・インデックス化したものです。 各スキルの著作権は原作者に帰属します。掲載に問題がある場合は info@alsel.co.jp または /takedown フォームよりご連絡ください。
原作者: minimax-ai · minimax-ai/skills · ライセンス: MIT