Anthropic Claude音声・動画・メディア⭐ リポ 0品質スコア 50/100

minimax-music-gen

Name: minimax-music-gen
Author: minimax-ai

音楽・楽曲・オーディオトラックの生成を行いたいときに使用するスキルです。歌詞の作成、既存の歌詞からの楽曲化、ムードやシーンに合ったBGMの生成など、音楽制作に関わるあらゆるリクエストに対応します。既存ファイルの再生、音楽理論の質問、生成を伴わない楽曲レコメンドには使用しないでください。

description の原文を見る

> Use when user wants to generate music, songs, or audio tracks. Triggers on any request involving music creation, song writing, lyrics generation, audio production, or covers. Also triggers when user provides lyrics and wants them turned into a song, or describes a mood/scene and wants background music. Supports multilingual triggers — match equivalent phrases in any language. Do NOT use for music playback of existing files, music theory questions, or music recommendation without generation.

SKILL.md 本文

MiniMax Music Generation Skill

MiniMax Music API を使用して曲（ボーカルまたはインストルメンタル）を生成します。2つの作成モードに対応しています：Basic（1文入力で曲が出力）およびAdvanced Control（歌詞編集、プロンプト調整、生成前計画）。

前提条件

mmx CLI（必須）：音楽生成は mmx コマンドラインツールを使用します。

インストール確認：
```
command -v mmx && mmx --version || echo "mmx not found"
```
インストール（Node.js が必要）：
```
npm install -g mmx-cli
```
認証（初回のみ）：
```
mmx auth login --api-key <your-minimax-api-key>
```
API キーは MiniMax Platform から取得できます。認証情報は ~/.mmx/credentials.json に保存され、セッション間で永続化されます。

確認：
```
mmx quota show
```
オーディオプレイヤー（推奨）：ローカル再生用に mpv、ffplay、または afplay（macOS 組み込み）。 mpv がインタラクティブコントロール用に推奨されています。

CLI ツール

このスキルはすべての音楽生成に mmx CLI を使用します：

音楽生成：mmx music generate — モデル：music-2.6-free
- プロンプトから歌詞を自動生成する --lyrics-optimizer をサポート
- インストルメンタルトラック用の --instrumental をサポート
- ユーザー提供の歌詞用の --lyrics をサポート
- 構造化パラメータ：--genre、--mood、--vocals、--instruments、--bpm、--key、--tempo、--structure、--references
カバー：mmx music cover — モデル：music-cover-free
- --audio-file <path> または --audio <url> を介してレファレンスオーディオを取得
- --prompt でターゲットカバースタイルを説明

エージェントフラグ：エージェントから mmx を呼び出すときは常に --quiet --non-interactive を追加してください。

パイプライン：

ボーカル：ユーザー説明 -> mmx music generate --lyrics-optimizer -> MP3
インストルメンタル：ユーザー説明 -> mmx music generate --instrumental -> MP3
カバー：ソースオーディオ + スタイル -> mmx music cover -> MP3

ストレージ

生成されたすべての音楽は ~/Music/minimax-gen/ に保存されます。ディレクトリが存在しない場合は作成してください。ファイルはタイムスタンプとプロンプトから派生した短いスラッグで名付けられます： YYYYMMDD_HHMMSS_<slug>.mp3

言語とインタラクション

ユーザーの最初のメッセージから言語を検出し、セッション全体でその言語で応答してください。これはすべてのインタラクションテキスト、質問、確認、およびフィードバックプロンプトに適用されます。

ユーザー向けテキストのローカライズルール：

プレビューラベル、フィールド名、確認、ステータスメッセージ、再生情報、フィードバックプロンプト、およびプロンプト/説明プレビューを含む、ユーザーに表示されるすべてのテキストは、ユーザーの言語に完全に翻訳する必要があります。
API に送信されるプロンプトは、最高の生成品質のため常に英語で作成する必要があります。ただし、ユーザーにプロンプトをプレビューする際には、生の英語プロンプトではなく、ユーザーの言語でローカライズされた説明を表示します。英語のプロンプトは内部実装の詳細であり、ユーザーは見る必要がありません。
以下のテンプレートは参考として英語で記述されています。実行時には、すべてのラベルとメッセージをユーザーの検出された言語に翻訳してください。

歌詞言語ルール：

デフォルトの歌詞言語 = ユーザーの言語。中国語を話すユーザーは中国語の歌詞を取得し、英語を話すユーザーは英語の歌詞を取得します。
ユーザーが明示的にリクエストした場合のみ、別の言語で歌詞を生成してください。
別の歌詞言語が必要な場合は、それをボーカル説明またはジャンル説明に自然に埋め込みます。例えば、「韓国語の歌詞付き」と付加するのではなく、「韓国人の女性ボーカル」を使用するか、言語を暗示するジャンルを指定してください（例：「K-pop」「J-rock」「Mandopop」「Latin pop」）。

ワークフロー

ステップ 0：インテント検出

ユーザーのメッセージを解析して次のことを判断します：

曲のカテゴリ：ボーカル（歌詞付き）、インストルメンタル（ボーカルなし）、またはカバー
作成モード選択：詳細な要件（Advanced）を提供したか、それともカジュアルな1行（Basic）か？

曖昧な場合は、この決定木を使用して質問してください：

Q1：どのような音楽？
  - ボーカル（歌詞付き）
  - インストルメンタル（ボーカルなし）
  - カバー

Q2：作成モード？
  - Basic — 1行の説明、自動生成
  - Advanced — 歌詞編集、プロンプト調整、計画

ユーザーが「悲しいピアノ曲を作って」のような明確な1行のリクエストをした場合は、質問をスキップして、インストルメンタル + Basic モードを推測して進めてください。

ステップ 1：Basic モード

目標：ユーザーが短い説明を提供し、スキルが自動的にすべてを生成してから API を呼び出します。

説明をプロンプトに展開する：ユーザーの1行をリッチな音楽プロンプトに展開します。このドキュメント末尾のプロンプト作成ガイド付録を参照して、スタイル語彙、ジャンル/楽器リファレンス、およびプロンプト構造を参照してください。 API プロンプトは常に英語で作成する必要があります。生成品質を最高にするため、ユーザーの言語に関係なく。

このパターンに従ってください：
```
A [mood] [BPM optional] [genre] song, featuring [vocal description],
about [narrative/theme], [atmosphere], [key instruments and production].
```
生成前にユーザーにプレビューを表示してください。すべてのラベルおよびプロンプト説明をユーザーの言語に翻訳してください。英語のプロンプトは API を呼び出すときにのみ内部で使用され、ユーザーが見ることはありません。テンプレート例（英語リファレンス — 実行時にすべてをローカライズしてください）：
```
生成しようとしています：
タイプ：ボーカル / インストルメンタル
説明：インディーフォーク、メランコリック、アコースティックギター、やさしい女性ボーカル
歌詞：自動生成（--lyrics-optimizer）

確認しますか？（確認するには Enter キーを押すか、変更内容を教えてください）
```
mmx を呼び出す：音楽を直接生成します。

ステップ 2：Advanced Control モード

目標：ユーザーは生成前にすべてのパラメータを完全に制御できます。

歌詞フェーズ：
- ユーザーが歌詞を提供した場合：セクションマーカー付きでフォーマットして表示し、編集を求めます。最終的な歌詞は --lyrics を介して mmx に渡されます。
- ユーザーがテーマを持っているが歌詞がない場合：--lyrics-optimizer を使用して自動生成します。
- 反復編集をサポート：「2番目のコーラスを変更してください」 -> そのセクションのみを書き直します。
- ユーザーは自分で歌詞を書いて --lyrics を介して渡すこともできます。
プロンプトフェーズ：
- 歌詞のムードと内容に基づいて推奨プロンプトを生成します。
- ユーザーが追加/削除/編集できる編集可能なタグとして提示します。
- 完全な語彙については、プロンプト作成ガイド付録を参照してください。
Advanced 計画（オプション、強制はしません）：
- 曲構造：Verse-Chorus-Verse-Chorus-Bridge-Chorus またはカスタム
- BPM 提案（プロンプトにテンポ記述として符号化）
- リファレンススタイル：「X スタイルのような何か」 -> プロンプトタグにマッピング
- ボーカルキャラクター説明
最終確認：完全なパラメータサマリーを表示してから生成します。

ステップ 3：mmx を呼び出す

mmx CLI を使用して音楽を生成します：

自動生成歌詞付きボーカル：

mmx music generate \
  --prompt "<prompt>" \
  --lyrics-optimizer \
  --genre "<genre>" --mood "<mood>" --vocals "<vocal style>" \
  --instruments "<instruments>" --bpm <bpm> \
  --out ~/Music/minimax-gen/<filename>.mp3 \
  --quiet --non-interactive

ユーザー提供歌詞付きボーカル：

mmx music generate \
  --prompt "<prompt>" \
  --lyrics "<lyrics with section markers>" \
  --genre "<genre>" --mood "<mood>" --vocals "<vocal style>" \
  --out ~/Music/minimax-gen/<filename>.mp3 \
  --quiet --non-interactive

インストルメンタル（ボーカルなし）：

mmx music generate \
  --prompt "<prompt>" \
  --instrumental \
  --genre "<genre>" --mood "<mood>" --instruments "<instruments>" \
  --out ~/Music/minimax-gen/<filename>.mp3 \
  --quiet --non-interactive

構造化フラグ（--genre、--mood、--vocals、--instruments、--bpm、--key、--tempo、--structure、--references、--avoid、--use-case）を使用して、すべてを --prompt に詰め込むのではなく API に細かい制御を与えてください。

待機中はプログレスインジケータを表示してください。一般的な生成には 30～120 秒かかります。

ステップ 4：再生

生成後、利用可能なオーディオプレイヤーを検出してファイルを再生します。

プレイヤー検出：

command -v mpv || command -v ffplay || command -v afplay

検出されたプレイヤーに基づいて再生（優先順）：

プレイヤー	コマンド	コントロール
`mpv`（推奨）	`mpv --no-video ~/Music/minimax-gen/<filename>.mp3`	space = 一時停止/再開、q = 終了、左右 = シーク
`ffplay`	`ffplay -nodisp -autoexit ~/Music/minimax-gen/<filename>.mp3`	q = 終了
`afplay`（macOS）	`afplay ~/Music/minimax-gen/<filename>.mp3`	Ctrl+C = 停止
なし	再生を試行しないでください	ファイルパスのみ表示

再生開始後、ユーザーに通知します（すべてのテキストをローカライズしてください）：

再生中：<filename>.mp3
保存先：~/Music/minimax-gen/<filename>.mp3

再生コントロール（例：キーボードショートカット）を表示しないでください — プレイヤーがバックグラウンドで実行されるため、この環境では機能しません。

プレイヤーが見つからない場合（すべてのテキストをローカライズしてください）：

オーディオプレイヤーが見つかりません。
ファイルが保存されました：~/Music/minimax-gen/<filename>.mp3
ヒント：最高の再生体験のために mpv をインストールしてください（brew install mpv）。

ステップ 5：フィードバックと反復

再生後、フィードバックを求めます：

この曲はいかがでしたか？
  1. 大好き、これでいい！
  2. ちょっと違う、調整して再生成
  3. 歌詞/スタイルを微調整して再生成
  4. いらない、最初からやり直す

フィードバックに基づいて：

満足：完了。ファイルパスを再度メンションします。
調整して再生成：何を変更するか（プロンプト？歌詞？スタイル？）を聞き、編集を適用して、生成を再実行します。比較用に古いファイルを _v1 サフィックスで保持します。
微調整：現在のパラメータを事前入力した Advanced Control モードに入ります。
削除と再開始：ファイルを削除し、ステップ 0 に戻ります。

カバーモード

レファレンスオーディオに基づいて曲のカバーバージョンを生成します。モデル：music-cover-free。

レファレンスオーディオの要件：mp3、wav、flac — 6秒～6分の期間、最大 50MB。歌詞が提供されない場合、元の歌詞は ASR を介して自動的に抽出されます。

ワークフロー

ユーザーがカバーモードを選択した場合：

ソースオーディオの提供を求めます — ローカルファイルパスまたは URL
ターゲットカバースタイルを求めます（例：「アコースティックカバー、シンプル、親密なボーカル」）
オプションでカスタム歌詞または歌詞ファイルを求めます

コマンド

ローカルファイルからのカバー：

mmx music cover \
  --prompt "<cover style description>" \
  --audio-file <source.mp3> \
  --out ~/Music/minimax-gen/<filename>.mp3 \
  --quiet --non-interactive

URL からのカバー：

mmx music cover \
  --prompt "<cover style description>" \
  --audio <source_url> \
  --out ~/Music/minimax-gen/<filename>.mp3 \
  --quiet --non-interactive

カスタム歌詞（テキスト）付き：

mmx music cover \
  --prompt "<style>" \
  --audio-file <source.mp3> \
  --lyrics "<custom lyrics>" \
  --out ~/Music/minimax-gen/<filename>.mp3 \
  --quiet --non-interactive

カスタム歌詞（ファイル）付き：

mmx music cover \
  --prompt "<style>" \
  --audio-file <source.mp3> \
  --lyrics-file <lyrics.txt> \
  --out ~/Music/minimax-gen/<filename>.mp3 \
  --quiet --non-interactive

オプションフラグ

フラグ	説明
`--seed <number>`	ランダムシード 0-1000000（再現可能な結果用）
`--channel <n>`	`1`（モノラル）または `2`（ステレオ、デフォルト）
`--format <fmt>`	`mp3`（デフォルト）、`wav`、`pcm`
`--sample-rate <hz>`	サンプルレート（デフォルト：44100）
`--bitrate <bps>`	ビットレート（デフォルト：256000）

生成後

通常の再生とフィードバックフロー（ステップ 4 & 5）に進みます。

エラーハンドリング

エラー	アクション
mmx が見つからない	`npm install -g mmx-cli`
mmx auth エラー（終了コード 3）	`mmx auth login`
クォータ超過（終了コード 4）	クォータ制限を報告し、待機またはアップグレードを提案
API タイムアウト（終了コード 5）	1回再試行してから失敗を報告
コンテンツフィルタ（終了コード 10）	フィルタリングされたコンテンツを避けるようプロンプトを調整
無効な歌詞形式	セクションマーカーを自動修正し、ユーザーに警告
オーディオプレイヤーが見つからない	ファイルを保存し、ユーザーにパスを通知し、mpv インストールを提案
ネットワークエラー	エラーの詳細を表示し、接続を確認するよう提案

重要な注記

著作権で保護されている歌詞を再現しないでください。 カバーを行う場合は、曲のテーマに刺激を受けた元の歌詞を常に作成してください。これをユーザーに説明してください。
プロンプト言語：API プロンプトは英語タグで最適に機能します。中国語タグも受け入れられます。混在は問題ありません。
歌詞内のセクションマーカー：API は [verse]、[chorus]、[bridge]、[outro]、[intro] を認識します。--lyrics を提供するときは常にそれらを含めてください。
ファイル管理：~/Music/minimax-gen/ に 50 ファイル以上ある場合、新しいセッション開始時にクリーンアップを提案してください。
構造化パラメータ：すべてを --prompt に埋め込むのではなく、--genre、--mood、--vocals、--instruments、--bpm などの使用を優先してください。これは API により良い制御を与えます。
言語別の歌詞スタイル：ユーザーが特定の言語の歌詞を希望する場合、プロンプトにリスト型言語指示を追加するのではなく、ボーカル説明またはジャンルを通じてそれを表現してください（例：「日本人の女性ボーカル」「Mandopop バラード」）。

付録：プロンプト作成ガイド

ジャンル/ボーカル/楽器リファレンスと BPM テーブルを含む完全なプロンプト作成ガイドについては references/prompt_guide.md を参照してください。

ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ

詳細情報

作者: minimax-ai
リポジトリ: minimax-ai/skills
ライセンス: MIT
最終更新: 不明

GitHubで原本を見る →フィードバックを送る

Source: https://github.com/minimax-ai/skills / ライセンス: MIT

minimax-music-gen

SKILL.md 本文

MiniMax Music Generation Skill

前提条件

CLI ツール

ストレージ

言語とインタラクション

ワークフロー

ステップ 0：インテント検出

ステップ 1：Basic モード

ステップ 2：Advanced Control モード

ステップ 3：mmx を呼び出す

ステップ 4：再生

ステップ 5：フィードバックと反復

カバーモード

ワークフロー

コマンド

オプションフラグ

生成後

エラーハンドリング

重要な注記

付録：プロンプト作成ガイド

詳細情報

関連スキル

listenhub

best-youtube-video-editor

video

clipify

speech

depth-estimation