Agent Skills by ALSEL
Anthropic ClaudeLLM・AI開発⭐ リポ 0品質スコア 50/100

mmx-cli

MiniMax AIプラットフォームを通じてテキスト・画像・動画・音声・音楽を生成するためにmmxを使用します。ユーザーがメディアコンテンツの作成、MiniMaxモデルとのチャット、Web検索、またはターミナルからのMiniMax APIリソース管理を行いたい場合に活用してください。

description の原文を見る

Use mmx to generate text, images, video, speech, and music via the MiniMax AI platform. Use when the user wants to create media content, chat with MiniMax models, perform web search, or manage MiniMax API resources from the terminal.

SKILL.md 本文

MiniMax CLI — Agent Skill Guide

mmx を使用して、MiniMax AI プラットフォームを経由してテキスト、画像、動画、音声、音楽を生成し、Web 検索を実行します。

前提条件

# インストール
npm install -g mmx-cli

# 認証 (~/.mmx/credentials.json に永続化)
mmx auth login --api-key sk-xxxxx

# または呼び出し時に指定
mmx text chat --api-key sk-xxxxx --message "Hello"

リージョンは自動検出されます。--region global または --region cn でオーバーライドできます。


Agent フラグ

非対話型 (agent/CI) コンテキストでは、常に以下のフラグを使用してください:

フラグ用途
--non-interactive引数が不足している場合、プロンプトを表示せずに失敗
--quietスピナー/進行状況を抑制; stdout は純粋なデータ
--output jsonマシンが読める JSON 形式の出力
--asyncタスク ID をすぐに返す (動画生成)
--dry-runAPI リクエストをプレビュー (実行しない)
--yes確認プロンプトをスキップ

コマンド

text chat

チャット補完。デフォルトモデル: MiniMax-M2.7

mmx text chat --message <text> [flags]
フラグ説明
--message <text>string, 必須, 繰り返し可メッセージテキスト。ロールを設定する場合は role: をプレフィックスに (例: "system:You are helpful", "user:Hello")
--messages-file <path>stringmessages 配列を含む JSON ファイル。stdin の場合は -
--system <text>stringシステムプロンプト
--model <model>stringモデル ID (デフォルト: MiniMax-M2.7)
--max-tokens <n>number最大トークン数 (デフォルト: 4096)
--temperature <n>numberサンプリング温度 (0.0, 1.0]
--top-p <n>numberニュークレウスサンプリング閾値
--streambooleanトークンをストリーム (TTY ではデフォルトで有効)
--tool <json-or-path>string, 繰り返し可ツール定義 JSON またはファイルパス
# 単一メッセージ
mmx text chat --message "user:What is MiniMax?" --output json --quiet

# 複数ターン
mmx text chat \
  --system "You are a coding assistant." \
  --message "user:Write fizzbuzz in Python" \
  --output json

# ファイルから
cat conversation.json | mmx text chat --messages-file - --output json

stdout: レスポンステキスト (text モード) または完全なレスポンスオブジェクト (json モード)。


image generate

画像を生成します。モデル: image-01

mmx image generate --prompt <text> [flags]
フラグ説明
--prompt <text>string, 必須画像の説明
--aspect-ratio <ratio>string例: 16:9, 1:1
--n <count>number画像の枚数 (デフォルト: 1)
--subject-ref <params>stringサブジェクト参照: type=character,image=path-or-url
--out-dir <dir>stringディレクトリに画像をダウンロード
--out-prefix <prefix>stringファイル名プレフィックス (デフォルト: image)
mmx image generate --prompt "A cat in a spacesuit" --output json --quiet
# stdout: 画像 URL (quiet モードではそれぞれ 1 行)

mmx image generate --prompt "Logo" --n 3 --out-dir ./gen/ --quiet
# stdout: 保存されたファイルパス (それぞれ 1 行)

video generate

動画を生成します。デフォルトモデル: MiniMax-Hailuo-2.3。これは非同期タスクです — デフォルトでは完了までポーリングします。

mmx video generate --prompt <text> [flags]
フラグ説明
--prompt <text>string, 必須動画の説明
--model <model>stringMiniMax-Hailuo-2.3 (デフォルト) または MiniMax-Hailuo-2.3-Fast
--first-frame <path-or-url>string最初のフレーム画像
--callback-url <url>string完了時の Webhook URL
--download <path>string動画を特定のファイルに保存
--asyncbooleanタスク ID をすぐに返す
--no-waitboolean--async と同じ
--poll-interval <seconds>numberポーリング間隔 (デフォルト: 5)
# ノンブロッキング: タスク ID を取得
mmx video generate --prompt "A robot." --async --quiet
# stdout: {"taskId":"..."}

# ブロッキング: 待機してファイルパスを取得
mmx video generate --prompt "Ocean waves." --download ocean.mp4 --quiet
# stdout: ocean.mp4

video task get

動画生成タスクのステータスを照会します。

mmx video task get --task-id <id> [--output json]

video download

完了した動画をタスク ID でダウンロードします。

mmx video download --file-id <id> [--out <path>]

speech synthesize

テキスト音声変換。デフォルトモデル: speech-2.8-hd。最大 10k 文字。

mmx speech synthesize --text <text> [flags]
フラグ説明
--text <text>string合成するテキスト
--text-file <path>stringファイルからテキストを読み込む。stdin の場合は -
--model <model>stringspeech-2.8-hd (デフォルト), speech-2.6, speech-02
--voice <id>stringボイス ID (デフォルト: English_expressive_narrator)
--speed <n>number速度乗数
--volume <n>number音量レベル
--pitch <n>numberピッチ調整
--format <fmt>string音声フォーマット (デフォルト: mp3)
--sample-rate <hz>numberサンプリングレート (デフォルト: 32000)
--bitrate <bps>numberビットレート (デフォルト: 128000)
--channels <n>numberオーディオチャンネル数 (デフォルト: 1)
--language <code>string言語ブースト
--subtitlesbooleanサブタイトルタイミングデータを含める
--pronunciation <from/to>string, 繰り返し可カスタム発音
--sound-effect <effect>stringサウンドエフェクトを追加
--out <path>string音声をファイルに保存
--streamboolean生のオーディオを stdout にストリーム
mmx speech synthesize --text "Hello world" --out hello.mp3 --quiet
# stdout: hello.mp3

echo "Breaking news." | mmx speech synthesize --text-file - --out news.mp3

music generate

音楽を生成します。モデル: music-2.5。豊かで構造的な説明に反応します。

mmx music generate --prompt <text> [--lyrics <text>] [flags]
フラグ説明
--prompt <text>string音楽スタイルの説明 (詳細可)
--lyrics <text>string構造タグ付きのオーディオ歌詞。インストルメンタルの場合は "\u65e0\u6b4c\u8bcd" を使用。--instrumental と併用不可
--lyrics-file <path>stringファイルから歌詞を読み込む。stdin の場合は -
--vocals <text>stringボーカルスタイル、例: "warm male baritone", "bright female soprano", "duet with harmonies"
--genre <text>string音楽ジャンル、例: folk, pop, jazz
--mood <text>stringムードまたは感情、例: warm, melancholic, uplifting
--instruments <text>stringフィーチャーする楽器、例: "acoustic guitar, piano"
--tempo <text>stringテンポの説明、例: fast, slow, moderate
--bpm <number>number正確なテンポ (ビート/分)
--key <text>string音階、例: C major, A minor, G sharp
--avoid <text>string生成音楽で避けるべき要素
--use-case <text>stringユースケースコンテキスト、例: "background music for video", "theme song"
--structure <text>string曲の構造、例: "verse-chorus-verse-bridge-chorus"
--references <text>stringリファレンストラックまたはアーティスト、例: "similar to Ed Sheeran"
--extra <text>string追加の微調整要件
--instrumentalbooleanインストルメンタル音楽を生成 (ボーカルなし)。--lyrics または --lyrics-file と併用不可
--aigc-watermarkbooleanAI 生成コンテンツウォーターマークを埋め込む
--format <fmt>string音声フォーマット (デフォルト: mp3)
--sample-rate <hz>numberサンプリングレート (デフォルト: 44100)
--bitrate <bps>numberビットレート (デフォルト: 256000)
--out <path>string音声をファイルに保存
--streamboolean生のオーディオを stdout にストリーム

--prompt または --lyrics の少なくとも 1 つが必須です。

# シンプルな使用法
mmx music generate --prompt "Upbeat pop" --lyrics "La la la..." --out song.mp3 --quiet

# ボーカル特性を含む詳細なプロンプト
mmx music generate --prompt "Warm morning folk" \
  --vocals "male and female duet, harmonies in chorus" \
  --instruments "acoustic guitar, piano" \
  --bpm 95 \
  --lyrics-file song.txt \
  --out duet.mp3

# インストルメンタル (--instrumental フラグを使用)
mmx music generate --prompt "Cinematic orchestral, building tension" --instrumental --out bgm.mp3

vision describe

VLM による画像認識。--image または --file-id のいずれかを指定してください (両方ではなく)。

mmx vision describe (--image <path-or-url> | --file-id <id>) [flags]
フラグ説明
--image <path-or-url>stringローカルパスまたは URL (自動的に base64 エンコード)
--file-id <id>string事前アップロードされたファイル ID (base64 をスキップ)
--prompt <text>string画像に関する質問 (デフォルト: "Describe the image.")
mmx vision describe --image photo.jpg --prompt "What breed?" --output json

stdout: 説明テキスト (text モード) または完全なレスポンス (json モード)。


search query

MiniMax 経由の Web 検索。

mmx search query --q <query>
フラグ説明
--q <query>string, 必須検索クエリ
mmx search query --q "MiniMax AI" --output json --quiet

quota show

Token Plan の使用状況と残りのクォータを表示します。

mmx quota show [--output json]

ツールスキーマエクスポート

すべてのコマンドを Anthropic/OpenAI 互換の JSON ツールスキーマとしてエクスポート:

# すべてのツール相応コマンド (auth/config/update を除く)
mmx config export-schema

# 単一コマンド
mmx config export-schema --command "video generate"

これを使用して、agent フレームワークで mmx コマンドをツールとして動的に登録します。


終了コード

コード意味
0成功
1一般的なエラー
2使用法エラー (不正なフラグ、引数不足)
3認証エラー
4クォータ超過
5タイムアウト
10コンテンツフィルターがトリガー

パイプパターン

# stdout は常にクリーンなデータ — 安全にパイプ可
mmx text chat --message "Hi" --output json | jq '.content'

# stderr には進行状況/スピナー — 必要に応じて破棄
mmx video generate --prompt "Waves" 2>/dev/null

# チェーン: 画像生成 → 説明する
URL=$(mmx image generate --prompt "A sunset" --quiet)
mmx vision describe --image "$URL" --quiet

# 非同期動画ワークフロー
TASK=$(mmx video generate --prompt "A robot" --async --quiet | jq -r '.taskId')
mmx video task get --task-id "$TASK" --output json
mmx video download --task-id "$TASK" --out robot.mp4

設定優先順位

CLI フラグ → 環境変数 → ~/.mmx/config.json → デフォルト。

# 永続的な設定
mmx config set --key region --value cn
mmx config show

# 環境変数
export MINIMAX_API_KEY=sk-xxxxx
export MINIMAX_REGION=cn

ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ

詳細情報

作者
minimax-ai
リポジトリ
minimax-ai/skills
ライセンス
MIT
最終更新
不明

Source: https://github.com/minimax-ai/skills / ライセンス: MIT

関連スキル

OpenAILLM・AI開発⭐ リポ 6,054

agent-browser

AI エージェント向けのブラウザ自動化 CLI です。ウェブサイトとの対話が必要な場合に使用します。ページ遷移、フォーム入力、ボタンクリック、スクリーンショット取得、データ抽出、ウェブアプリのテスト、ブラウザ操作の自動化など、あらゆるブラウザタスクに対応できます。「ウェブサイトを開く」「フォームに記入する」「ボタンをクリックする」「スクリーンショットを取得する」「ページからデータを抽出する」「このウェブアプリをテストする」「サイトにログインする」「ブラウザ操作を自動化する」といった要求や、プログラマティックなウェブ操作が必要なタスクで起動します。

by JimmyLv
汎用LLM・AI開発⭐ リポ 1,982

anyskill

AnySkill — あなたのプライベート・スキルクラウド。GitHubを基盤としたリポジトリからエージェントスキルを管理、同期、動的にロードできます。自然言語でクラウドスキルを検索し、オンデマンドでプロンプトを自動ロード、カスタムスキルのアップロードと共有、スキルバンドルの一括インストールが可能です。OpenClaw、Antigravity、Claude Code、Cursorに対応しています。

by LeoYeAI
汎用LLM・AI開発⭐ リポ 1,982

engram

AIエージェント向けの永続的なメモリシステムです。バグ修正、意思決定、発見、設定変更の後はmem_saveを使用してください。ユーザーが「覚えている」「記憶している」と言及した場合、または以前のセッションと重複する作業を開始する際はmem_searchを使用します。セッション終了前にmem_session_summaryを使用して、コンテキストを保持してください。

by LeoYeAI
汎用LLM・AI開発⭐ リポ 21,584

skyvern

AI駆動のブラウザ自動化により、任意のウェブサイトを自動化できます。フォーム入力、データ抽出、ファイルダウンロード、ログイン、複数ステップのワークフロー実行など、ユーザーがウェブサイトと連携する必要があるときに使用します。Skyvernは、LLMとコンピュータビジョンを活用して、未知のサイトも自動操作可能です。Python SDK、TypeScript SDK、REST API、MCPサーバー、またはCLIを通じて統合できます。

by Skyvern-AI
汎用LLM・AI開発⭐ リポ 1,149

pinchbench

PinchBenchベンチマークを実行して、OpenClawエージェントの実世界タスクにおけるパフォーマンスを評価できます。モデルの機能テスト、モデル間の比較、ベンチマーク結果のリーダーボード提出、またはOpenClawのセットアップがカレンダー、メール、リサーチ、コーディング、複数ステップのワークフローにどの程度対応しているかを確認する際に使用します。

by pinchbench
汎用LLM・AI開発⭐ リポ 4,693

openui

OpenUIとOpenUI Langを使用してジェネレーティブUIアプリを構築できます。これらはLLM生成インターフェースのためのトークン効率的なオープン標準です。OpenUI、@openuidev、ジェネレーティブUI、LLMからのストリーミングUI、AI向けコンポーネントライブラリ、またはjson-render/A2UIの置き換えについて述べる際に使用します。スキャフォルディング、defineComponent、システムプロンプト、Renderer、およびOpenUI Lang出力のデバッグに対応しています。

by thesysdev
本サイトは GitHub 上で公開されているオープンソースの SKILL.md ファイルをクロール・インデックス化したものです。 各スキルの著作権は原作者に帰属します。掲載に問題がある場合は info@alsel.co.jp または /takedown フォームよりご連絡ください。
原作者: minimax-ai · minimax-ai/skills · ライセンス: MIT