vision-analysis
MiniMax vision MCPツールを使用して、画像の分析・説明・情報抽出を行うスキルです。jpg・png・webp・svgなどの画像ファイルパスやURLが共有された場合、または「分析して」「説明して」「読み取って」「OCR」「この画像の中身は」といった表現が画像・スクリーンショット・図表・モックアップ・ワイヤーフレームと組み合わせて使用された場合にトリガーされます。UIレビュー・デザイン批評・グラフからのデータ抽出・物体検出・人物や動物の識別など、画像に関わるあらゆる解析リクエストに対応します。
description の原文を見る
> Analyze, describe, and extract information from images using the MiniMax vision MCP tool. Use when: user shares an image file path or URL (any message containing .jpg, .jpeg, .png, .gif, .webp, .bmp, or .svg file extension) or uses any of these words/phrases near an image: "analyze", "analyse", "describe", "explain", "understand", "look at", "review", "extract text", "OCR", "what is in", "what's in", "read this image", "see this image", "tell me about", "explain this", "interpret this", in connection with an image, screenshot, diagram, chart, mockup, wireframe, or photo. Also triggers for: UI mockup review, wireframe analysis, design critique, data extraction from charts, object detection, person/animal/activity identification. Triggers: any message with an image file extension (jpg, jpeg, png, gif, webp, bmp, svg), or any request to analyze/describ/understand/review/extract text from an image, screenshot, diagram, chart, photo, mockup, or wireframe.
SKILL.md 本文
ビジョン分析
MiniMax Token Plan で利用可能な MiniMax MiniMax_understand_image MCP ツールを使用して画像を分析します。
前提条件
- 有効な
MINIMAX_API_KEYを持つ MiniMax Token Plan サブスクリプション - MiniMax MCP が設定されている状態 (
MiniMax_understand_imageツールが利用可能)
MCP ツールが設定されていない場合
ステップ 1: エージェントは以下のセットアップ手順を取得します: https://platform.minimaxi.com/docs/token-plan/mcp-guide
ステップ 2: ユーザーの環境 (OpenCode、Cursor、Claude Code など) を検出し、必要な正確なコマンドを出力します。一般的な例:
OpenCode — ~/.config/opencode/opencode.json または package.json に追加:
{
"mcp": {
"MiniMax": {
"type": "local",
"command": ["uvx", "minimax-coding-plan-mcp", "-y"],
"environment": {
"MINIMAX_API_KEY": "YOUR_TOKEN_PLAN_KEY",
"MINIMAX_API_HOST": "https://api.minimaxi.com"
},
"enabled": true
}
}
}
Claude Code:
claude mcp add -s user MiniMax --env MINIMAX_API_KEY=your-key --env MINIMAX_API_HOST=https://api.minimaxi.com -- uvx minimax-coding-plan-mcp -y
Cursor — MCP 設定に追加:
{
"mcpServers": {
"MiniMax": {
"command": "uvx",
"args": ["minimax-coding-plan-mcp"],
"env": {
"MINIMAX_API_KEY": "your-key",
"MINIMAX_API_HOST": "https://api.minimaxi.com"
}
}
}
}
ステップ 3: 設定後、ユーザーにアプリを再起動させ、/mcp で確認するよう指示します。
重要: ユーザーが MiniMax Token Plan サブスクリプションを持っていない場合、understand_image ツールには Token Plan が必要であり、無料またはその他の層の API キーでは使用できないことを通知してください。
分析モード
| モード | 使用場面 | プロンプト戦略 |
|---|---|---|
describe | 画像の一般的な理解 | 詳細な説明を要求 |
ocr | スクリーンショット、ドキュメントからのテキスト抽出 | すべてのテキストを逐語的に抽出するよう要求 |
ui-review | UI モックアップ、ワイヤーフレーム、デザインファイル | 提案付きのデザイン批評を要求 |
chart-data | チャート、グラフ、データビジュアライゼーション | データポイントとトレンドの抽出を要求 |
object-detect | オブジェクト、人物、アクティビティの特定 | すべての要素をリストアップして場所を指定するよう要求 |
ワークフロー
ステップ 1: 画像の自動検出
メッセージに以下の拡張子の画像ファイルパスまたは URL が含まれている場合、スキルが自動的にトリガーされます:
.jpg、.jpeg、.png、.gif、.webp、.bmp、.svg
メッセージから画像パスを抽出します。
ステップ 2: 分析モードを選択して MCP ツールを呼び出す
モード固有のプロンプトで MiniMax_understand_image ツールを使用します:
describe:
この画像の詳細な説明を提供してください。以下を含めてください: 主な被写体、設定/背景、
色/スタイル、目に見えるテキスト、注目すべきオブジェクト、全体的な構成。
ocr:
この画像に見えるすべてのテキストを逐語的に抽出してください。構造と書式を保存してください
(ヘッダー、リスト、列)。テキストが見つからない場合はそう述べてください。
ui-review:
あなたは UI/UX デザインレビュアーです。このインターフェイスモックアップまたはデザインを分析してください。以下を提供してください:
(1) 強み — うまく機能している点、(2) 問題 — ユーザビリティまたはデザイン上の問題、
(3) 改善のための具体的で実行可能な提案。建設的かつ詳細に。
chart-data:
このチャートまたはグラフからすべてのデータを抽出してください。以下をリストアップしてください:
チャートのタイトル、軸ラベル、読み取り可能な場合は値を含むすべてのデータポイント/シリーズ、
トレンドの簡潔なサマリー。
object-detect:
特定できるすべての異なるオブジェクト、人物、アクティビティをリストアップしてください。
各々について、それが何であるか、および画像内のおおよその位置を説明してください。
ステップ 3: 結果を表示する
分析を明確に返します。describe の場合は読みやすい散文を使用します。ocr の場合は構造を保存します。ui-review の場合は構造化された批評形式を使用します。
出力形式の例
describe モード:
## 画像の説明
[画像の内容の詳細な説明...]
ocr モード:
## 抽出されたテキスト
[画像から保存されたテキスト構造]
ui-review モード:
## UI デザインレビュー
### 強み
- ...
### 問題
- ...
### 提案
- ...
注記
- 20MB までの画像に対応 (JPEG、PNG、GIF、WebP)
- MiniMax MCP がファイルアクセスで設定されている場合、ローカルファイルパスが機能します
MiniMax_understand_imageツールはminimax-coding-plan-mcpパッケージによって提供されます
ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ
詳細情報
- 作者
- minimax-ai
- リポジトリ
- minimax-ai/skills
- ライセンス
- MIT
- 最終更新
- 不明
Source: https://github.com/minimax-ai/skills / ライセンス: MIT
関連スキル
hugging-face-trackio
Trackioを使用してMLトレーニング実験を追跡・可視化できます。トレーニング中のメトリクスログ記録(Python API)、トレーニング診断のアラート発火、ログされたメトリクスの取得・分析(CLI)が必要な場合に活用してください。リアルタイムダッシュボード表示、Webhookを使用したアラート、HF Space同期、自動化向けのJSON出力に対応しています。
btc-bottom-model
ビットコインのサイクルタイミングモデルで、加重スコアリングシステムを搭載しています。日次パルス(4指標、32ポイント)とウィークリー構造(9指標、68ポイント)の2カテゴリーにわたる13の指標を追跡し、0~100のマーケットヒートスコアを算出します。ETFフロー、ファンディングレート、ロング/ショート比率、恐怖・貪欲指数、LTH-MVRV、NUPL、SOPR(LTH+STH)、LTH供給率、移動平均倍率(365日MA、200週MA)、週次RSI、出来高トレンドに対応します。市場サイクル全体を通じて買いと売りの両方の推奨を提供します。ビットコインの底値拾い、BTCサイクルポジション、買い時・売り時、オンチェーン指標、MVRV、NUPL、SOPR、LTH動向、ETFの流出入、ファンディングレート、恐怖指数、ビットコインが過熱状態か、マイナーコスト、暗号資産市場のセンチメント、BTCのポジションサイジング、「今ビットコインを買うべきか」「BTCが天井をつけているか」「オンチェーン指標は何を示しているか」といった質問の際にこのスキルを活用します。
protein_solubility_optimization
タンパク質の溶解性最適化 - タンパク質の溶解性を最適化します。タンパク質の特性を計算し、溶解性と親水性を予測し、有効な変異を提案します。タンパク質配列の特性計算、タンパク質機能の予測、親水性計算、ゼロショット配列予測を含むタンパク質エンジニアリング業務に使用できます。3つのSCPサーバーから4つのツールを統合しています。
research-lookup
Parallel Chat APIまたはPerplexity sonar-pro-searchを使用して、最新の研究情報を検索できます。学術論文の検索にも対応しています。クエリは自動的に最適なバックエンドにルーティングされるため、論文の検索、研究データの収集、科学情報の検証に活用できます。
tree-formatting
ggtree(R)またはiTOL(ウェブ)を使用して、系統樹の可視化とフォーマットを行います。系統樹を図として描画する際、ツリーレイアウトの選択、分類学に基づく枝やラベルの色付け、クレードの折りたたみ、サポート値の表示、またはツリーへのオーバーレイ追加が必要な場合に使用してください。系統推定(protein-phylogenyスキルを使用)やドメイン注釈(今後の独立したスキル)には使用しないでください。
querying-indonesian-gov-data
インドネシア政府の50以上のAPIとデータソースに接続できます。BPJPH(ハラール認証)、BOM(食品安全)、OJK(金融適正性)、BPS(統計)、BMKG(気象・地震)、インドネシア中央銀行(為替レート)、IDX(株式)、CKAN公開データポータル、pasal.id(第三者法MCP)に対応しています。インドネシア政府データを活用したアプリ開発、.go.idウェブサイトのスクレイピング、ハラール認証の確認、企業の法的適正性の検証、金融機関ステータスの照会、またはインドネシアMCPサーバーへの接続時に使用できます。CSRF処理、CKAN API使用方法、IP制限回避など、すぐに実行可能なPythonパターンを含んでいます。