intelli-router
ローカルのOllamaモデル(qwen3:1.7b)を使用して受信したユーザーメッセージを複雑度で自動判定し、session_statusを経由して最適なAIモデルへルーティングするインテリジェントなモデルルーターです。すべての受信メッセージに対応し、シンプルなタスクはローカルモデル(Ollama経由のdengcao/Qwen3-32B:Q5_K_M)、中程度のタスクはClaude Sonnet、コーディングタスクはCodex、複雑なタスクはClaude Opusへと自動的に振り分けます。スラッシュコマンド以外のユーザーメッセージで発動し、モデルルーティング、トリアージ、分類、複雑度判定、コスト最適化、スマートルーティングを実現します。
description の原文を見る
Intelligent model router that triages every incoming user message by complexity using a local Ollama model (qwen3:1.7b), then routes to the optimal AI model via session_status. Use on ALL incoming user messages to automatically select between local models (dengcao/Qwen3-32B:Q5_K_M via Ollama) for simple tasks, Claude Sonnet for moderate tasks, Codex for coding tasks, and Claude Opus for complex tasks. Triggers on any user message that is not a slash command. Keywords: model routing, triage, classify, complexity, cost optimization, smart routing.
SKILL.md 本文
Intelli-Router: 自動モデルルーティング
目的
各ユーザーメッセージに対して、タスクの複雑さに基づいて最適なモデルを自動的に選択します。 シンプルなタスクはローカルで処理し、複雑なタスクが必要な場合のみ高コストのAPIモデルにエスカレートすることで、コストを削減します。
起動タイミング
すべての受信ユーザーメッセージに対して、応答を生成する前に分類ステップを実行してください。 "/" で始まるメッセージ(コマンド)は分類しないでください。
ワークフロー
- ユーザーのメッセージ全文を取得します。
- 分類器を実行します:
python3 {baseDir}/scripts/classify.py "USER_MESSAGE_HERE"
- JSON出力を解析します。以下の形式で返されます:
{"model": "provider/model-name", "tier": "simple|moderate|coding|complex", "reason": "..."}
- 出力の
modelフィールドの値を使用してセッションモデルを切り替えます:
session_status(model="<model フィールドの値>")
- 新しく選択されたモデルを使用してユーザーのメッセージに答えます。
ティアルーティングテーブル
| ティア | モデル | 理由 |
|---|---|---|
| simple | ollama/dengcao/Qwen3-32B:Q5_K_M | 無料のローカルモデル、基本的なタスク対応 |
| moderate | anthropic/claude-sonnet-4-5 | コストと性能のバランス型 |
| coding | openai-codex/gpt-5.2 | コード生成・デバッグに最適化 |
| complex | anthropic/claude-opus-4-5 | 最大の推論能力 |
フォールバック動作
Ollamaに到達できない、または分類器が失敗した場合は、moderate(Sonnet)にデフォルト設定されます。 モデルが無効なティアを返した場合、正規化機能が最適なマッチを選択します。
重要な注意事項
- トリアージモデル(qwen3:1.7b)はlocalhost:11434でOllamaを介してローカルで実行されます。
- 分類は通常500ms以下で完了します。
- 速度向上のため think:false を使用して推論モードを無効化しています。
- 同じ会話ターン内のフォローアップメッセージは再分類しないでください。
- ユーザーが特定のモデルを明示的にリクエストしている場合(例:「このタスクはopusで実行してほしい」)は、それを優先してください。
ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ
詳細情報
- 作者
- ColeMatthewBienek
- ライセンス
- MIT
- 最終更新
- 2026/2/6
Source: https://github.com/ColeMatthewBienek/IntelliRouter / ライセンス: MIT