intelli-router
ローカルのOllamaモデル(qwen3:1.7b)を使用して受信したユーザーメッセージを複雑度で自動判定し、session_statusを経由して最適なAIモデルへルーティングするインテリジェントなモデルルーターです。すべての受信メッセージに対応し、シンプルなタスクはローカルモデル(Ollama経由のdengcao/Qwen3-32B:Q5_K_M)、中程度のタスクはClaude Sonnet、コーディングタスクはCodex、複雑なタスクはClaude Opusへと自動的に振り分けます。スラッシュコマンド以外のユーザーメッセージで発動し、モデルルーティング、トリアージ、分類、複雑度判定、コスト最適化、スマートルーティングを実現します。
description の原文を見る
Intelligent model router that triages every incoming user message by complexity using a local Ollama model (qwen3:1.7b), then routes to the optimal AI model via session_status. Use on ALL incoming user messages to automatically select between local models (dengcao/Qwen3-32B:Q5_K_M via Ollama) for simple tasks, Claude Sonnet for moderate tasks, Codex for coding tasks, and Claude Opus for complex tasks. Triggers on any user message that is not a slash command. Keywords: model routing, triage, classify, complexity, cost optimization, smart routing.
SKILL.md 本文
Intelli-Router: 自動モデルルーティング
目的
各ユーザーメッセージに対して、タスクの複雑さに基づいて最適なモデルを自動的に選択します。 シンプルなタスクはローカルで処理し、複雑なタスクが必要な場合のみ高コストのAPIモデルにエスカレートすることで、コストを削減します。
起動タイミング
すべての受信ユーザーメッセージに対して、応答を生成する前に分類ステップを実行してください。 "/" で始まるメッセージ(コマンド)は分類しないでください。
ワークフロー
- ユーザーのメッセージ全文を取得します。
- 分類器を実行します:
python3 {baseDir}/scripts/classify.py "USER_MESSAGE_HERE"
- JSON出力を解析します。以下の形式で返されます:
{"model": "provider/model-name", "tier": "simple|moderate|coding|complex", "reason": "..."}
- 出力の
modelフィールドの値を使用してセッションモデルを切り替えます:
session_status(model="<model フィールドの値>")
- 新しく選択されたモデルを使用してユーザーのメッセージに答えます。
ティアルーティングテーブル
| ティア | モデル | 理由 |
|---|---|---|
| simple | ollama/dengcao/Qwen3-32B:Q5_K_M | 無料のローカルモデル、基本的なタスク対応 |
| moderate | anthropic/claude-sonnet-4-5 | コストと性能のバランス型 |
| coding | openai-codex/gpt-5.2 | コード生成・デバッグに最適化 |
| complex | anthropic/claude-opus-4-5 | 最大の推論能力 |
フォールバック動作
Ollamaに到達できない、または分類器が失敗した場合は、moderate(Sonnet)にデフォルト設定されます。 モデルが無効なティアを返した場合、正規化機能が最適なマッチを選択します。
重要な注意事項
- トリアージモデル(qwen3:1.7b)はlocalhost:11434でOllamaを介してローカルで実行されます。
- 分類は通常500ms以下で完了します。
- 速度向上のため think:false を使用して推論モードを無効化しています。
- 同じ会話ターン内のフォローアップメッセージは再分類しないでください。
- ユーザーが特定のモデルを明示的にリクエストしている場合(例:「このタスクはopusで実行してほしい」)は、それを優先してください。
ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ
詳細情報
- 作者
- ColeMatthewBienek
- ライセンス
- MIT
- 最終更新
- 2026/2/6
Source: https://github.com/ColeMatthewBienek/IntelliRouter / ライセンス: MIT
関連スキル
agent-browser
AI エージェント向けのブラウザ自動化 CLI です。ウェブサイトとの対話が必要な場合に使用します。ページ遷移、フォーム入力、ボタンクリック、スクリーンショット取得、データ抽出、ウェブアプリのテスト、ブラウザ操作の自動化など、あらゆるブラウザタスクに対応できます。「ウェブサイトを開く」「フォームに記入する」「ボタンをクリックする」「スクリーンショットを取得する」「ページからデータを抽出する」「このウェブアプリをテストする」「サイトにログインする」「ブラウザ操作を自動化する」といった要求や、プログラマティックなウェブ操作が必要なタスクで起動します。
anyskill
AnySkill — あなたのプライベート・スキルクラウド。GitHubを基盤としたリポジトリからエージェントスキルを管理、同期、動的にロードできます。自然言語でクラウドスキルを検索し、オンデマンドでプロンプトを自動ロード、カスタムスキルのアップロードと共有、スキルバンドルの一括インストールが可能です。OpenClaw、Antigravity、Claude Code、Cursorに対応しています。
engram
AIエージェント向けの永続的なメモリシステムです。バグ修正、意思決定、発見、設定変更の後はmem_saveを使用してください。ユーザーが「覚えている」「記憶している」と言及した場合、または以前のセッションと重複する作業を開始する際はmem_searchを使用します。セッション終了前にmem_session_summaryを使用して、コンテキストを保持してください。
skyvern
AI駆動のブラウザ自動化により、任意のウェブサイトを自動化できます。フォーム入力、データ抽出、ファイルダウンロード、ログイン、複数ステップのワークフロー実行など、ユーザーがウェブサイトと連携する必要があるときに使用します。Skyvernは、LLMとコンピュータビジョンを活用して、未知のサイトも自動操作可能です。Python SDK、TypeScript SDK、REST API、MCPサーバー、またはCLIを通じて統合できます。
pinchbench
PinchBenchベンチマークを実行して、OpenClawエージェントの実世界タスクにおけるパフォーマンスを評価できます。モデルの機能テスト、モデル間の比較、ベンチマーク結果のリーダーボード提出、またはOpenClawのセットアップがカレンダー、メール、リサーチ、コーディング、複数ステップのワークフローにどの程度対応しているかを確認する際に使用します。
openui
OpenUIとOpenUI Langを使用してジェネレーティブUIアプリを構築できます。これらはLLM生成インターフェースのためのトークン効率的なオープン標準です。OpenUI、@openuidev、ジェネレーティブUI、LLMからのストリーミングUI、AI向けコンポーネントライブラリ、またはjson-render/A2UIの置き換えについて述べる際に使用します。スキャフォルディング、defineComponent、システムプロンプト、Renderer、およびOpenUI Lang出力のデバッグに対応しています。