トークンルーティング

執事は眉をひそめる。grepにOpus？彼はルーティングテーブルを取り出し、正しい行を指差す。

適切なモデルを適切なロールに割り当てる。目的：予算を無駄遣いしないこと。

ルーティングテーブル

ロール	モデル	理由
メインセッション	Sonnet	良好なコスト/品質比
Exploreサブエージェント	Haiku	高速、安価、読み込みに十分
テスト / lint	Haiku	機械的なタスク
重要なアーキテクチャ	Opus	深い推論
ブロッキングデバッグ	Opus (`/effort high`経由)	Sonnetが堂々巡りの場合

現在の設定

.claude/settings.json を確認してください：

{
  "model": "sonnet",
  "env": {
    "CLAUDE_CODE_SUBAGENT_MODEL": "haiku",
    "MAX_THINKING_TOKENS": "10000"
  }
}

これが解決する問題

ルーティングなしでは、夜間セッションは10倍以上のトークンを消費する可能性があります：

50個のファイルを探索するのにOpusを使う = 💸💸💸
50個のファイルを探索するのにHaikuを使う = 💰 (50倍安い)

ルーティングは時期尚早な最適化ではありません。これは ナイトモードでの予算生存戦略です。

自動アップ / ダウンサイクル

low ──────── medium ──────── high
 ↑  自動ダウン  ↑  自動アップ  ↑
 │             │             │
 │  名前変更、   │  実装        │  アーキテクチャ
 │  タイプミス  │  バグ修正    │  計画、設計
 │  検索、grep │  機能        │  DBマイグレーション
 │  フォーマット│  テスト      │  ブロッキングデバッグ
 │  lint       │              │
 │  ~2kトークン│  ~10kトークン│  ~30k以上のトークン

アップ ：Claudeが複雑な語彙フィールドを検出 → まず現在のレベルを確認。既に high または max の場合 → 何も言わない。そうでなければ → アップして「このタスクのために努力レベルを上げます」と通知します。

ダウン ：複雑なタスクが完了 → ダウンして「アーキテクチャのタスクが完了しました。努力レベルを中程度に戻します」と通知します。

ナイトモード ：探索（grep、読み取り）に low を強制、実装に medium を使用。ブロッキングバグ以外は high を使用しないでください（主な目的：一夜でトークンをすべて無駄遣いしないこと）。

セッション中にモデルを変更する

/model コマンドはClaude Code内でミッドセッション動作します：

/model haiku    # Haikuに切り替え（探索、ウォッチドッグ）
/model sonnet   # Sonnetに切り替え（標準開発）
/model opus     # Opusに切り替え（アーキテクチャ、ブロッキングデバッグ）

Claudeは、アクティブなモデルが現在のタスクに対してオーバースペック化している場合に通知し、正確なコマンドを提案します。

アクション

設定が配置されていない場合 → settings.jsonに追加することを提案します。設定が配置されている場合 → テーブルを表示して、すべてが設定されていることを確認します。

ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ

token-routing

SKILL.md 本文