cost-management
Claude APIのコスト認識 — Claude Codeセッションのトークン推定、コスト要因、効率化戦略
description の原文を見る
Claude API cost awareness — token estimation, cost drivers, and efficiency strategies for Claude Code sessions
SKILL.md 本文
コスト管理 — Claude API トークン認識
有効化するタイミング
- ユーザーが Claude API のコストやトークン使用量について質問している
- セッションが予期しない高い tool call 量を示している
- コストが重要な新規プロジェクトをセットアップしている
- 長時間の自動セッションまたは夜間パイプラインを計画している
- Haiku、Sonnet、Opus の特定のタスクまたはエージェント役割での選択
- 特定のワークフローが予想より多くトークンを消費した理由をデバッグしている
- 複数エージェントパイプラインを設計していて、call あたりのコストが急速に増加する場合
重要な理由
Claude Code ユーザーからの実データ:
- Aider ユーザー: 気づかないうちに数日で「$35~40」(Issue #605)
- Cline ユーザー: 気づかないうちに「1 日 $50」(Discussion #1727)
- 1 回の集中的なセッション: 100~300k トークン = Claude Sonnet で $0.30~$4.50
トークン可視化は、すべての主要 AI コーディングツール全体で最も要望された機能です。
clarc は session-end フックを通じてこれを自動的に追跡します。
モデルコスト参考(2026年)
| モデル | 入力 | 出力 |
|---|---|---|
| Claude Haiku 4.5 | 約 $0.25 / M トークン | 約 $1.25 / M トークン |
| Claude Sonnet 4.6 | 約 $3.00 / M トークン | 約 $15.00 / M トークン |
| Claude Opus 4.6 | 約 $15.00 / M トークン | 約 $75.00 / M トークン |
価格は変更される場合があります。常に console.anthropic.com で確認してください。
経験則: 出力トークンの価格は入力トークンの 5 倍です。冗長な出力を最小化してください。
コスト要因 — セッションを高額にする要因
1. 大きなファイルの完全読み込み
高額: 1 つの関数を見つけるために 2000 行のファイル全体を読む
安価: 関数を grep し、関連する 20 行のみを Read する
2. エージェント連鎖
各エージェント call = 新しいコンテキストウィンドウ = 新しいコスト。 大規模コードベースの 5 つの連続エージェントは簡単に $1~2 の費用がかかります。
3. コンテキスト内の画像とスクリーンショット
ビジョン入力は入力トークンが多く必要です。1 枚のスクリーンショット ≈ 1,000~5,000 トークン。
4. /compact なしの長いセッション
コンテキストは蓄積します。/compact なしの 4 時間セッションは、すべての新しい tool call に 200k 以上のトークンの以前のコンテキストを持ち越す可能性があります。(/compact は Claude Code 組み込みコマンドであり、clarc コマンドではありません。)
5. ワイドな glob パターン
大規模リポジトリで Glob **/* を実行すると、数千のパスが返されます — すべて入力トークンとして。
効率戦略
Read の前に Grep
ファイル全体をロードする代わりに、まず関連する行を検索します:
// 高額 — 500 行すべてをコンテキストにロード:
Read { file_path: "src/api/users.ts" }
// 安価 — まず行番号を見つけ、その後 30 行のみを Read:
Grep { pattern: "getUserById", path: "src/api/", output_mode: "content", -n: true }
// → src/api/users.ts:47:export async function getUserById(id: string) {
Read { file_path: "src/api/users.ts", offset: 47, limit: 30 }
500 行ファイルでは、1 回のルックアップあたり約 470 行の入力トークンが節約されます。50 ファイルセッション全体では、節約は数万トークンに複利で増加します。
シンプルなタスクは Haiku に委譲
Haiku は Sonnet より約 8 倍安くすみます。以下に使用します:
- 要約
- シンプルな変換
- テキストからの構造化データの抽出
- ボイラープレートの記述
/compact を積極的に使用
コンテキストが 60% 以上になったら /compact(Claude Code 組み込みコマンド)を実行します。サマリーのコストは約 $0.01 で、その後の call でより多くを節約できます。
スコープ管理
明確なタスク境界はスコープ クリープを防ぎます。「getUserById の null チェックを修正」は「認証モジュール全体をレビュー」より 10 倍安くすみます。
エージェント分離
エージェントはメインコンテキストを保護します。ファイル分析を行う Haiku サブエージェントのコストは、それらのファイルをすべて Sonnet メインコンテキストにロードするより大幅に安くなります。
clarc でのコスト追跡
clarc は推定セッションコストを ~/.clarc/cost-log.jsonl に自動的にログします。
# 最近のコストログエントリを表示
tail -5 ~/.clarc/cost-log.jsonl | jq .
# /session-cost コマンドを実行してフォーマットされた要約を取得
/session-cost
~/.clarc/cost-log.jsonl エントリの例:
{"date":"2026-03-12","session_id":"ses_abc123","model":"claude-sonnet-4-6","tool_calls":{"Read":14,"Grep":8,"Edit":6,"Bash":4,"Agent":1},"est_input_tokens":42000,"est_output_tokens":8500,"est_cost_usd":0.25,"duration_min":22}
{"date":"2026-03-12","session_id":"ses_def456","model":"claude-sonnet-4-6","tool_calls":{"Read":31,"Grep":5,"Edit":12,"Bash":9,"Agent":3},"est_input_tokens":98000,"est_output_tokens":21000,"est_cost_usd":0.61,"duration_min":51}
{"date":"2026-03-11","session_id":"ses_ghi789","model":"claude-opus-4-6","tool_calls":{"Read":8,"Grep":3,"Edit":2,"Bash":2,"Agent":0},"est_input_tokens":18000,"est_output_tokens":4200,"est_cost_usd":0.59,"duration_min":14}
重要なフィールド: tool_calls はどのツールがコストを駆動したかを示します。est_cost_usd はセッション推定値です。Agent call は call あたり最も高額です(各々新しいコンテキストウィンドウを生成します)。
重要: これらは tool call カウントヒューリスティクスに基づいた推定値です。 正確なコストについては、console.anthropic.com → Billing を確認してください。
どのモデルを使用するか
| タスク | モデル | 理由 |
|---|---|---|
| コードレビュー、TDD、標準開発 | Sonnet | 最高の品質/コスト比 |
| 軽量な分析、要約 | Haiku | 約 8 倍のコスト削減 |
| アーキテクチャの決定、複雑なデバッグ | Opus | 深い推論が必要 |
| パイプライン内のワーカーエージェント | Haiku | 大量、低リスク |
| マルチエージェント内のオーケストレーター | Sonnet | 調整の複雑性 |
関連項目
/session-cost— セッションコスト要約を表示scripts/hooks/auto-checkpoint.js— 高額な操作の前にチェックポイントskills/cost-aware-llm-pipeline— コスト効率的なマルチエージェントパイプラインの設計
ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ
詳細情報
- 作者
- marvinrichter
- リポジトリ
- marvinrichter/clarc
- ライセンス
- MIT
- 最終更新
- 2026/4/27
Source: https://github.com/marvinrichter/clarc / ライセンス: MIT