汎用LLM・AI開発⭐ リポ 9品質スコア 70/100

cost-management

Name: cost-management
Author: marvinrichter

Claude APIのコスト認識 — Claude Codeセッションのトークン推定、コスト要因、効率化戦略

description の原文を見る

Claude API cost awareness — token estimation, cost drivers, and efficiency strategies for Claude Code sessions

SKILL.md 本文

コスト管理 — Claude API トークン認識

有効化するタイミング

ユーザーが Claude API のコストやトークン使用量について質問している
セッションが予期しない高い tool call 量を示している
コストが重要な新規プロジェクトをセットアップしている
長時間の自動セッションまたは夜間パイプラインを計画している
Haiku、Sonnet、Opus の特定のタスクまたはエージェント役割での選択
特定のワークフローが予想より多くトークンを消費した理由をデバッグしている
複数エージェントパイプラインを設計していて、call あたりのコストが急速に増加する場合

重要な理由

Claude Code ユーザーからの実データ：

Aider ユーザー: 気づかないうちに数日で「$35～40」(Issue #605)
Cline ユーザー: 気づかないうちに「1 日 $50」(Discussion #1727)
1 回の集中的なセッション: 100～300k トークン = Claude Sonnet で $0.30～$4.50

トークン可視化は、すべての主要 AI コーディングツール全体で最も要望された機能です。 clarc は session-end フックを通じてこれを自動的に追跡します。

モデルコスト参考(2026年)

モデル	入力	出力
Claude Haiku 4.5	約 $0.25 / M トークン	約 $1.25 / M トークン
Claude Sonnet 4.6	約 $3.00 / M トークン	約 $15.00 / M トークン
Claude Opus 4.6	約 $15.00 / M トークン	約 $75.00 / M トークン

価格は変更される場合があります。常に console.anthropic.com で確認してください。

経験則: 出力トークンの価格は入力トークンの 5 倍です。冗長な出力を最小化してください。

コスト要因 — セッションを高額にする要因

1. 大きなファイルの完全読み込み

高額: 1 つの関数を見つけるために 2000 行のファイル全体を読む
安価: 関数を grep し、関連する 20 行のみを Read する

2. エージェント連鎖

各エージェント call = 新しいコンテキストウィンドウ = 新しいコスト。大規模コードベースの 5 つの連続エージェントは簡単に $1～2 の費用がかかります。

3. コンテキスト内の画像とスクリーンショット

ビジョン入力は入力トークンが多く必要です。1 枚のスクリーンショット ≈ 1,000～5,000 トークン。

4. `/compact` なしの長いセッション

コンテキストは蓄積します。/compact なしの 4 時間セッションは、すべての新しい tool call に 200k 以上のトークンの以前のコンテキストを持ち越す可能性があります。(/compact は Claude Code 組み込みコマンドであり、clarc コマンドではありません。)

5. ワイドな glob パターン

大規模リポジトリで Glob **/* を実行すると、数千のパスが返されます — すべて入力トークンとして。

効率戦略

Read の前に Grep

ファイル全体をロードする代わりに、まず関連する行を検索します：

// 高額 — 500 行すべてをコンテキストにロード:
Read { file_path: "src/api/users.ts" }

// 安価 — まず行番号を見つけ、その後 30 行のみを Read:
Grep { pattern: "getUserById", path: "src/api/", output_mode: "content", -n: true }
// → src/api/users.ts:47:export async function getUserById(id: string) {

Read { file_path: "src/api/users.ts", offset: 47, limit: 30 }

500 行ファイルでは、1 回のルックアップあたり約 470 行の入力トークンが節約されます。50 ファイルセッション全体では、節約は数万トークンに複利で増加します。

シンプルなタスクは Haiku に委譲

Haiku は Sonnet より約 8 倍安くすみます。以下に使用します：

要約
シンプルな変換
テキストからの構造化データの抽出
ボイラープレートの記述

/compact を積極的に使用

コンテキストが 60% 以上になったら /compact(Claude Code 組み込みコマンド)を実行します。サマリーのコストは約 $0.01 で、その後の call でより多くを節約できます。

スコープ管理

明確なタスク境界はスコープクリープを防ぎます。「getUserById の null チェックを修正」は「認証モジュール全体をレビュー」より 10 倍安くすみます。

エージェント分離

エージェントはメインコンテキストを保護します。ファイル分析を行う Haiku サブエージェントのコストは、それらのファイルをすべて Sonnet メインコンテキストにロードするより大幅に安くなります。

clarc でのコスト追跡

clarc は推定セッションコストを ~/.clarc/cost-log.jsonl に自動的にログします。

# 最近のコストログエントリを表示
tail -5 ~/.clarc/cost-log.jsonl | jq .

# /session-cost コマンドを実行してフォーマットされた要約を取得
/session-cost

~/.clarc/cost-log.jsonl エントリの例:

{"date":"2026-03-12","session_id":"ses_abc123","model":"claude-sonnet-4-6","tool_calls":{"Read":14,"Grep":8,"Edit":6,"Bash":4,"Agent":1},"est_input_tokens":42000,"est_output_tokens":8500,"est_cost_usd":0.25,"duration_min":22}
{"date":"2026-03-12","session_id":"ses_def456","model":"claude-sonnet-4-6","tool_calls":{"Read":31,"Grep":5,"Edit":12,"Bash":9,"Agent":3},"est_input_tokens":98000,"est_output_tokens":21000,"est_cost_usd":0.61,"duration_min":51}
{"date":"2026-03-11","session_id":"ses_ghi789","model":"claude-opus-4-6","tool_calls":{"Read":8,"Grep":3,"Edit":2,"Bash":2,"Agent":0},"est_input_tokens":18000,"est_output_tokens":4200,"est_cost_usd":0.59,"duration_min":14}

重要なフィールド: tool_calls はどのツールがコストを駆動したかを示します。est_cost_usd はセッション推定値です。Agent call は call あたり最も高額です(各々新しいコンテキストウィンドウを生成します)。

重要: これらは tool call カウントヒューリスティクスに基づいた推定値です。正確なコストについては、console.anthropic.com → Billing を確認してください。

どのモデルを使用するか

タスク	モデル	理由
コードレビュー、TDD、標準開発	Sonnet	最高の品質/コスト比
軽量な分析、要約	Haiku	約 8 倍のコスト削減
アーキテクチャの決定、複雑なデバッグ	Opus	深い推論が必要
パイプライン内のワーカーエージェント	Haiku	大量、低リスク
マルチエージェント内のオーケストレーター	Sonnet	調整の複雑性

詳細情報

作者: marvinrichter
リポジトリ: marvinrichter/clarc
ライセンス: MIT
最終更新: 2026/4/27

GitHubで原本を見る →フィードバックを送る

Source: https://github.com/marvinrichter/clarc / ライセンス: MIT

cost-management

SKILL.md 本文

コスト管理 — Claude API トークン認識

有効化するタイミング

重要な理由

モデルコスト参考(2026年)

コスト要因 — セッションを高額にする要因

1. 大きなファイルの完全読み込み

2. エージェント連鎖

3. コンテキスト内の画像とスクリーンショット

4. `/compact` なしの長いセッション

5. ワイドな glob パターン

効率戦略

Read の前に Grep

シンプルなタスクは Haiku に委譲

/compact を積極的に使用

スコープ管理

エージェント分離

clarc でのコスト追跡

どのモデルを使用するか

関連項目

詳細情報

関連スキル

agent-browser

anyskill

engram

skyvern

pinchbench

openui

SKILL.md 本文

コスト管理 — Claude API トークン認識

有効化するタイミング

重要な理由

モデルコスト参考(2026年)

コスト要因 — セッションを高額にする要因

1. 大きなファイルの完全読み込み

2. エージェント連鎖

3. コンテキスト内の画像とスクリーンショット

4. /compact なしの長いセッション

5. ワイドな glob パターン

効率戦略

Read の前に Grep

シンプルなタスクは Haiku に委譲

/compact を積極的に使用

スコープ管理

エージェント分離

clarc でのコスト追跡

どのモデルを使用するか

関連項目

詳細情報

関連スキル

agent-browser

anyskill

engram

skyvern

pinchbench

openui

4. `/compact` なしの長いセッション