Agent Skills by ALSEL
汎用LLM・AI開発⭐ リポ 9品質スコア 70/100

cost-management

Claude APIのコスト認識 — Claude Codeセッションのトークン推定、コスト要因、効率化戦略

description の原文を見る

Claude API cost awareness — token estimation, cost drivers, and efficiency strategies for Claude Code sessions

SKILL.md 本文

コスト管理 — Claude API トークン認識

有効化するタイミング

  • ユーザーが Claude API のコストやトークン使用量について質問している
  • セッションが予期しない高い tool call 量を示している
  • コストが重要な新規プロジェクトをセットアップしている
  • 長時間の自動セッションまたは夜間パイプラインを計画している
  • Haiku、Sonnet、Opus の特定のタスクまたはエージェント役割での選択
  • 特定のワークフローが予想より多くトークンを消費した理由をデバッグしている
  • 複数エージェントパイプラインを設計していて、call あたりのコストが急速に増加する場合

重要な理由

Claude Code ユーザーからの実データ:

  • Aider ユーザー: 気づかないうちに数日で「$35~40」(Issue #605)
  • Cline ユーザー: 気づかないうちに「1 日 $50」(Discussion #1727)
  • 1 回の集中的なセッション: 100~300k トークン = Claude Sonnet で $0.30~$4.50

トークン可視化は、すべての主要 AI コーディングツール全体で最も要望された機能です。 clarc は session-end フックを通じてこれを自動的に追跡します。

モデルコスト参考(2026年)

モデル入力出力
Claude Haiku 4.5約 $0.25 / M トークン約 $1.25 / M トークン
Claude Sonnet 4.6約 $3.00 / M トークン約 $15.00 / M トークン
Claude Opus 4.6約 $15.00 / M トークン約 $75.00 / M トークン

価格は変更される場合があります。常に console.anthropic.com で確認してください。

経験則: 出力トークンの価格は入力トークンの 5 倍です。冗長な出力を最小化してください。

コスト要因 — セッションを高額にする要因

1. 大きなファイルの完全読み込み

高額: 1 つの関数を見つけるために 2000 行のファイル全体を読む
安価: 関数を grep し、関連する 20 行のみを Read する

2. エージェント連鎖

各エージェント call = 新しいコンテキストウィンドウ = 新しいコスト。 大規模コードベースの 5 つの連続エージェントは簡単に $1~2 の費用がかかります。

3. コンテキスト内の画像とスクリーンショット

ビジョン入力は入力トークンが多く必要です。1 枚のスクリーンショット ≈ 1,000~5,000 トークン。

4. /compact なしの長いセッション

コンテキストは蓄積します。/compact なしの 4 時間セッションは、すべての新しい tool call に 200k 以上のトークンの以前のコンテキストを持ち越す可能性があります。(/compact は Claude Code 組み込みコマンドであり、clarc コマンドではありません。)

5. ワイドな glob パターン

大規模リポジトリで Glob **/* を実行すると、数千のパスが返されます — すべて入力トークンとして。

効率戦略

Read の前に Grep

ファイル全体をロードする代わりに、まず関連する行を検索します:

// 高額 — 500 行すべてをコンテキストにロード:
Read { file_path: "src/api/users.ts" }

// 安価 — まず行番号を見つけ、その後 30 行のみを Read:
Grep { pattern: "getUserById", path: "src/api/", output_mode: "content", -n: true }
// → src/api/users.ts:47:export async function getUserById(id: string) {

Read { file_path: "src/api/users.ts", offset: 47, limit: 30 }

500 行ファイルでは、1 回のルックアップあたり約 470 行の入力トークンが節約されます。50 ファイルセッション全体では、節約は数万トークンに複利で増加します。

シンプルなタスクは Haiku に委譲

Haiku は Sonnet より約 8 倍安くすみます。以下に使用します:

  • 要約
  • シンプルな変換
  • テキストからの構造化データの抽出
  • ボイラープレートの記述

/compact を積極的に使用

コンテキストが 60% 以上になったら /compact(Claude Code 組み込みコマンド)を実行します。サマリーのコストは約 $0.01 で、その後の call でより多くを節約できます。

スコープ管理

明確なタスク境界はスコープ クリープを防ぎます。「getUserById の null チェックを修正」は「認証モジュール全体をレビュー」より 10 倍安くすみます。

エージェント分離

エージェントはメインコンテキストを保護します。ファイル分析を行う Haiku サブエージェントのコストは、それらのファイルをすべて Sonnet メインコンテキストにロードするより大幅に安くなります。

clarc でのコスト追跡

clarc は推定セッションコストを ~/.clarc/cost-log.jsonl に自動的にログします。

# 最近のコストログエントリを表示
tail -5 ~/.clarc/cost-log.jsonl | jq .

# /session-cost コマンドを実行してフォーマットされた要約を取得
/session-cost

~/.clarc/cost-log.jsonl エントリの例:

{"date":"2026-03-12","session_id":"ses_abc123","model":"claude-sonnet-4-6","tool_calls":{"Read":14,"Grep":8,"Edit":6,"Bash":4,"Agent":1},"est_input_tokens":42000,"est_output_tokens":8500,"est_cost_usd":0.25,"duration_min":22}
{"date":"2026-03-12","session_id":"ses_def456","model":"claude-sonnet-4-6","tool_calls":{"Read":31,"Grep":5,"Edit":12,"Bash":9,"Agent":3},"est_input_tokens":98000,"est_output_tokens":21000,"est_cost_usd":0.61,"duration_min":51}
{"date":"2026-03-11","session_id":"ses_ghi789","model":"claude-opus-4-6","tool_calls":{"Read":8,"Grep":3,"Edit":2,"Bash":2,"Agent":0},"est_input_tokens":18000,"est_output_tokens":4200,"est_cost_usd":0.59,"duration_min":14}

重要なフィールド: tool_calls はどのツールがコストを駆動したかを示します。est_cost_usd はセッション推定値です。Agent call は call あたり最も高額です(各々新しいコンテキストウィンドウを生成します)。

重要: これらは tool call カウントヒューリスティクスに基づいた推定値です。 正確なコストについては、console.anthropic.com → Billing を確認してください。

どのモデルを使用するか

タスクモデル理由
コードレビュー、TDD、標準開発Sonnet最高の品質/コスト比
軽量な分析、要約Haiku約 8 倍のコスト削減
アーキテクチャの決定、複雑なデバッグOpus深い推論が必要
パイプライン内のワーカーエージェントHaiku大量、低リスク
マルチエージェント内のオーケストレーターSonnet調整の複雑性

関連項目

  • /session-cost — セッションコスト要約を表示
  • scripts/hooks/auto-checkpoint.js — 高額な操作の前にチェックポイント
  • skills/cost-aware-llm-pipeline — コスト効率的なマルチエージェントパイプラインの設計

ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ

詳細情報

作者
marvinrichter
リポジトリ
marvinrichter/clarc
ライセンス
MIT
最終更新
2026/4/27

Source: https://github.com/marvinrichter/clarc / ライセンス: MIT

本サイトは GitHub 上で公開されているオープンソースの SKILL.md ファイルをクロール・インデックス化したものです。 各スキルの著作権は原作者に帰属します。掲載に問題がある場合は info@alsel.co.jp または /takedown フォームよりご連絡ください。
原作者: marvinrichter · marvinrichter/clarc · ライセンス: MIT