context-engineering
Claude APIのワークフローとエージェントセッションにおいて、コンテキストウィンドウをコスト、パフォーマンス、品質の観点から管理します。マルチステップのエージェントパイプラインの構築、繰り返されるAPI呼び出し用のシステムプロンプト設計、長時間のコーディングセッション管理、またはエージェントのパフォーマンス低下のデバッグを行う際に活用できます。KVキャッシュの最適化、トークン予算管理、サブエージェントの委譲、圧縮、注意メカニズム、および200Kのプライシングの段階差に対応しています。
description の原文を見る
Manages context window for cost, performance, and quality in Claude API workflows and agent sessions. Use when building multi-step agent pipelines, designing system prompts for repeated API calls, managing long coding sessions, or debugging degraded agent performance. Covers KV cache optimization, token budgeting, subagent delegation, compaction, attention mechanics, and the 200K pricing cliff.
SKILL.md 本文
コンテキストエンジニアリング
目的
LLMに送信するすべてのトークンはコストがかかり、レイテンシーが増加し、約32Kトークンを超えるとモデルのパフォーマンスが低下します。コンテキストエンジニアリングは、個別のセッションと本番APIパイプラインの両方にわたって、目的の結果を達成する最小限の高シグナルトークンセットを提供する学問です。
$0.50のクエリと$5.00のクエリの違いは、プロンプトエンジニアリングではなくコンテキスト管理です。
使用時期
- エージェントパイプライン設計: 複数ステップのClaude API ワークフローを構築する前に
- システムプロンプトアーキテクチャ: 繰り返し呼び出しするプロンプトを構造化する際
- 長時間のコーディングセッション: コンテキストが上限に近い場合(70%以上の利用率)
- パフォーマンスの低下: エージェントがセッション途中で軌道を失う場合
- コスト検討: エージェントのコストが予想を超える場合
- スケール準備: プロトタイプから本番ボリュームへの移行前
核心概念
コンテキストは推論時にモデルが利用できるすべてのものです:システムプロンプト、ツール定義、取得したドキュメント、メッセージ履歴、ツール出力(通常は全トークンの80%以上)。
コ
...
詳細情報
- 作者
- get-caio
- リポジトリ
- get-caio/harness
- ライセンス
- 不明
- 最終更新
- 2026/4/24
Source: https://github.com/get-caio/harness / ライセンス: 未指定