Anthropic Claudeその他⭐ リポ 0品質スコア 50/100

context-optimization

Name: context-optimization
Author: sickn33

コンテキストの圧縮・マスキング・キャッシュ・分割といった戦略的手法により、限られたコンテキストウィンドウの実効容量を最大限に引き出すスキルです。コンテキストウィンドウそのものを拡張するのではなく、利用可能な容量をより効率的に活用することを目的としています。

description の原文を見る

Context optimization extends the effective capacity of limited context windows through strategic compression, masking, caching, and partitioning. The goal is not to magically increase context windows but to make better use of available capacity.

SKILL.md 本文

コンテキスト最適化テクニック

コンテキスト最適化は、戦略的な圧縮、マスキング、キャッシング、パーティショニングを通じて、制限されたコンテキストウィンドウの有効容量を拡張します。目標はコンテキストウィンドウを魔法のように増やすことではなく、利用可能な容量をより効果的に活用することです。効果的な最適化により、より大きなモデルやより長いコンテキストを必要とせずに、有効なコンテキスト容量を2～3倍に増やすことができます。

使用する時機

以下の場合にこのスキルを有効にします：

コンテキスト制限がタスクの複雑性を制約している
コスト削減を最適化したい（トークンが少ない = 費用が低い）
長い会話のレイテンシを削減したい
長時間実行されるエージェントシステムを実装している
より大きなドキュメントや会話を処理する必要がある
本番環境で大規模なシステムを構築している

コアコンセプト

コンテキスト最適化は、4つの主要な戦略を通じて有効容量を拡張します：圧縮（コンテキスト制限に近づいた時点で要約）、観測マスキング（冗長な出力をリファレンスに置き換え）、KV キャッシュ最適化（キャッシュされた計算の再利用）、コンテキストパーティショニング（独立したコンテキスト間での作業分割）。

重要な洞察は、コンテキストの質が量よりも重要だということです。最適化は信号を保存しながらノイズを削減します。技術は、保持するものと破棄するものを選択すること、および各テクニックをいつ適用するかを選択することにあります。

詳細トピック

圧縮戦略

圧縮とは何か 圧縮は、制限に近づいた時点でコンテキスト内容を要約し、その要約で新しいコンテキストウィンドウを再初期化する実践です。これによりコンテキストウィンドウの内容を高い忠実度で蒸留でき、エージェントが最小限のパフォーマンス低下で続行できます。

圧縮は通常、コンテキスト最適化における最初の手段として機能します。技術は保持するものと破棄するものを選択することにあります。

圧縮の実装 圧縮は、圧縮可能なセクションを特定し、重要なポイントをキャプチャする要約を生成し、完全なコンテンツを要約に置き換えることで機能します。圧縮の優先順位は、ツール出力（要約に置き換え）、古いターン（早期の会話を要約）、取得したドキュメント（より新しいバージョンが存在する場合は要約）の順で、システムプロンプトは圧縮しません。

要約生成 効果的な要約は、メッセージタイプに応じて異なる要素を保存します：

ツール出力：主要な発見、メトリクス、結論を保存します。冗長な生出力は削除します。

会話のターン：主要な決定、コミットメント、コンテキスト変化を保存します。フィラーと往復は削除します。

取得したドキュメント：主要な事実と主張を保存します。根拠資料と説明は削除します。

観測マスキング

観測の問題 ツール出力は、エージェント軌跡のトークン使用量の80%以上を占める可能性があります。その多くは、すでに目的を果たした冗長な出力です。エージェントがツール出力を使用して決定を下した後、完全な出力を保持すると、有効なコンテキストを消費しながら価値が低下し続けます。

観測マスキングは、冗長なツール出力をコンパクトなリファレンスに置き換えます。情報は必要に応じて依然としてアクセス可能ですが、継続的にコンテキストを消費しません。

マスキング戦略の選択 すべての観測が同等にマスキングされるべきではありません：

マスキングしない：現在のタスクに重要な観測、最後のターンからの観測、アクティブな推論で使用される観測。

マスキングを検討：3ターン以上前の観測、重要なポイントが抽出可能な冗長な出力、目的が果たされた観測。

常にマスキング：繰り返される出力、定型ヘッダー/フッター、会話で既に要約された出力。

KV キャッシュ最適化

KV キャッシュの理解 KV キャッシュは、推論中に計算されたキーおよびバリューテンソルを保存し、シーケンス長に比例して増加します。同一プレフィックスを共有するリクエスト間でKV キャッシュをキャッシングすると、再計算を避けます。

プレフィックスキャッシングは、ハッシュベースのブロックマッチングを使用して、同一プレフィックスを持つリクエスト間でKVブロックを再利用します。これにより、システムプロンプトなどの共通プレフィックスを持つリクエストのコストとレイテンシを劇的に削減します。

キャッシュ最適化パターン キャッシュヒット率を最大化するためにコンテキスト要素を並び替えてキャッシングを最適化します。安定した要素を最初に配置（システムプロンプト、ツール定義）し、次に頻繁に再利用される要素、最後にユニークな要素を配置します。

キャッシュの安定性を最大化するようにプロンプトを設計します：タイムスタンプなどの動的コンテンツを避ける、一貫したフォーマットを使用する、セッション全体で構造を安定させる。

コンテキストパーティショニング

サブエージェントパーティショニング 最も積極的なコンテキスト最適化形式は、独立したコンテキストを持つサブエージェント間で作業をパーティショニングすることです。各サブエージェントは、他のサブタスクから蓄積されたコンテキストを持たずに、サブタスクに焦点を当てたクリーンなコンテキストで動作します。

このアプローチは関心の分離を実現します―詳細な検索コンテキストはサブエージェント内で分離されたままで、コーディネーターは総合と分析に焦点を当てます。

結果の集約 パーティショニングされたサブタスクからの結果を集約することで、すべてのパーティションが完了したことを検証し、互換性のある結果をマージし、まだ大きすぎる場合は要約します。

予算管理

コンテキスト予算配分 明示的なコンテキスト予算を設計します。トークンをカテゴリに配分します：システムプロンプト、ツール定義、取得したドキュメント、メッセージ履歴、予約バッファ。使用状況を予算に照らして監視し、制限に近づいたときに最適化をトリガーします。

トリガーベースの最適化 最適化トリガーの信号を監視します：80%を超えるトークン使用率、低下指標、パフォーマンス低下。コンテキスト構成に基づいて適切な最適化テクニックを適用します。

実用的なガイダンス

最適化決定フレームワーク

最適化する時機：

コンテキスト使用率が70%を超える
会話が延びるにつれて応答品質が低下する
長いコンテキストのため費用が増加する
会話長に伴いレイテンシが増加する

適用するもの：

ツール出力が支配的：観測マスキング
取得したドキュメントが支配的：要約またはパーティショニング
メッセージ履歴が支配的：要約による圧縮
複数の要素：戦略を組み合わせる

パフォーマンスの考慮事項

圧縮は、品質低下が5%未満で50～70%のトークン削減を達成すべきです。マスキングは、マスクされた観測で60～80%の削減を達成すべきです。キャッシュ最適化は、安定したワークロードで70%以上のヒット率を達成すべきです。

測定された有効性に基づいて最適化戦略を監視し反復します。

例

例1：圧縮トリガー

if context_tokens / context_limit > 0.8:
    context = compact_context(context)

例2：観測マスキング

if len(observation) > max_length:
    ref_id = store_observation(observation)
    return f"[Obs:{ref_id} elided. Key: {extract_key(observation)}]"

例3：キャッシュフレンドリーな順序付け

# 安定したコンテンツを最初に
context = [system_prompt, tool_definitions]  # キャッシング可能
context += [reused_templates]  # 再利用可能
context += [unique_content]  # ユニーク

ガイドライン

最適化する前に測定する―現在の状態を知る
可能な場合はマスキングの前に圧縮を適用する
一貫したプロンプトでキャッシュ安定性向けに設計する
コンテキストが問題になる前にパーティショニングする
時間をかけて最適化の有効性を監視する
トークン節約と品質保存のバランスを取る
本番規模で最適化をテストする
エッジケースに対して段階的な低下を実装する

統合

このスキルは context-fundamentals および context-degradation に基づいています。以下と接続します：

multi-agent-patterns - 分離としてのパーティショニング
evaluation - 最適化の有効性の測定
memory-systems - メモリへのコンテキストのオフロード

参考資料

内部リファレンス：

Optimization Techniques Reference - 詳細な技術リファレンス

このコレクション内の関連スキル：

context-fundamentals - コンテキストの基本
context-degradation - 最適化するタイミングの理解
evaluation - 最適化の測定

外部リソース：

コンテキストウィンドウの制限に関する研究
KV キャッシュ最適化テクニック
本番環境エンジニアリングガイド

スキルメタデータ

作成日：2025-12-20 最終更新日：2025-12-20 作成者：Agent Skills for Context Engineering Contributors バージョン：1.0.0

制限事項

このスキルは、タスクが上記で説明されたスコープと明確に一致する場合のみ使用してください。
出力を環境固有の検証、テスト、または専門家レビューの代用と見なさないでください。
必須の入力、許可、安全境界、または成功基準が欠けている場合は、立ち止まり説明を求めてください。

ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ

詳細情報

作者: sickn33
リポジトリ: sickn33/antigravity-awesome-skills
ライセンス: MIT
最終更新: 不明

GitHubで原本を見る →フィードバックを送る

Source: https://github.com/sickn33/antigravity-awesome-skills / ライセンス: MIT