token-budget
LLMベースのアプリケーションにおけるトークン予算の計画、実装、監視ができます。コンテキスト予算(コンテキストウィンドウへのコンテンツ収納)、コスト予算(ユーザー・サービス・月単位での支出追跡)、クォータ・レート予算(LLM呼び出しのレート制限)の3つの領域をカバーしています。トークン予算、トークン制限、LLMコスト、コンテキストウィンドウ管理、トークン使用量追跡、API予算、LLMのレート制限、トークン使用量監視について言及がある場合、またはLLMに送信するコンテキスト量を制御したい場合に活用できます。LangChain4j/Quarkus向けのChatModelListener、トークンカウンター、または使用量トラッカーを構築する際にも対応します。
description の原文を見る
Plan, implement, and monitor token budgets for LLM-based applications. Covers three areas — context budgets (fitting content into context windows), cost budgets (tracking spend per user/service/month), and quota/rate budgets (rate limiting LLM calls). Use this skill whenever the user mentions token budgets, token limits, LLM costs, context window management, token tracking, API budgets, rate limiting for LLMs, token usage monitoring, or wants to control how much context is sent to an LLM. Also trigger when the user is building a ChatModelListener, token counter, or usage tracker for LangChain4j/Quarkus.
SKILL.md 本文
Token Budget Skill
目的
LLMベースのアプリケーションにおけるトークン予算の計画、実装、監視を支援します。トークン予算には3つの種類があり、組み合わせて使用することが多くあります。
- Context Budget(品質) — コンテキストウィンドウにどの程度のコンテンツが収まるか?
- Cost Budget(コスト) — トークンにどれだけの費用をかけているか?
- Quota Budget(レート) — トークンをどのくらいの速度で消費しているか?
それぞれの種類が異なる懸念に対処していますが、インフラストラクチャを共有しています(トークンカウント、追跡、設定)。このスキルはユーザーをインタビューして彼らのニーズを理解し、その後適切なQuarkus/LangChain4jコードを生成します。
インタビュー
コードを生成する前に、スコープを理解するためにこれらの質問をしてください。コンテキストから既に答えられている質問はスキップしてください。
質問
- どのユースケースですか? Context / Cost / Quota / 複合?
- ローカルLLM(Ollama、LM Studio)→ 通常、Contextのみが関連
- クラウドAPI(OpenAI、Anthr
...
詳細情報
- 作者
- mgoericke
- ライセンス
- unknown
- 最終更新
- 2026/4/10
Source: https://github.com/mgoericke/javamark-claude-plugins / ライセンス: unknown
関連スキル
agent-browser
AI エージェント向けのブラウザ自動化 CLI です。ウェブサイトとの対話が必要な場合に使用します。ページ遷移、フォーム入力、ボタンクリック、スクリーンショット取得、データ抽出、ウェブアプリのテスト、ブラウザ操作の自動化など、あらゆるブラウザタスクに対応できます。「ウェブサイトを開く」「フォームに記入する」「ボタンをクリックする」「スクリーンショットを取得する」「ページからデータを抽出する」「このウェブアプリをテストする」「サイトにログインする」「ブラウザ操作を自動化する」といった要求や、プログラマティックなウェブ操作が必要なタスクで起動します。
anyskill
AnySkill — あなたのプライベート・スキルクラウド。GitHubを基盤としたリポジトリからエージェントスキルを管理、同期、動的にロードできます。自然言語でクラウドスキルを検索し、オンデマンドでプロンプトを自動ロード、カスタムスキルのアップロードと共有、スキルバンドルの一括インストールが可能です。OpenClaw、Antigravity、Claude Code、Cursorに対応しています。
engram
AIエージェント向けの永続的なメモリシステムです。バグ修正、意思決定、発見、設定変更の後はmem_saveを使用してください。ユーザーが「覚えている」「記憶している」と言及した場合、または以前のセッションと重複する作業を開始する際はmem_searchを使用します。セッション終了前にmem_session_summaryを使用して、コンテキストを保持してください。
skyvern
AI駆動のブラウザ自動化により、任意のウェブサイトを自動化できます。フォーム入力、データ抽出、ファイルダウンロード、ログイン、複数ステップのワークフロー実行など、ユーザーがウェブサイトと連携する必要があるときに使用します。Skyvernは、LLMとコンピュータビジョンを活用して、未知のサイトも自動操作可能です。Python SDK、TypeScript SDK、REST API、MCPサーバー、またはCLIを通じて統合できます。
pinchbench
PinchBenchベンチマークを実行して、OpenClawエージェントの実世界タスクにおけるパフォーマンスを評価できます。モデルの機能テスト、モデル間の比較、ベンチマーク結果のリーダーボード提出、またはOpenClawのセットアップがカレンダー、メール、リサーチ、コーディング、複数ステップのワークフローにどの程度対応しているかを確認する際に使用します。
openui
OpenUIとOpenUI Langを使用してジェネレーティブUIアプリを構築できます。これらはLLM生成インターフェースのためのトークン効率的なオープン標準です。OpenUI、@openuidev、ジェネレーティブUI、LLMからのストリーミングUI、AI向けコンポーネントライブラリ、またはjson-render/A2UIの置き換えについて述べる際に使用します。スキャフォルディング、defineComponent、システムプロンプト、Renderer、およびOpenUI Lang出力のデバッグに対応しています。