Anthropic ClaudeLLM・AI開発⭐ リポ 1品質スコア 53/100
langchain-rate-limits
LangChainのレート制限とバックオフ戦略を実装できます。API クォータの管理、リトライロジックの実装、LLMプロバイダーへのリクエストスループット最適化が必要な場合に使用します。「langchain rate limit」「langchain throttling」「langchain backoff」「langchain retry」「API quota」といったフレーズで起動できます。
description の原文を見る
Implement LangChain rate limiting and backoff strategies. Use when handling API quotas, implementing retry logic, or optimizing request throughput for LLM providers. Trigger with phrases like "langchain rate limit", "langchain throttling", "langchain backoff", "langchain retry", "API quota".
SKILL.md 本文
注意: このスキルのライセンスは ライセンス未確認 です。本サイトでは本文プレビューのみを表示しています。利用前に GitHub の原本でライセンス条件をご確認ください。
LangChain レート制限
概要
LangChainアプリケーションに強固なレート制限とリトライ戦略を実装し、APIクォータを適切に処理します。
前提条件
- LLMプロバイダーと一緒にインストールされたLangChain
- プロバイダーのレート制限に関する理解
- 高度なリトライロジック向けのtenacityパッケージ
手順
ステップ1: プロバイダーの制限を理解する
# Common rate limits by provider:
RATE_LIMITS = {
"openai": {
"gpt-4o": {"rpm": 10000, "tpm": 800000},
"gpt-4o-mini": {"rpm": 10000, "tpm": 4000000},
},
"anthropic": {
"claude-3-5-sonnet": {"rpm": 4000, "tpm": 400000},
},
"google": {
"gemini-1.5-pro": {"rpm": 360, "tpm": 4000000},
}
}
# rpm = requests per minute, tpm = toke
...
詳細情報
- 作者
- Brmbobo
- リポジトリ
- Brmbobo/Web2podcast
- ライセンス
- 不明
- 最終更新
- 2026/1/26
Source: https://github.com/Brmbobo/Web2podcast / ライセンス: 未指定