perplexity-performance-tuning
Perplexity APIのパフォーマンスをキャッシング、バッチ処理、コネクションプーリングで最適化します。APIレスポンスが遅い場合、キャッシング戦略を導入したい場合、またはPerplexity統合のリクエストスループットを最適化したい場合に活用できます。「perplexity performance」「optimize perplexity」「perplexity latency」「perplexity caching」「perplexity slow」「perplexity batch」といったフレーズで起動します。
description の原文を見る
Optimize Perplexity API performance with caching, batching, and connection pooling. Use when experiencing slow API responses, implementing caching strategies, or optimizing request throughput for Perplexity integrations. Trigger with phrases like "perplexity performance", "optimize perplexity", "perplexity latency", "perplexity caching", "perplexity slow", "perplexity batch".
SKILL.md 本文
Perplexity パフォーマンスチューニング
概要
キャッシング、バッチ処理、接続プーリングを使用して Perplexity API のパフォーマンスを最適化します。
前提条件
- Perplexity SDK がインストール済み
- 非同期パターンの理解
- Redis またはメモリ内キャッシュが利用可能(オプション)
- パフォーマンス監視が導入済み
レイテンシベンチマーク
| 操作 | P50 | P95 | P99 |
|---|---|---|---|
| Read | 50ms | 150ms | 300ms |
| Write | 100ms | 250ms | 500ms |
| List | 75ms | 200ms | 400ms |
キャッシング戦略
レスポンスキャッシング
import { LRUCache } from 'lru-cache';
const cache = new LRUCache<string, any>({
max: 1000,
ttl: 60000, // 1 minute
updateAgeOnGet: true,
});
async function cachedPerplexityRequest<T>(
key:
...
詳細情報
- 作者
- Brmbobo
- リポジトリ
- Brmbobo/Web2podcast
- ライセンス
- 不明
- 最終更新
- 2026/1/26
Source: https://github.com/Brmbobo/Web2podcast / ライセンス: 未指定