最新
语义缓存 GPTCache
部署 GPTCache 对 LLM 请求进行语义级缓存,通过向量相似度匹配历史响应,大幅减少重复请求的 API 调用费用与响应延迟。
6
0
0
2026-06-14