BufferAPI

最佳实践

高效使用 BUFFER 的实用建议。

1. 选择合适的模型

场景	推荐模型	原因
日常对话/客服	GPT-4o mini / DeepSeek V3	低成本，速度快
复杂分析/推理	GPT-4o / Claude 3.5 Sonnet	质量最高
数学/代码推理	DeepSeek R1 / o3-mini	推理链强
长文档分析	Gemini 2.5 Pro	1M 上下文
图像理解	GPT-4o / Claude 3.5 Sonnet	多模态强
嵌入/RAG	text-embedding-3-small	性价比最优

2. 控制成本

限制 max_tokens：避免模型输出过长
使用流式输出：用户感知更快，可提前中断
缓存结果：相同输入可缓存响应
合理设置 temperature：创意任务用 0.7-1.0，精确任务用 0-0.3

3. 系统提示优化

# 好的系统提示
system = """你是一个专业的 Python 代码审查助手。
请用中文回答，按以下格式输出：
1. 问题描述
2. 严重程度（高/中/低）
3. 修复建议"""

# 差的系统提示
system = "帮我看看代码"

4. 错误处理

始终捕获并处理 API 异常
对 429/5xx 错误实现指数退避重试
设置合理的超时时间（建议 30-60 秒）
记录请求 ID 便于排查问题

5. 安全实践

API Key 仅在后端使用，不暴露给前端
定期轮换 Key
为不同环境使用不同 Key
启用 IP 白名单
监控异常用量

← 速率限制