最佳实践

高效使用 BufferAPI 的实用建议。

1. 选择合适的模型

场景推荐模型原因
日常对话/客服GPT-4o mini / DeepSeek V3低成本,速度快
复杂分析/推理GPT-4o / Claude 3.5 Sonnet质量最高
数学/代码推理DeepSeek R1 / o3-mini推理链强
长文档分析Gemini 2.5 Pro1M 上下文
图像理解GPT-4o / Claude 3.5 Sonnet多模态强
嵌入/RAGtext-embedding-3-small性价比最优

2. 控制成本

  • 限制 max_tokens:避免模型输出过长
  • 使用流式输出:用户感知更快,可提前中断
  • 缓存结果:相同输入可缓存响应
  • 合理设置 temperature:创意任务用 0.7-1.0,精确任务用 0-0.3

3. 系统提示优化

# 好的系统提示
system = """你是一个专业的 Python 代码审查助手。
请用中文回答,按以下格式输出:
1. 问题描述
2. 严重程度(高/中/低)
3. 修复建议"""

# 差的系统提示
system = "帮我看看代码"

4. 错误处理

  • 始终捕获并处理 API 异常
  • 对 429/5xx 错误实现指数退避重试
  • 设置合理的超时时间(建议 30-60 秒)
  • 记录请求 ID 便于排查问题

5. 安全实践

  • API Key 仅在后端使用,不暴露给前端
  • 定期轮换 Key
  • 为不同环境使用不同 Key
  • 启用 IP 白名单
  • 监控异常用量