生产接入 连连智枢 前的检查项。
配置
- 生产 Base URL 与 Key 仅存在于服务端/密钥库(安全最佳实践)
-
baseURL含/v1(OpenAI 面) - Anthropic 集成使用
https://51kik.com/anthropic/v1 - 生产与非生产用途的 Key、Base URL 勿混用
网络
- 全程 HTTPS
- 出口 IP 已加入白名单(若启用)
- 反向代理已关闭 SSE 缓冲(流式响应)
- 读超时 ≥ 最长预期生成时间
可靠性
- 对 429/5xx 实现退避重试(错误响应)
- 流式客户端处理断连与
[DONE] - 关键路径有超时与
AbortSignal - Tool 调用具备业务幂等
可观测
- 每次请求发送
x-trace-id - 日志脱敏(无完整 Key / 用户正文)
- 监控 401/403/429/5xx 比率与 P99 延迟
- 支持工单模板就绪(支持信息)
功能验证
-
GET /models可达 - 非流式 + 流式 chat 通过
- 使用的
modelid 在目录中存在且已授权 - 若用文件/PDF:上传 +
file端到端通过 - 若用 embeddings:HTTP
POST /embeddings单独验证
容量
- 并发上限与队列策略
- 大 payload(长上下文、附件)压测过