生产接入 连连智枢 前的检查项。

配置

  • 生产 Base URL 与 Key 仅存在于服务端/密钥库(安全最佳实践
  • baseURL/v1(OpenAI 面)
  • Anthropic 集成使用 https://51kik.com/anthropic/v1
  • 生产与非生产用途的 Key、Base URL 勿混用

网络

  • 全程 HTTPS
  • 出口 IP 已加入白名单(若启用)
  • 反向代理已关闭 SSE 缓冲(流式响应
  • 读超时 ≥ 最长预期生成时间

可靠性

  • 对 429/5xx 实现退避重试(错误响应
  • 流式客户端处理断连与 [DONE]
  • 关键路径有超时与 AbortSignal
  • Tool 调用具备业务幂等

可观测

  • 每次请求发送 x-trace-id
  • 日志脱敏(无完整 Key / 用户正文)
  • 监控 401/403/429/5xx 比率与 P99 延迟
  • 支持工单模板就绪(支持信息

功能验证

  • GET /models 可达
  • 非流式 + 流式 chat 通过
  • 使用的 model id 在目录中存在且已授权
  • 若用文件/PDF:上传 + file 端到端通过
  • 若用 embeddings:HTTP POST /embeddings 单独验证

容量

  • 并发上限与队列策略
  • 大 payload(长上下文、附件)压测过

相关

架构说明 · 密钥生命周期