按症状快速定位推理调用问题。

401 Unauthorized

检查项动作
Header 格式OpenAI 面:Authorization: Bearer <key>;Anthropic 面:x-api-key 或 Bearer
Key 状态控制台确认未禁用/过期
环境混用非生产 Key 勿与生产 Base URL 混用

403 Forbidden

可能原因动作
insufficient_balance / quota_exceeded控制台充值或配额
模型未授权确认租户可调用该 model id
ip_not_allowed更新 Key IP 白名单(见 网络与访问
上游密钥耗尽联系支持

400 Bad Request

可能原因动作
param 指向 messages检查 tool_call_id、content parts 类型
不支持的内容 part仅用 text / image_url / input_audio / file
Body 过大Chat/embedding 约 32MB 上限
max_tokens(Anthropic)Messages 必填 max_tokens

阅读 error.messageparam

429 Too Many Requests

退避重试,见 限流与配额

流式异常

现象动作
长时间无输出后一次性显示代理关闭 SSE 缓冲
中途断开提高超时;检查客户端是否取消
流中 error错误响应 处理,勿当成功

5xx / 超时

  1. 用更小 max_tokens / 更短输入复现。
  2. 换模型或稍后重试(上游瞬时故障)。
  3. 持续失败:收集 x-trace-id、时间、model,见 支持信息

模型列表为空

  • 确认 GET /models 无 Key 可访问。
  • 检查筛选参数是否过严(api_protocolmodalities)。
  • 控制台是否未对你启用该模型。

相关

错误响应 · 上线清单