按症状快速定位推理调用问题。
401 Unauthorized
| 检查项 | 动作 |
|---|
| Header 格式 | OpenAI 面:Authorization: Bearer <key>;Anthropic 面:x-api-key 或 Bearer |
| Key 状态 | 控制台确认未禁用/过期 |
| 环境混用 | 非生产 Key 勿与生产 Base URL 混用 |
403 Forbidden
| 可能原因 | 动作 |
|---|
insufficient_balance / quota_exceeded | 控制台充值或配额 |
| 模型未授权 | 确认租户可调用该 model id |
ip_not_allowed | 更新 Key IP 白名单(见 网络与访问) |
| 上游密钥耗尽 | 联系支持 |
400 Bad Request
| 可能原因 | 动作 |
|---|
param 指向 messages | 检查 tool_call_id、content parts 类型 |
| 不支持的内容 part | 仅用 text / image_url / input_audio / file |
| Body 过大 | Chat/embedding 约 32MB 上限 |
缺 max_tokens(Anthropic) | Messages 必填 max_tokens |
阅读 error.message 与 param。
429 Too Many Requests
退避重试,见 限流与配额。
流式异常
| 现象 | 动作 |
|---|
| 长时间无输出后一次性显示 | 代理关闭 SSE 缓冲 |
| 中途断开 | 提高超时;检查客户端是否取消 |
| 流中 error | 按 错误响应 处理,勿当成功 |
5xx / 超时
- 用更小
max_tokens / 更短输入复现。
- 换模型或稍后重试(上游瞬时故障)。
- 持续失败:收集
x-trace-id、时间、model,见 支持信息。
模型列表为空
- 确认
GET /models 无 Key 可访问。
- 检查筛选参数是否过严(
api_protocol、modalities)。
- 控制台是否未对你启用该模型。
相关
错误响应 · 上线清单