错误码速查

按 HTTP 状态码 + 错误信息特征查处理方式。

HTTP 4xx（客户端错）

状态码	含义	常见原因	处理
400	Bad Request	请求体 JSON 格式错；缺必填字段；参数取值越界	检查请求体；对照 OpenAI 兼容示例
401	Unauthorized	Key 错 / 失效 / 被禁 / 过期	创建新 Key
402	Payment Required	余额不足	充值
403	Forbidden	当前用户组无该模型 / 端点权限	联系客服升级用户组
404	Not Found	model 名错 / 端点路径错	按查可用模型确认；按接入概览确认端点
413	Payload Too Large	请求体过大（超长 prompt）	分批 / 截断 prompt
422	Unprocessable Entity	字段值不符合上游模型要求	看错误体里 `error.message` 详细
429	Too Many Requests	触发限速	加 exponential backoff 重试；联系客服评估升级

HTTP 5xx（上游 / 网关错）

状态码	含义	处理
500	Internal Server Error	重试 1-2 次；持续不通联系客服
502	Bad Gateway	同上，多为上游短暂波动
503	Service Unavailable	上游过载或维护，等几分钟重试
504	Gateway Timeout	上游响应超时；长 prompt 改短试，或切同类模型

错误响应体结构

OpenAI 兼容路径下，错误体格式：

json

{
  "error": {
    "message": "具体错误描述",
    "type": "invalid_request_error",
    "code": "model_not_found",
    "param": null
  }
}

排查时主要看 error.message（人类可读）+ error.code（机器可读分类）。

常见错误信息特征

`model_not_found` / `The model 'xxx' does not exist`

模型名拼错（大小写、版本后缀）
你所在用户组无该模型权限
模型刚被上游下线

→ 去控制台模型页确认实际可用模型名。

`insufficient_quota` / `余额不足`

insufficient_quota 是 OpenAI 协议保留的错误码常量，对应本站的「余额不足」——按 token 实际用量计费扣完了。→ 充值。

`invalid_api_key` / `Incorrect API key`

Key 拼错或漏字符
Key 被禁用 / 删除 / 过期
不是 why01 的 Key（误用了 OpenAI 官方的 sk-... 或 Anthropic 的 sk-ant-...）

`rate_limit_exceeded` / `Too many requests`

加 exponential backoff，控制并发。

`context_length_exceeded` / `Maximum context length is xxx tokens`

prompt + max_tokens 超过模型上下文窗口。要么砍 prompt，要么换大窗口模型。

`stream interrupted` / 流式断开

客户端 HTTP timeout 太短（调到 ≥ 5 分钟）
上游 idle timeout（缩短 prompt 或减小 max_tokens）

排查不出来怎么办

联系客服，按以下格式提供信息（不要发完整 Key）：

- Key 前 8 位：sk-xxxxxxxx
- 调用时间：2026-05-04 14:30 (北京时间)
- 模型：gpt-5-mini
- 端点：POST /v1/chat/completions
- HTTP 状态码：500
- 错误响应体：{"error": {...}}
- 复现频率：稳定 / 偶发

控制台「日志」也能查到对应记录，截图发客服更直观。

错误码速查 ​

HTTP 4xx（客户端错） ​

HTTP 5xx（上游 / 网关错） ​

错误响应体结构 ​

常见错误信息特征 ​

model_not_found / The model 'xxx' does not exist ​

insufficient_quota / 余额不足 ​

invalid_api_key / Incorrect API key ​

rate_limit_exceeded / Too many requests ​

context_length_exceeded / Maximum context length is xxx tokens ​

stream interrupted / 流式断开 ​

排查不出来怎么办 ​