Skip to content

错误码速查

按 HTTP 状态码 + 错误信息特征查处理方式。

HTTP 4xx(客户端错)

状态码含义常见原因处理
400Bad Request请求体 JSON 格式错;缺必填字段;参数取值越界检查请求体;对照 OpenAI 兼容 示例
401UnauthorizedKey 错 / 失效 / 被禁 / 过期创建新 Key
402Payment Required余额不足充值
403Forbidden当前用户组无该模型 / 端点权限联系客服 升级用户组
404Not Foundmodel 名错 / 端点路径错查可用模型 确认;按 接入概览 确认端点
413Payload Too Large请求体过大(超长 prompt)分批 / 截断 prompt
422Unprocessable Entity字段值不符合上游模型要求看错误体里 error.message 详细
429Too Many Requests触发限速加 exponential backoff 重试;联系客服评估升级

HTTP 5xx(上游 / 网关错)

状态码含义处理
500Internal Server Error重试 1-2 次;持续不通 联系客服
502Bad Gateway同上,多为上游短暂波动
503Service Unavailable上游过载或维护,等几分钟重试
504Gateway Timeout上游响应超时;长 prompt 改短试,或切同类模型

错误响应体结构

OpenAI 兼容路径下,错误体格式:

json
{
  "error": {
    "message": "具体错误描述",
    "type": "invalid_request_error",
    "code": "model_not_found",
    "param": null
  }
}

排查时主要看 error.message(人类可读)+ error.code(机器可读分类)。

常见错误信息特征

model_not_found / The model 'xxx' does not exist

  • 模型名拼错(大小写、版本后缀)
  • 你所在用户组无该模型权限
  • 模型刚被上游下线

→ 去 控制台模型页 确认实际可用模型名。

insufficient_quota / 余额不足

insufficient_quota 是 OpenAI 协议保留的错误码常量,对应本站的「余额不足」——按 token 实际用量计费扣完了。→ 充值

invalid_api_key / Incorrect API key

  • Key 拼错或漏字符
  • Key 被禁用 / 删除 / 过期
  • 不是 why01 的 Key(误用了 OpenAI 官方的 sk-... 或 Anthropic 的 sk-ant-...

rate_limit_exceeded / Too many requests

加 exponential backoff,控制并发。

context_length_exceeded / Maximum context length is xxx tokens

prompt + max_tokens 超过模型上下文窗口。要么砍 prompt,要么换大窗口模型。

stream interrupted / 流式断开

  • 客户端 HTTP timeout 太短(调到 ≥ 5 分钟)
  • 上游 idle timeout(缩短 prompt 或减小 max_tokens)

排查不出来怎么办

联系客服,按以下格式提供信息(不要发完整 Key):

- Key 前 8 位:sk-xxxxxxxx
- 调用时间:2026-05-04 14:30 (北京时间)
- 模型:gpt-5-mini
- 端点:POST /v1/chat/completions
- HTTP 状态码:500
- 错误响应体:{"error": {...}}
- 复现频率:稳定 / 偶发

控制台「日志」也能查到对应记录,截图发客服更直观。