Error 429 Too Many Requests
Error 429 表示 API 拒绝了请求,常见原因是请求太频繁、触发限流,或账号已经没有可用额度。在 API 中转场景里,429 可能来自上游模型服务、来自中转站自己的限流,也可能是本地工具重复重试造成的。
错误摘要
429 通常是限流或额度信号。先检查 Retry-After、请求频率、账号余额、模型限制,以及工具是否在循环重试同一个失败调用。
这个错误是什么意思
Error 429 表示服务端理解了请求,但当前不愿意继续处理,因为请求频率、并发、token 消耗或账号额度触发了限制。
在 AI API 中转场景里,这个响应可能来自上游模型服务,也可能来自中转站自己的网关。先把它当作限流或额度信号处理,不要第一时间判断为服务商故障。
常见原因
- 服务商的每分钟请求数、每分钟 token 数、并发请求数或单模型限制被触发。
- 账号没有可用额度,预付余额耗尽,或当前模型没有开通可用计费。
- 中转站对你的 API Key 做了限流,即使上游官方 API 还有容量,也可能返回 429。
- Claude Code、Codex、Cursor 或其他工具可能会自动重试失败请求,把一次失败变成很多次请求。
- 高上下文 prompt、流式任务、批处理任务或 coding agent 循环可能比普通聊天更快消耗 token。
排查和修复步骤
- 先等待再重试。如果响应里有
Retry-Afterheader,按它给出的时间等待,不要立刻重复发送同一个请求。 - 检查服务商控制台里的余额、计费状态、每日额度、请求限制和模型级限制。
- 降低并发,减少 max output tokens,缩短 prompt,避免多个 coding agent 会话共用同一个 API Key 同时跑。
- 确认 Base URL 指向的是你想用的 provider。错误的代理配置可能把请求打到额度更小的账号池。
- 只有在确认当前 Key、余额和限流规则都没问题后,再考虑切换到更小模型或其他 provider。
API 中转用户要重点看什么
先用相同的 Base URL、API Key 和模型名发一个最小请求。如果最小请求也返回 429,问题更可能在额度、计费、provider 限制或中转站限流。
如果最小请求正常,但 coding tool 失败,重点检查并发和重试循环。Coding agent 在读文件、调用工具、恢复失败步骤时,可能快速发出很多请求。
什么时候该换 Provider
只有在确认当前 provider 的限流就是瓶颈,而且你的请求方式没有问题时,换 provider 才有帮助。如果是本地工具循环重试、Key 加载错误或余额不足,换站并不能真正解决问题。