模型 model_at_capacity api proxy

Codex: Selected model is at capacity. 模型容量已满排查

这个提示通常表示当前选中的 Codex 模型或模型路由暂时没有可用容量。它不是 429,也不优先指向 API Key 写错;先区分官方 Codex 登录态、中转站账号池和 Sub2API 错误透传,再决定是换模型、等待恢复、开启有上限重试,还是反馈给服务商。

错误摘要

报错:Selected model is at capacity. Please try a different model. 先把它当作模型级容量、Admission 或流式中断问题处理。它可能出现在官方 ChatGPT 登录态 Codex CLI,也可能来自中转站账号池或 Sub2API 上游 overloaded 透传。

#selected model is at capacity #codex selected model is at capacity #codex model at capacity #codex please try a different model #codex 模型容量已满 #codex 模型满载

这个错误是什么意思

Selected model is at capacity. Please try a different model. 的重点是 selected model。请求没有优先失败在认证层,而是当前选中的模型、模型分组或上游路由没有足够可用容量。

如果你使用的是官方 Codex 登录态,它可能是 OpenAI 侧模型容量高峰。如果你通过中转站、Sub2API、CPA、NewAPI 或团队网关接入,它也可能是中转站背后的账号池、模型映射或分组路由没有可用出口。

别把它粗暴理解成“Codex 坏了”。更准确的判断是:当前模型通道暂时调度不到资源。

社区已有不少同类反馈:即使 /status 里还有上下文和额度,也可能触发这个提示。先把它当作模型容量或路由调度问题,不要第一反应就改 API Key 或查余额。

在一些 Sub2API 场景里,用户观察到上游原始失败更接近 Our servers are currently overloaded,中间层再把错误透传成 Codex 里的 at capacity 提示。问题不只是失败本身,而是 Codex 收到这类提示后可能不会自动续跑,于是长任务被频繁打断。

常见原因

  1. 当前 Codex 模型处在高峰期,尤其是平台推荐迁移到新模型后,新模型更容易出现临时 Admission 失败。
  2. gpt-5.4gpt-5.3-codex 这类 Codex 相关模型可能有独立容量池,剩余额度不等于当前模型一定能调度成功。
  3. 同一个模型在 ChatGPT 普通对话里可用,但 Codex 的连接被拒,说明 Codex 可能走不同的 Admission、工具调用或模型路由。
  4. 中转站把你选的模型映射到一个已满载、限流或冷却中的上游账号池。
  5. SSE 流式请求中途断开,客户端把上游 overloaded 或 stream 失败展示成 at capacity。
  6. 同一个账号、同一个 Key 或同一个 provider 同时跑多个 Codex 会话,挤占了可用容量。

先判断你属于哪种场景

如果你用的是官方 ChatGPT 登录态,先换模型测试:从 gpt-5.4 切回 gpt-5.3-codex,或等几分钟后重试。不要先改 Key。

如果你用的是中转站、Sub2API、CPA 或 NewAPI,先用同一 Base URL、Key、模型名发最小请求,再换模型。最小请求也失败,看账号池和上游容量;只有长任务失败,再看上下文、流式输出和工具调用。

怎么快速处理

  1. 先换模型。优先从 gpt-5.4 切回 gpt-5.3-codex 或另一个稳定模型,确认是不是单模型容量问题。
  2. 等 1 到 5 分钟再重试。容量类错误通常是临时状态,立刻连续重试意义不大。
  3. 降低当前任务的上下文压力:新开会话、减少附带文件、缩小修改范围,或先让 Codex 处理更小的步骤。
  4. 如果你使用 Codex 的 /goal 能力,可以把目标拆清楚,让客户端在中断后更容易续跑。但这只是降低人工接管成本,不是解决上游容量。
  5. 如果你使用中转站,切换模型分组、备用线路或 provider,并让服务商确认这个模型是否真的有可调度账号。

Sub2API 里的缓解办法

如果你自建或管理 Sub2API,可以尝试在账号管理里的错误透传规则中,把包含 Our servers are currently overloadedat capacity 的上游错误改写成客户端会触发自动重试的错误文本,例如 upstream failed

常见配置思路是:错误码保持空,关键词填 Our servers are currently overloadedat capacity,匹配模式选择“错误码或关键词”,自定义错误信息填 upstream failed 或类似可重试文本。

这个做法的价值是降低长任务被中断的频率,不是让模型容量凭空变多。重试次数必须有上限,并且要观察消耗、失败率和是否进入循环。把所有 capacity 错误都吞掉,只会让你看不见真实容量问题,还可能把余额烧在无效重试上。

NewAPI 场景要更谨慎。社区反馈里提到 NewAPI 更常见的是状态码覆写,不一定能像 Sub2API 一样精细改写这类上游错误文本。不要为了追求自动重试,把所有错误都改成同一个可重试错误。

资料来源

相关错误

相关教程

相关主题

常见问题

常见问题

这个错误是不是我的 API Key 错了?

通常不是。API Key 错误更常见是 401 或 403。Selected model is at capacity 更像模型容量、模型路由或上游账号池暂时不可用。

要不要一直重试同一个模型?

不要。连续重试可能把容量问题放大。先等一会儿,或切到另一个可用模型;如果你在用中转站,让服务商确认该模型通道是否满载。

为什么普通聊天能用,Codex 却提示满载?

Codex 的任务常常带着更长上下文和工具调用,可能走专门的 Codex 模型或模型分组。普通聊天可用,不代表 Codex 所选模型通道也有容量。