模型 model_at_capacity api proxy

Codex: Selected model is at capacity. 模型容量已滿排查

這個提示通常表示目前選中的 Codex 模型或模型路由暫時沒有可用容量。它不是 429,也不優先指向 API Key 寫錯;先區分官方 Codex 登錄態、中轉站帳號池和 Sub2API 錯誤透傳,再決定是換模型、等待恢復、開啟有上限重試,還是反饋給服務商。

錯誤摘要

報錯:Selected model is at capacity. Please try a different model. 先把它當作模型級容量、Admission 或串流中斷問題處理。它可能出現在官方 ChatGPT 登錄態 Codex CLI,也可能來自中轉站帳號池或 Sub2API 上游 overloaded 透傳。

#selected model is at capacity #codex selected model is at capacity #codex model at capacity #codex please try a different model #codex 模型容量已滿 #codex 模型滿載

這個錯誤是什麼意思

Selected model is at capacity. Please try a different model. 的重點是 selected model。請求沒有優先失敗在認證層,而是目前選中的模型、模型分組或上游路由沒有足夠可用容量。

如果你使用的是官方 Codex 登錄態,它可能是 OpenAI 側模型容量高峰。如果你通過中轉站、Sub2API、CPA、NewAPI 或團隊網關接入,它也可能是中轉站背後的帳號池、模型映射或分組路由沒有可用出口。

別把它粗暴理解成「Codex 壞了」。更準確的判斷是:目前模型通道暫時調度不到資源。

社群已有不少同類反饋:即使 /status 裡還有上下文和額度,也可能觸發這個提示。先把它當作模型容量或路由調度問題,不要第一反應就改 API Key 或查餘額。

在一些 Sub2API 場景裡,使用者觀察到上游原始失敗更接近 Our servers are currently overloaded,中間層再把錯誤透傳成 Codex 裡的 at capacity 提示。問題不只是失敗本身,而是 Codex 收到這類提示後可能不會自動續跑,於是長任務被頻繁打斷。

常見原因

  1. 目前 Codex 模型處在高峰期,尤其是平台推薦遷移到新模型後,新模型更容易出現臨時 Admission 失敗。
  2. gpt-5.4gpt-5.3-codex 這類 Codex 相關模型可能有獨立容量池,剩餘額度不等於目前模型一定能調度成功。
  3. 同一個模型在 ChatGPT 普通對話裡可用,但 Codex 的連接被拒,說明 Codex 可能走不同的 Admission、工具調用或模型路由。
  4. 中轉站把你選的模型映射到一個已滿載、限流或冷卻中的上游帳號池。
  5. SSE 串流請求中途斷開,客戶端把上游 overloaded 或 stream 失敗展示成 at capacity。
  6. 同一個帳號、同一個 Key 或同一個 provider 同時跑多個 Codex 會話,擠佔了可用容量。

先判斷你屬於哪種場景

如果你用的是官方 ChatGPT 登錄態,先換模型測試:從 gpt-5.4 切回 gpt-5.3-codex,或等幾分鐘後重試。不要先改 Key。

如果你用的是中轉站、Sub2API、CPA 或 NewAPI,先用同一 Base URL、Key、模型名發最小請求,再換模型。最小請求也失敗,看帳號池和上游容量;只有長任務失敗,再看上下文、串流輸出和工具調用。

怎麼快速處理

  1. 先換模型。優先從 gpt-5.4 切回 gpt-5.3-codex 或另一個穩定模型,確認是不是單模型容量問題。
  2. 等 1 到 5 分鐘再重試。容量類錯誤通常是臨時狀態,立刻連續重試意義不大。
  3. 降低目前任務的上下文壓力:新開會話、減少附帶文件、縮小修改範圍,或先讓 Codex 處理更小的步驟。
  4. 如果你使用 Codex 的 /goal 能力,可以把目標拆清楚,讓客戶端在中斷後更容易續跑。但這只是降低人工接管成本,不是解決上游容量。
  5. 如果你使用中轉站,切換模型分組、備用線路或 provider,並讓服務商確認這個模型是否真的有可調度帳號。

Sub2API 裡的緩解辦法

如果你自建或管理 Sub2API,可以嘗試在帳號管理裡的錯誤透傳規則中,把包含 Our servers are currently overloadedat capacity 的上游錯誤改寫成客戶端會觸發自動重試的錯誤文本,例如 upstream failed

常見配置思路是:錯誤碼保持空,關鍵詞填 Our servers are currently overloadedat capacity,匹配模式選擇「錯誤碼或關鍵詞」,自定義錯誤信息填 upstream failed 或類似可重試文本。

這個做法的價值是降低長任務被中斷的頻率,不是讓模型容量憑空變多。重試次數必須有上限,並且要觀察消耗、失敗率和是否進入循環。把所有 capacity 錯誤都吞掉,只會讓你看不見真實容量問題,還可能把餘額燒在無效重試上。

NewAPI 場景要更謹慎。社群反饋裡提到 NewAPI 更常見的是狀態碼覆寫,不一定能像 Sub2API 一樣精細改寫這類上游錯誤文本。不要為了追求自動重試,把所有錯誤都改成同一個可重試錯誤。

資料來源

相關錯誤

相關教程

相關主題

常見問題

常見問題

這個錯誤是不是我的 API Key 錯了?

通常不是。API Key 錯誤更常見是 401 或 403。Selected model is at capacity 更像模型容量、模型路由或上游帳號池暫時不可用。

要不要一直重試同一個模型?

不要。連續重試可能把容量問題放大。先等一會兒,或切到另一個可用模型;如果你在用中轉站,讓服務商確認該模型通道是否滿載。

為什麼普通聊天能用,Codex 卻提示滿載?

Codex 的任務常常帶著更長上下文和工具調用,可能走專門的 Codex 模型或模型分組。普通聊天可用,不代表 Codex 所選模型通道也有容量。