這個錯誤是不是我的 API Key 錯了？

通常不是。API Key 錯誤更常見是 401 或 403。Selected model is at capacity 更像模型容量、模型路由或上游帳號池暫時不可用。

要不要一直重試同一個模型？

不要。連續重試可能把容量問題放大。先等一會兒，或切到另一個可用模型；如果你在用中轉站，讓服務商確認該模型通道是否滿載。

為什麼普通聊天能用，Codex 卻提示滿載？

Codex 的任務常常帶著更長上下文和工具調用，可能走專門的 Codex 模型或模型分組。普通聊天可用，不代表 Codex 所選模型通道也有容量。

模型 model_at_capacity api proxy

Codex: Selected model is at capacity. 模型容量已滿排查

這個提示通常表示目前選中的 Codex 模型或模型路由暫時沒有可用容量。它不是 429，也不優先指向 API Key 寫錯；先區分官方 Codex 登錄態、中轉站帳號池和 Sub2API 錯誤透傳，再決定是換模型、等待恢復、開啟有上限重試，還是反饋給服務商。

錯誤摘要

報錯：Selected model is at capacity. Please try a different model. 先把它當作模型級容量、Admission 或串流中斷問題處理。它可能出現在官方 ChatGPT 登錄態 Codex CLI，也可能來自中轉站帳號池或 Sub2API 上游 overloaded 透傳。

#selected model is at capacity #codex selected model is at capacity #codex model at capacity #codex please try a different model #codex 模型容量已滿 #codex 模型滿載

這個錯誤是什麼意思

Selected model is at capacity. Please try a different model. 的重點是 selected model。請求沒有優先失敗在認證層，而是目前選中的模型、模型分組或上游路由沒有足夠可用容量。

如果你使用的是官方 Codex 登錄態，它可能是 OpenAI 側模型容量高峰。如果你通過中轉站、Sub2API、CPA、NewAPI 或團隊網關接入，它也可能是中轉站背後的帳號池、模型映射或分組路由沒有可用出口。

別把它粗暴理解成「Codex 壞了」。更準確的判斷是：目前模型通道暫時調度不到資源。

社群已有不少同類反饋：即使 /status 裡還有上下文和額度，也可能觸發這個提示。先把它當作模型容量或路由調度問題，不要第一反應就改 API Key 或查餘額。

在一些 Sub2API 場景裡，使用者觀察到上游原始失敗更接近 Our servers are currently overloaded，中間層再把錯誤透傳成 Codex 裡的 at capacity 提示。問題不只是失敗本身，而是 Codex 收到這類提示後可能不會自動續跑，於是長任務被頻繁打斷。

常見原因

目前 Codex 模型處在高峰期，尤其是平台推薦遷移到新模型後，新模型更容易出現臨時 Admission 失敗。
gpt-5.4、gpt-5.3-codex 這類 Codex 相關模型可能有獨立容量池，剩餘額度不等於目前模型一定能調度成功。
同一個模型在 ChatGPT 普通對話裡可用，但 Codex 的連接被拒，說明 Codex 可能走不同的 Admission、工具調用或模型路由。
中轉站把你選的模型映射到一個已滿載、限流或冷卻中的上游帳號池。
SSE 串流請求中途斷開，客戶端把上游 overloaded 或 stream 失敗展示成 at capacity。
同一個帳號、同一個 Key 或同一個 provider 同時跑多個 Codex 會話，擠佔了可用容量。

先判斷你屬於哪種場景

如果你用的是官方 ChatGPT 登錄態，先換模型測試：從 gpt-5.4 切回 gpt-5.3-codex，或等幾分鐘後重試。不要先改 Key。

如果你用的是中轉站、Sub2API、CPA 或 NewAPI，先用同一 Base URL、Key、模型名發最小請求，再換模型。最小請求也失敗，看帳號池和上游容量；只有長任務失敗，再看上下文、串流輸出和工具調用。

怎麼快速處理

先換模型。優先從 gpt-5.4 切回 gpt-5.3-codex 或另一個穩定模型，確認是不是單模型容量問題。
等 1 到 5 分鐘再重試。容量類錯誤通常是臨時狀態，立刻連續重試意義不大。
降低目前任務的上下文壓力：新開會話、減少附帶文件、縮小修改範圍，或先讓 Codex 處理更小的步驟。
如果你使用 Codex 的 /goal 能力，可以把目標拆清楚，讓客戶端在中斷後更容易續跑。但這只是降低人工接管成本，不是解決上游容量。
如果你使用中轉站，切換模型分組、備用線路或 provider，並讓服務商確認這個模型是否真的有可調度帳號。

Sub2API 裡的緩解辦法

如果你自建或管理 Sub2API，可以嘗試在帳號管理裡的錯誤透傳規則中，把包含 Our servers are currently overloaded 或 at capacity 的上游錯誤改寫成客戶端會觸發自動重試的錯誤文本，例如 upstream failed。

常見配置思路是：錯誤碼保持空，關鍵詞填 Our servers are currently overloaded、at capacity，匹配模式選擇「錯誤碼或關鍵詞」，自定義錯誤信息填 upstream failed 或類似可重試文本。

這個做法的價值是降低長任務被中斷的頻率，不是讓模型容量憑空變多。重試次數必須有上限，並且要觀察消耗、失敗率和是否進入循環。把所有 capacity 錯誤都吞掉，只會讓你看不見真實容量問題，還可能把餘額燒在無效重試上。

NewAPI 場景要更謹慎。社群反饋裡提到 NewAPI 更常見的是狀態碼覆寫，不一定能像 Sub2API 一樣精細改寫這類上游錯誤文本。不要為了追求自動重試，把所有錯誤都改成同一個可重試錯誤。

Codex: Selected model is at capacity. 模型容量已滿排查

錯誤摘要

這個錯誤是什麼意思

常見原因

先判斷你屬於哪種場景

怎麼快速處理

Sub2API 裡的緩解辦法

相關錯誤

相關教程

相關主題

常見問題