OpenAI 發布 GPT-5.3 Codex：首個協助自我構建的自我改進型 AI 模型

遞迴智能（Recursive Intelligence）的新紀元：OpenAI 發佈 GPT-5.3 Codex

在一個可能被銘記為遞迴式 AI（Recursive AI）時代正式開啟的分水嶺時刻，OpenAI 發佈了 GPT-5.3 Codex，這是首個被明確公認在其自身開發過程中發揮關鍵作用的大型語言模型。該模型於 2026 年 2 月 5 日星期四推出，代表了從靜態訓練到自我強化優化循環的範式轉移。

在 Creati.ai，我們密切關注自主代理編碼（Agentic Coding）模型的發展軌跡，但 GPT-5.3 Codex 的獨特之處不僅在於其產出，更在於其起源。根據 OpenAI 的說法，該模型生成了用於微調的大部分合成數據，並編寫了底層內核優化（low-level kernel optimizations），使其運行速度比前代產品快了 25%。

此次發佈正值新聞週期頻繁之際，就在競爭對手 Anthropic 宣佈其自身的自主代理編碼（agentic coding）更新幾分鐘後發佈，這標誌著「AI 軍備競賽」已從參數數量轉向遞迴能力和自主代理能力。

遞迴循環：GPT-5.3 如何自我構建

GPT-5.3 Codex 的定義性特徵是其在自身創建過程中的角色。雖然以前的模型已被用於協助研究人員，但 OpenAI 證實，GPT-5.3 在「第二階段」預訓練和優化階段被部署為主要工程師。

這個過程涉及兩個截然不同的遞迴機制：

合成數據生成：模型（處於早期檢查點狀態）被指派生成數百萬個複雜的編碼挑戰和解決方案，然後由一個獨立的驗證器模型進行驗證，再反饋到訓練集中。這創造了一個高品質的數據飛輪，是人工標註員無法擴展匹配的。
架構優化：最令人震驚的是，GPT-5.3 Codex 被用於重寫 OpenAI 基礎設施中使用的 CUDA 內核和推理邏輯。該模型識別出了人類工程師忽略的內存分配效率低下問題，從而使推理延遲降低了 25%。

「這是我們第一次允許模型實質性地構建其自身的運行環境，」OpenAI 發言人在技術發行說明中表示。「我們看到的效率提升是模型比我們更了解其所運行的硬件的直接結果。」

粉碎基準測試：在 SWE-Bench Pro 上的主導地位

對於開發者和企業用戶來說，遞迴式 AI 的理論意義僅次於原始性能。在這個領域，GPT-5.3 Codex 建立了一個新的天花板。

該模型在 SWE-Bench Pro 上實現了頂尖水平（State-of-the-art，SOTA）的表現，這是評估 AI 解決現實世界 GitHub 問題能力的行業標準基準。與需要生成單個函數的標準編碼測試不同，SWE-Bench Pro 要求 AI 導航複雜的代碼庫、理解依賴關係、重現錯誤並生成通過的拉取請求（Pull Request）。

關鍵性能指標：

SWE-Bench Pro 解決率：64.2%（此前 SOTA：52%）
推理延遲：比 GPT-5 Codex 低 25%
上下文窗口（Context Window）：擴展至 50 萬個 token，並具有「完美回憶」優化

這些指標表明 GPT-5.3 Codex 正在超越「副駕駛（copilot）」地位，成為能夠以極少的人類監督處理端到端功能請求的全自主「代理工程師」。

自主代理編碼之戰：OpenAI 對決 Anthropic

這次發佈的時間點不容忽視。TechCrunch 報導稱，Anthropic 在 OpenAI 宣佈前幾分鐘發佈了其更新的編碼代理。這種同步突顯了該行業激烈的競爭壓力。

雖然 Anthropic 的發佈重點放在代碼生成中的「憲法安全（Constitutional Safety）」——確保生成的軟件在設計上是安全的——但 OpenAI 的 GPT-5.3 Codex 似乎將自己定位於純粹的速度和遞迴能力。

AI 編碼助手市場已分化為兩種截然不同的需求：協助（自動補全、解釋）和代理（自主完成任務）。 GPT-5.3 Codex 堅定地瞄準了後者。其在多步編碼任務中自我修復的能力得到了顯著增強，減少了在長時間編碼會話中模型丟失原始目標的「漂移」現象。

技術對比：2026 年的版圖

為了了解 GPT-5.3 Codex 在當前生態系統中的位置，我們彙編了截至 2026 年 2 月可用領先模型的對比分析。

表 1：領先 AI 編碼模型對比分析

模型名稱	SWE-Bench Pro 評分	推理速度（相對）	遞迴訓練
GPT-5.3 Codex	64.2%	1.25x（基準）	是（第二階段）
Anthropic Claude 4.5 Code	58.9%	0.95x	否
Google Gemini 2.0 Pro Dev	55.4%	1.05x	部分（合成數據）
Meta Llama 4-Code (Open)	49.1%	0.85x	否

數據清楚地表明，專有遞迴模型與依賴傳統人工策劃訓練流水線的模型之間的差距正在擴大。在 SWE-Bench Pro 上領先最近的競爭對手 5.3% 具有統計學意義，代表了 GPT-5.3 可以處理而其他模型無法處理的數千個複雜邊緣情況。

對開發者和軟件行業的影響

GPT-5.3 Codex 的發佈為軟件工程從業人員帶來了深刻的問題和機遇。轉向 遞迴式自我改進（recursive self-improvement） 意味著模型進步的速度可能不再與人類研究時間線線性掛鈎。

向「管理型」工程的轉變

隨著像 GPT-5.3 Codex 這樣的模型變得能夠處理軟件架構的實現細節，人類軟件工程師的角色正加速向系統設計、產品邏輯和驗證轉變。使用 API Alpha 版本的開發者報告稱，他們的工作流程已從編寫代碼轉變為審查由 AI 生成的 PR（拉取請求）。

安全與驗證

對於一個幫助構建自身的模型，安全對齊變得至關重要。如果模型優化了自己的代碼，我們如何確保它保留安全約束？OpenAI 對此表示，模型的「憲法（Constitution）」——其核心安全準則——保持不變且由人類控制，即使模型優化了自己的執行邏輯。

結論：邁向遞迴的第一步

OpenAI 的 GPT-5.3 Codex 不僅僅是一個更快的編碼機器人；它是遞迴式自我改進假設的概念驗證。通過成功利用模型來提高自身的推理速度並生成自己的訓練數據，OpenAI 完成了閉環。

對於 Creati.ai 的讀者來說，信息很明確：我們使用的工具不再只是靜態產品。它們是參與自身成長的演進系統。當我們將 GPT-5.3 Codex 集成到工作流程中時，我們不僅是在使用軟件，還是在與一個正在積極學習構建更好版本的智能體進行協作。

隨著遞迴時代的開始，AI 在軟件開發中所能達到的上限剛剛被提高——由 AI 親自提高。

遞迴智能（Recursive Intelligence）的新紀元：OpenAI 發佈 GPT-5.3 Codex

遞迴循環：GPT-5.3 如何自我構建

粉碎基準測試：在 SWE-Bench Pro 上的主導地位

自主代理編碼之戰：OpenAI 對決 Anthropic

技術對比：2026 年的版圖

對開發者和軟件行業的影響

向「管理型」工程的轉變

安全與驗證

結論：邁向遞迴的第一步

ex ads 202603311112

OpenAI 發布 GPT-5.3 Codex：首個協助自我構建的自我改進型 AI 模型

OpenAI 推出 GPT-5.3 Codex，這是第一個在自身創建中發揮關鍵作用的 AI 模型，其運行速度比前代快 25%，在 SWE-Bench Pro 上達到最先進的性能，標誌著 AI 進入遞歸自我改進時代。

遞迴智能（Recursive Intelligence）的新紀元：OpenAI 發佈 GPT-5.3 Codex

遞迴循環：GPT-5.3 如何自我構建

粉碎基準測試：在 SWE-Bench Pro 上的主導地位

自主代理編碼之戰：OpenAI 對決 Anthropic

技術對比：2026 年的版圖

對開發者和軟件行業的影響

向「管理型」工程的轉變

安全與驗證

結論：邁向遞迴的第一步

Related AI News

OpenAI 為免費與 Go 等級用戶推出 ChatGPT 廣告方案

Google DeepMind 執行長 Demis Hassabis 質疑 OpenAI 及早在 ChatGPT 上投放廣告的做法

OpenAI 重組領導層以奪回企業 AI 市場份額

ex ads 202603311112

OpenAI 發布 GPT-5.3 Codex：首個協助自我構建的自我改進型 AI 模型

OpenAI 推出 GPT-5.3 Codex，這是第一個在自身創建中發揮關鍵作用的 AI 模型，其運行速度比前代快 25%，在 SWE-Bench Pro 上達到最先進的性能，標誌著 AI 進入遞歸自我改進時代。