AI News

遞迴智能(Recursive Intelligence)的新紀元:OpenAI 發佈 GPT-5.3 Codex

在一個可能被銘記為遞迴式 AI(Recursive AI)時代正式開啟的分水嶺時刻,OpenAI 發佈了 GPT-5.3 Codex,這是首個被明確公認在其自身開發過程中發揮關鍵作用的大型語言模型。該模型於 2026 年 2 月 5 日星期四推出,代表了從靜態訓練到自我強化優化循環的範式轉移。

在 Creati.ai,我們密切關注自主代理編碼(Agentic Coding)模型的發展軌跡,但 GPT-5.3 Codex 的獨特之處不僅在於其產出,更在於其起源。根據 OpenAI 的說法,該模型生成了用於微調的大部分合成數據,並編寫了底層內核優化(low-level kernel optimizations),使其運行速度比前代產品快了 25%

此次發佈正值新聞週期頻繁之際,就在競爭對手 Anthropic 宣佈其自身的 自主代理編碼(agentic coding) 更新幾分鐘後發佈,這標誌著「AI 軍備競賽」已從參數數量轉向遞迴能力和自主代理能力。

遞迴循環:GPT-5.3 如何自我構建

GPT-5.3 Codex 的定義性特徵是其在自身創建過程中的角色。雖然以前的模型已被用於協助研究人員,但 OpenAI 證實,GPT-5.3 在「第二階段」預訓練和優化階段被部署為主要工程師。

這個過程涉及兩個截然不同的遞迴機制:

  1. 合成數據生成:模型(處於早期檢查點狀態)被指派生成數百萬個複雜的編碼挑戰和解決方案,然後由一個獨立的驗證器模型進行驗證,再反饋到訓練集中。這創造了一個高品質的數據飛輪,是人工標註員無法擴展匹配的。
  2. 架構優化:最令人震驚的是,GPT-5.3 Codex 被用於重寫 OpenAI 基礎設施中使用的 CUDA 內核和推理邏輯。該模型識別出了人類工程師忽略的內存分配效率低下問題,從而使推理延遲降低了 25%。

「這是我們第一次允許模型實質性地構建其自身的運行環境,」OpenAI 發言人在技術發行說明中表示。「我們看到的效率提升是模型比我們更了解其所運行的硬件的直接結果。」

粉碎基準測試:在 SWE-Bench Pro 上的主導地位

對於開發者和企業用戶來說,遞迴式 AI 的理論意義僅次於原始性能。在這個領域,GPT-5.3 Codex 建立了一個新的天花板。

該模型在 SWE-Bench Pro 上實現了頂尖水平(State-of-the-art,SOTA)的表現,這是評估 AI 解決現實世界 GitHub 問題能力的行業標準基準。與需要生成單個函數的標準編碼測試不同,SWE-Bench Pro 要求 AI 導航複雜的代碼庫、理解依賴關係、重現錯誤並生成通過的拉取請求(Pull Request)。

關鍵性能指標:

  • SWE-Bench Pro 解決率:64.2%(此前 SOTA:52%)
  • 推理延遲:比 GPT-5 Codex 低 25%
  • 上下文窗口(Context Window):擴展至 50 萬個 token,並具有「完美回憶」優化

這些指標表明 GPT-5.3 Codex 正在超越「副駕駛(copilot)」地位,成為能夠以極少的人類監督處理端到端功能請求的全自主「代理工程師」。

自主代理編碼之戰:OpenAI 對決 Anthropic

這次發佈的時間點不容忽視。TechCrunch 報導稱,Anthropic 在 OpenAI 宣佈前幾分鐘發佈了其更新的編碼代理。這種同步突顯了該行業激烈的競爭壓力。

雖然 Anthropic 的發佈重點放在代碼生成中的「憲法安全(Constitutional Safety)」——確保生成的軟件在設計上是安全的——但 OpenAI 的 GPT-5.3 Codex 似乎將自己定位於純粹的速度和遞迴能力。

AI 編碼助手市場已分化為兩種截然不同的需求:協助(自動補全、解釋)和 代理(自主完成任務)。 GPT-5.3 Codex 堅定地瞄準了後者。其在多步編碼任務中自我修復的能力得到了顯著增強,減少了在長時間編碼會話中模型丟失原始目標的「漂移」現象。

技術對比:2026 年的版圖

為了了解 GPT-5.3 Codex 在當前生態系統中的位置,我們彙編了截至 2026 年 2 月可用領先模型的對比分析。

表 1:領先 AI 編碼模型對比分析

模型名稱 SWE-Bench Pro 評分 推理速度(相對) 遞迴訓練
GPT-5.3 Codex 64.2% 1.25x(基準) 是(第二階段)
Anthropic Claude 4.5 Code 58.9% 0.95x
Google Gemini 2.0 Pro Dev 55.4% 1.05x 部分(合成數據)
Meta Llama 4-Code (Open) 49.1% 0.85x

數據清楚地表明,專有遞迴模型與依賴傳統人工策劃訓練流水線的模型之間的差距正在擴大。在 SWE-Bench Pro 上領先最近的競爭對手 5.3% 具有統計學意義,代表了 GPT-5.3 可以處理而其他模型無法處理的數千個複雜邊緣情況。

對開發者和軟件行業的影響

GPT-5.3 Codex 的發佈為軟件工程從業人員帶來了深刻的問題和機遇。轉向 遞迴式自我改進(recursive self-improvement) 意味著模型進步的速度可能不再與人類研究時間線線性掛鈎。

向「管理型」工程的轉變

隨著像 GPT-5.3 Codex 這樣的模型變得能夠處理軟件架構的實現細節,人類軟件工程師的角色正加速向系統設計、產品邏輯和驗證轉變。使用 API Alpha 版本的開發者報告稱,他們的工作流程已從編寫代碼轉變為審查由 AI 生成的 PR(拉取請求)。

安全與驗證

對於一個幫助構建自身的模型,安全對齊變得至關重要。如果模型優化了自己的代碼,我們如何確保它保留安全約束?OpenAI 對此表示,模型的「憲法(Constitution)」——其核心安全準則——保持不變且由人類控制,即使模型優化了自己的執行邏輯。

結論:邁向遞迴的第一步

OpenAI 的 GPT-5.3 Codex 不僅僅是一個更快的編碼機器人;它是遞迴式自我改進假設的概念驗證。通過成功利用模型來提高自身的推理速度並生成自己的訓練數據,OpenAI 完成了閉環。

對於 Creati.ai 的讀者來說,信息很明確:我們使用的工具不再只是靜態產品。它們是參與自身成長的演進系統。當我們將 GPT-5.3 Codex 集成到工作流程中時,我們不僅是在使用軟件,還是在與一個正在積極學習構建更好版本的智能體進行協作。

隨著遞迴時代的開始,AI 在軟件開發中所能達到的上限剛剛被提高——由 AI 親自提高。

精選
ex ads 202603311112
1111111111111
BlazeGard
Blazeguard provides unparalleled fire safety through innovative fire-rated sheathing technology.
Test Face Swap
Test Face Swap Test Face Swap Test Face Swap Test Face Swap Test Face Swap Test Face Swap
Midjourney for Slack
Bring AI-generated images directly to your Slack workspace with Midjourney for Slack.
AI Bot Eye
Transform your security with AI-driven surveillance technology.
amy
Amy is a comprehensive workplace assistant that streamlines tasks, schedules meetings, and manages projects.
sharkfoto-20250108-quick
Remove background from the image with just one click and convert the image to or from 200+ formats.
test 2 face swap 2
test 2 face swap 2test 2 face swap 2test 2 face swap 2test 2 face swap 2test 2 face swap 2test 2 face swap 2test 2 face
Gptzero me
GPTZero is a tool to detect AI-generated text accurately and easily.
sharkfoto-20250108-free
AI-powered tool for background removal and image conversion in over 200 formats.
BGRemover
Easily remove image backgrounds online with SharkFoto BGRemover.
sharkfoto agent test 202510111844
SharkFoto offers AI-powered free photo editing tools including background removal and colorization.
WorkViz
Workviz: AI-powered platform optimizing team performance through comprehensive analytics.
FreeAiKit
FreeAiKit offers a collection of free AI tools for various content creation needs.
TAROT ARCANA
Unveil your future with Tarot Arcana, an AI-powered tarot reading app.
Skywork
Skywork 將簡單的輸入轉化為多模式內容,例如報告和幻燈片。
sharkfoto svip 20250715
BrowseGPTs
Daily updated directory for diverse ChatGPT models.
blockbank
All-in-one crypto neo banking app combining DeFi and CeFi technologies.
Sharkfoto Quick 091801
SharkFoto offers free AI-powered image editing tools including background removal and photo colorization.
Neuronwriter
Advanced tool for content optimization using semantic models.
Novel
Novel helps you craft a comprehensive professional profile.
AI Fortunist (AI-Powered Tarot Readings)
AI Fortunist provides personalized tarot readings, coffee readings, and dream interpretations using advanced AI.
ParrotPDF
ParrotPDF lets users engage with PDF files interactively.
Flove
Flove is a minimalist movement tracking app with innovative features.
Franklin AI
AI tool to streamline business operations and enhance decision-making.
Durable AI
AI-powered website builder to get your business online in 30 seconds.
JungGPT
An AI tool for emotional reflection and psychological insights.
ChartX
AI-powered medical documentation for efficient and accurate patient care.
eztalks-20250226-0424003
輕鬆地去除圖片背景並轉換圖片格式,盡在SharkFoto。
Udemy Summary with ChatGPT
Summarize Udemy videos with ChatGPT and take notes effortlessly.
Astro Answer New Tab
Discover astrology with personalized AI-generated horoscopes.
aiBot копирайтер
Effortlessly enhance your text with aiBot копирайтер.
PageSage
PageSage simplifies web browsing by generating questions and answers instantly.
GPU Finder
GPU Finder helps discover available GPU instances from global public cloud providers.
Skyworker
AI-powered platform for tech job seekers and recruiters.
Craft
Craft is a powerful document creation and collaboration tool for teams and individuals.
GottaMeme. AI Meme Generator
Create hilarious memes effortlessly with GottaMeme's AI-powered generator.
Recap
Easily summarize any webpage portion with Recap, an open-source browser extension utilizing ChatGPT.
kimi quick test 20250417-121312223
一個創新的平台,用於提升個人生產力。
Magazine Luiza
Efficient shopping assistant for Magazine Luiza users.
sharkfoto svip test 202512241034
SharkFoto 是一個由 AI 驅動的平台,可輕鬆創建與編輯影片、圖像和音樂。
Bigjpg AI
Bigjpg enhances image quality through advanced AI upscaling.
kimi test 20250328-3
使用由AI驅動的工具免費提升、轉換和編輯圖像。
viddo.ai
Veo3 by Viddo AI enables AI-powered text or image to high-quality video creation rapidly.
Simplifly
Summarize lengthy articles easily with Simplifly.
BearGPT - Chatgpt Enhancer
Enhance your ChatGPT experience with BearGPT for better navigation and customization.
2026 Face Swap
2026 Face Wwap2026 Face Wwap2026 Face Wwap2026 Face Wwap2026 Face Wwap2026 Face Wwap2026 Face Wwap2026 Face Wwap2026 Fac
TextPal
TextPal utilizes AI to summarize and manage webpage text effortlessly.
AlgoDocs
AlgoDocs: AI-powered document data extraction made easy.
Audioread: Ultra-Realistic Text-to-Speech
Listen to articles with ultra-realistic AI voices.
GPTXtend
Enhance your ChatGPT experience with powerful sharing tools.
Free Email Extractor from Website
Free email extraction tool for scraping emails, phone numbers, and social profiles from websites.
Skypher
Streamline your security reviews with Skypher's automation.
AI PDF chatbot agent built with LangChain & LangGraph
SharkFoto 提供免費的 AI 驅動照片編輯工具,用於背景移除、著色、增強和調整圖片大小。
Wan 2.2-test
Wan 2 AI offers fast, high-quality 1080p AI video generation with advanced motion control.
Tappy AI
AI browser extension for adding thoughtful comments to LinkedIn posts.
sharkfoto-svip-092202
SharkFoto offers free AI-powered image editing tools like background removal and coloring.
Letz DM
Automate TikTok influencer marketing without the hassle.
Belly Buddy
Track food intake and digestive symptoms with Belly Buddy.
sharkfoto svip test 202509221443
SharkFoto offers free AI-powered photo editing tools for automatic background removal and image enhancement.
sharkfoto-svip-0922-changename
SharkFoto 提供免費的 AI 驅動照片工具,自動移除背景並提升圖像質量。
Alltum
Organizes emails, tasks, and files with AI-driven project management.

OpenAI 發布 GPT-5.3 Codex:首個協助自我構建的自我改進型 AI 模型

OpenAI 推出 GPT-5.3 Codex,這是第一個在自身創建中發揮關鍵作用的 AI 模型,其運行速度比前代快 25%,在 SWE-Bench Pro 上達到最先進的性能,標誌著 AI 進入遞歸自我改進時代。