AI News

歷史性的飛躍:OpenAI 發表首款自我構建的 AI——GPT-5.3-Codex

這是人工智能(Artificial Intelligence,AI)產業的決定性時刻,OpenAI 正式發布了 GPT-5.3-Codex,這款模型標誌著從靜態軟體開發向遞歸自我改進(Recursive Self-Improvement)的轉型。於 2026 年 2 月 5 日發布,此次新迭代不僅是處理能力的升級,更是 AI 模型構思、訓練和部署方式的根本性轉變。

OpenAI 首次證實,AI 模型在其自身的創建過程中發揮了關鍵作用。工程團隊積極使用 GPT-5.3-Codex 來調試其自身的訓練運行、管理部署基礎架構並診斷複雜的評估結果。這種「代理(Agentic)」能力——即自主採取行動以實現複雜目標的能力——預示著 AI 系統加速自身演進的新時代已經到來。

遞歸自我改進:創新背後的引擎

GPT-5.3-Codex 最重大的突破在於其開發方法論。與以往由人類工程師精心手動編碼訓練 harness(訓練架構)的各個方面不同,GPT-5.3-Codex 被整合到了工程工作流本身。

OpenAI 的工程團隊表示,該模型識別上下文渲染錯誤以及根治人類開發人員難以隔離的低快取命中率的能力讓他們感到「震驚」。透過利用模型的早期檢查點(Checkpoints)來完善最終產品,OpenAI 成功展示了遞歸自我改進的實際應用——這一概念長期以來被理論化為奇點(Singularity)的前兆。

「Codex 團隊使用早期版本來調試其自身的訓練、管理其自身的部署,並診斷測試結果和評估,」OpenAI 在其公告中表示。這種遞歸循環使模型能夠針對訓練它的 Nvidia GB200 NVL72 系統優化其架構,以以前無法實現的方式最大化效率。

性能指標與代理能力

GPT-5.3-Codex 不僅更聰明,而且效率顯著提高。與其前身 GPT-5.2-Codex 相比,該模型的速度提升了 25%,同時在某些輸出中僅需約一半的 Token(權杖)量。這種效率對於企業採用至關重要,因為推理成本仍然是擴大規模的障礙。

該模型的能力遠超編寫 Python 腳本或調試 JavaScript。OpenAI 將 GPT-5.3-Codex 描述為一款「前沿模型(Frontier Model)」,能夠執行以往僅限於人類專業人士的任務,例如生成投影片、管理複雜的試算表以及監督整個網頁開發生命週期。

基準測試優勢:Terminal-Bench 2.0

為了量化這些收益,OpenAI 使用了 Terminal-Bench 2.0,這是評估代理編碼能力的業界標準基準測試。結果突顯了在準確性和問題解決自主性方面的巨大世代飛躍。

表 1:領先編碼模型的性能比較

指標 GPT-5.2-Codex(前代) GPT-5.3-Codex(新款)
Terminal-Bench 2.0 準確度 64.7% 77.3%
推理速度 基準 +25% 更快
Token 效率 標準 所需 Token 減少約 50%
代理範圍 程式碼審查與編寫 完整軟體生命週期管理

Terminal-Bench 2.0 從 64.7% 到 77.3% 的跳躍代表了一個關鍵門檻。這表明該模型現在可以處理模糊的、多步驟的編碼環境,其成功率在特定背景下可與資深人類開發人員相媲美。

戰略擴張:OpenAI Frontier 與企業整合

GPT-5.3-Codex 的發布恰逢 OpenAI Frontier 的推出,這是一個旨在為企業環境編排 AI 代理團隊的新平台。這一戰略調整表明,OpenAI 正超越聊天機器人範式,邁向「AI 員工」在企業基礎架構內協作的未來。

隨著最近 macOS 版 Codex 應用程式的發布,開發人員現在可以將 GPT-5.3-Codex 直接整合到其本地工作流中。這使得模型能夠與本地文件和開發環境進行交互,進一步模糊了外部工具與協作團隊成員之間的界限。

主導地位之爭:OpenAI 對決 Anthropic

GPT-5.3-Codex 的發布與競爭實驗室 Anthropic 推出 Claude Opus 4.6 發生在同一天。這種同步發布突顯了推動該領域發展的激烈競爭。

雖然 OpenAI 專注於「自我改進」的敘事和原始速度,但 Anthropic 的 Claude Opus 4.6 將自己定位為更具「思考性」和自主性的規劃者,旨在以最少的人類干預執行長週期任務。產業分析師指出,雖然 GPT-5.3-Codex 在交互協作和速度方面表現出色(充當高效的結對程式設計師),但 Claude Opus 4.6 旨在成為一名自主研究員。

這種哲學上的分歧——交互式加速與自主式沉思——根據工作流需求為開發人員提供了不同的選擇。然而,OpenAI 對遞歸自我改進的展示可能使其在未來迭代的速度上具有獨特優勢。

結論:AI 開發的新標準

GPT-5.3-Codex 的推出是 AI 產業的分水嶺。透過成功利用該模型來構建自身,OpenAI 證明了遞歸改進不再是科幻小說,而是切實的工程現實。

隨著開發人員和企業開始透過新的 API 和 Frontier 平台部署 GPT-5.3-Codex,重點將轉向這些自我改進能力如何轉化為現實世界的生產力。憑藉顯著更高的基準測試分數以及與專業工作流的更深層次整合, GPT-5.3-Codex 為人工智能的可能性樹立了一個強大的新標準。

精選
ex ads 202603311112
1111111111111
BlazeGard
Blazeguard provides unparalleled fire safety through innovative fire-rated sheathing technology.
Test Face Swap
Test Face Swap Test Face Swap Test Face Swap Test Face Swap Test Face Swap Test Face Swap
Midjourney for Slack
Bring AI-generated images directly to your Slack workspace with Midjourney for Slack.
AI Bot Eye
Transform your security with AI-driven surveillance technology.
amy
Amy is a comprehensive workplace assistant that streamlines tasks, schedules meetings, and manages projects.
sharkfoto-20250108-quick
Remove background from the image with just one click and convert the image to or from 200+ formats.
test 2 face swap 2
test 2 face swap 2test 2 face swap 2test 2 face swap 2test 2 face swap 2test 2 face swap 2test 2 face swap 2test 2 face
Gptzero me
GPTZero is a tool to detect AI-generated text accurately and easily.
sharkfoto-20250108-free
AI-powered tool for background removal and image conversion in over 200 formats.
BGRemover
Easily remove image backgrounds online with SharkFoto BGRemover.
sharkfoto agent test 202510111844
SharkFoto offers AI-powered free photo editing tools including background removal and colorization.
WorkViz
Workviz: AI-powered platform optimizing team performance through comprehensive analytics.
FreeAiKit
FreeAiKit offers a collection of free AI tools for various content creation needs.
TAROT ARCANA
Unveil your future with Tarot Arcana, an AI-powered tarot reading app.
Skywork
Skywork 將簡單的輸入轉化為多模式內容,例如報告和幻燈片。
sharkfoto svip 20250715
BrowseGPTs
Daily updated directory for diverse ChatGPT models.
blockbank
All-in-one crypto neo banking app combining DeFi and CeFi technologies.
Sharkfoto Quick 091801
SharkFoto offers free AI-powered image editing tools including background removal and photo colorization.
Neuronwriter
Advanced tool for content optimization using semantic models.
Novel
Novel helps you craft a comprehensive professional profile.
AI Fortunist (AI-Powered Tarot Readings)
AI Fortunist provides personalized tarot readings, coffee readings, and dream interpretations using advanced AI.
ParrotPDF
ParrotPDF lets users engage with PDF files interactively.
Flove
Flove is a minimalist movement tracking app with innovative features.
Franklin AI
AI tool to streamline business operations and enhance decision-making.
Durable AI
AI-powered website builder to get your business online in 30 seconds.
JungGPT
An AI tool for emotional reflection and psychological insights.
ChartX
AI-powered medical documentation for efficient and accurate patient care.
eztalks-20250226-0424003
輕鬆地去除圖片背景並轉換圖片格式,盡在SharkFoto。
Udemy Summary with ChatGPT
Summarize Udemy videos with ChatGPT and take notes effortlessly.
Astro Answer New Tab
Discover astrology with personalized AI-generated horoscopes.
aiBot копирайтер
Effortlessly enhance your text with aiBot копирайтер.
PageSage
PageSage simplifies web browsing by generating questions and answers instantly.
GPU Finder
GPU Finder helps discover available GPU instances from global public cloud providers.
Skyworker
AI-powered platform for tech job seekers and recruiters.
Craft
Craft is a powerful document creation and collaboration tool for teams and individuals.
GottaMeme. AI Meme Generator
Create hilarious memes effortlessly with GottaMeme's AI-powered generator.
Recap
Easily summarize any webpage portion with Recap, an open-source browser extension utilizing ChatGPT.
kimi quick test 20250417-121312223
一個創新的平台,用於提升個人生產力。
Magazine Luiza
Efficient shopping assistant for Magazine Luiza users.
sharkfoto svip test 202512241034
SharkFoto 是一個由 AI 驅動的平台,可輕鬆創建與編輯影片、圖像和音樂。
Bigjpg AI
Bigjpg enhances image quality through advanced AI upscaling.
kimi test 20250328-3
使用由AI驅動的工具免費提升、轉換和編輯圖像。
viddo.ai
Veo3 by Viddo AI enables AI-powered text or image to high-quality video creation rapidly.
Simplifly
Summarize lengthy articles easily with Simplifly.
BearGPT - Chatgpt Enhancer
Enhance your ChatGPT experience with BearGPT for better navigation and customization.
2026 Face Swap
2026 Face Wwap2026 Face Wwap2026 Face Wwap2026 Face Wwap2026 Face Wwap2026 Face Wwap2026 Face Wwap2026 Face Wwap2026 Fac
TextPal
TextPal utilizes AI to summarize and manage webpage text effortlessly.
AlgoDocs
AlgoDocs: AI-powered document data extraction made easy.
Audioread: Ultra-Realistic Text-to-Speech
Listen to articles with ultra-realistic AI voices.
GPTXtend
Enhance your ChatGPT experience with powerful sharing tools.
Free Email Extractor from Website
Free email extraction tool for scraping emails, phone numbers, and social profiles from websites.
Skypher
Streamline your security reviews with Skypher's automation.
AI PDF chatbot agent built with LangChain & LangGraph
SharkFoto 提供免費的 AI 驅動照片編輯工具,用於背景移除、著色、增強和調整圖片大小。
Wan 2.2-test
Wan 2 AI offers fast, high-quality 1080p AI video generation with advanced motion control.
Tappy AI
AI browser extension for adding thoughtful comments to LinkedIn posts.
sharkfoto-svip-092202
SharkFoto offers free AI-powered image editing tools like background removal and coloring.
Letz DM
Automate TikTok influencer marketing without the hassle.
Belly Buddy
Track food intake and digestive symptoms with Belly Buddy.
sharkfoto svip test 202509221443
SharkFoto offers free AI-powered photo editing tools for automatic background removal and image enhancement.
sharkfoto-svip-0922-changename
SharkFoto 提供免費的 AI 驅動照片工具,自動移除背景並提升圖像質量。
Alltum
Organizes emails, tasks, and files with AI-driven project management.

OpenAI 公布 GPT-5.3-Codex:首款協助自我構建的自我改進 AI 模型,標誌人工智慧新時代

OpenAI 發布了 GPT-5.3-Codex,這是首個協助自身構建的 AI 模型,標誌著在遞歸式自我改進與 AI 發展上的突破。