Anthropic 的 Claude AI 代理自主構建 10 萬行 C 編譯器
16 個 Claude Opus 4.6 AI 代理並行工作,兩週內創建出一個可運行的 C 編譯器,展示了突破性的自主編碼能力。
16 個 Claude Opus 4.6 AI 代理並行工作,兩週內創建出一個可運行的 C 編譯器,展示了突破性的自主編碼能力。
MIT CSAIL 的研究人員推出 EnCompass,一個突破性的框架,利用回溯 (backtracking) 與平行搜尋,大幅提升 AI 代理人的可靠性與效率。
Google 的 Gemini 2.5 Pro 在 LMArena 排行榜中獲得最高名次,在推理、數學、科學和程式設計基準測試中超越 OpenAI、Claude 與 DeepSeek。
Axiom 的 AI 工具 AxiomProver 成功解決了代數幾何與數論中四個長期存在的數學難題,標誌著 AI 推理上的一大突破。