MIT 推出 EnCompass 框架,透過搜尋優化 AI 代理人的效能
MIT CSAIL 的研究人員推出 EnCompass,一個突破性的框架,利用回溯 (backtracking) 與平行搜尋,大幅提升 AI 代理人的可靠性與效率。
MIT CSAIL 的研究人員推出 EnCompass,一個突破性的框架,利用回溯 (backtracking) 與平行搜尋,大幅提升 AI 代理人的可靠性與效率。
OpenAI 發表 Frontier,這是一個企業平台,用於建立和管理類似人類員工的 AI 代理人,HP、Oracle、State Farm 和 Uber 是早期客戶。
Anthropic 的新 Claude Cowork 外掛引發軟體股大幅下挫,Thomson Reuters 與 Legalzoom 跌逾 15%,因為 AI 威脅企業工具。
AI 專家警告,廉價且易取得的工具使得個人化詐騙成為可能,深度造假詐騙已走向工業化。英國消費者在 9 個月內損失了 £9.4bn。
英國與微軟合作開發深偽造(deepfake)偵測系統。2025年分享了800萬個深偽造,較2023年的50萬個大幅增加。
Anthropic 的新職場 AI 助手 Cowork 引發市場恐慌,軟體股暴跌。湯森路透下跌 15.83%,LegalZoom 下跌近 20%。
Anthropic 的 Claude Cowork AI 觸發軟體股大規模拋售,S&P 500 軟體指數下挫 4%,投資人擔憂 AI 帶來的衝擊。
OpenAI 推出了 GPT-5.3-Codex,這是一款劃時代的程式編寫模型,透過偵錯訓練、管理部署與診斷評估來協助自身的開發。該模型的運行速度比前一代快 25%,標誌著 AI 進入遞歸式自我改進時代的一個重要里程碑。
Anthropic 釋出針對法律、金融和數據行銷領域的 Claude Cowork 插件,引發廣泛的市場震盪,Thomson Reuters 與 LegalZoom 股價下跌超過 15%,投資人擔心職場 AI 助手可能擾亂傳統企業軟體的商業模式。
Amazon、Alphabet、Meta與Microsoft共同預測2026年資本支出將達到前所未有的6500億美元,較去年增加60%,技術巨頭正透過大規模建設資料中心與對晶片的投資,競相主導AI運算。
Anthropic 為法律、金融及資料領域推出的新 AI 外掛引發大規模軟體股拋售,隨著市場從「科技全面勝出」轉向「贏家與輸家」格局,Thomson Reuters 與 LegalZoom 跌幅超過 15%。
OpenAI 推出 GPT-5.3 Codex,這是第一個在自身創建中發揮關鍵作用的 AI 模型,其運行速度比前代快 25%,在 SWE-Bench Pro 上達到最先進的性能,標誌著 AI 進入遞歸自我改進時代。
Anthropic 發表具突破性 100 萬 token 上下文視窗的 Claude Opus 4.6,在金融任務上比 GPT-5.2 高出 144 Elo 分,並在 Terminal-Bench 2.0 和 Humanity's Last Exam 基準測試中取得最高分。
Anthropic 推出 Claude Opus 4.6,具備能平行協調的代理團隊、100 萬 token 的上下文視窗,以及最先進的表現。
OpenAI 發布了 GPT-5.3-Codex,這是首個協助自身構建的 AI 模型,標誌著在遞歸式自我改進與 AI 發展上的突破。