AI News

自動化推理的歷史性跨越:AxiomProver 解決長期存在的數學猜想

在人工智慧與數學科學的決定性時刻,專注於 AI 研究的新創公司 Axiom 宣佈成功解決了四個先前未解的數學難題。這一突破由其專有的神經符號引擎 AxiomProver 所驅動,標誌著與大型語言模型(Large Language Models,LLMs)典型的統計近似方法的重大背離。相反,它展示了在研究層級進行嚴謹、具創造性且經過形式化驗證(Formally Verified)推理的能力。

這項於 2026 年 2 月 4 日發布的聲明在學術界引起了轟動。被解決的問題中,包括一個在 代數幾何(Algebraic Geometry) 領域中困擾專家五年之久的複雜猜想,以及一項與斯里尼瓦瑟·拉馬努金(Srinivasa Ramanujan)著作相關的新穎證明。這項發展表明,AI 不再僅僅是計算或數據排序的工具,而是已進化為具備真實發現能力的合作者。

陳-熱德龍猜想:五年障礙已被清除

這些成就中最受矚目的是關於代數幾何中涉及微分(Differentials)的一個特定障礙——微分是用於測量曲線表面距離的微積分元素。五年前,數學家 陳大衛(Dawei Chen)Quentin Gendron 在嘗試對特定幾何結構進行分類時遇到了理論封鎖。他們的論點取決於數論中一個既無法證明也無法解釋的「奇怪公式」,迫使他們將研究結果以猜想而非定理的形式發表。

這一問題在 2026 年 1 月於華盛頓特區舉行的一次數學會議上的偶然相遇中得到了解決。著名數學家、Axiom 新任高管 小野謙(Ken Ono) 遇到了陳大衛,後者向他諮詢了這個停滯不前的問題。據報導,小野在第二天早上就向陳大衛展示了一份完整的、經過形式化驗證的證明。

「在那之後,一切都自然而然地步入正軌,」陳大衛在將證明發布到 arXiv 預印本庫後的採訪中評論道。「AxiomProver 發現了所有人類都忽略的東西。」

該 AI 識別出了代數幾何問題與最初在 19 世紀研究的一種數值現象之間的微妙聯繫。與可能「幻覺」出聽起來合理但數學上無效的聯繫的標準 LLM 不同,AxiomProver 生成了證明,並同時使用 Lean(一種用於形式數學的專業程式語言)驗證了其正確性。

超越模式匹配:AxiomProver 背後的技術

Axiom 的核心創新在於其架構。雖然像 GPT-4 或 Gemini 這樣的生成式模型擅長根據海量訓練數據預測序列中的下一個標記(Token),但它們通常難以應對高級數學所需的嚴格邏輯一致性。AxiomProver 採用了神經符號(Neuro-symbolic)方法,將神經網絡的直覺模式識別與形式定理證明器的嚴密邏輯支架相結合。

Carina Hong 是 Axiom 的 24 歲聯合創始人,也是該系統的主架構師,她將 AxiomProver 設計為不將數學視為文本,而是視為一個約束條件和邏輯規則的系統。通過與 Lean 集成,該系統確保生成的證明中的每一步在被接受之前都在數學上有效。

這種「生成與驗證」循環允許 AI 探索人類數學家由於認知偏見或必要計算的極度複雜性而可能忽視的新穎解題路徑。在 菲爾猜想(Fel's Conjecture)(被解決的四個問題中的另一個)的案例中,AxiomProver 自主設計了從頭到尾的證明。該問題涉及 連結(Syzygies)——描述多項式之間關係的數學表達式,並意外地涉及了在傳奇印度數學家 斯里尼瓦瑟·拉馬努金 的筆記本中發現的公式。

AI 數學能力的比較分析

下表概述了 AxiomProver 在最近的聲明中取得的具體突破,將任務的複雜性與結果進行了對比。

表 1:AxiomProver 取得的主要數學成就(2026 年 2 月)

問題/挑戰 領域 AxiomProver 結果
陳-熱德龍猜想 代數幾何與 數論(Number Theory) 識別出 19 世紀的聯繫;完整形式化證明
菲爾猜想 連結(交換代數) 自主端到端證明;發現拉馬努金聯繫
2025 年普特南競賽(Putnam 2025 Competition) 大學數學 12/12 滿分(人類中位數得分:0-1)
未指明的拓撲學問題 拓撲學 生成新穎證明(細節尚待同行評審)

行業與學術界的反應

這一成功的影響遠遠超出了所證明的特定定理。對於更廣泛的 AI 行業來說,Axiom 的成功驗證了對「推理」模型而非純粹「生成式」模型的巨額投資。

該公司在 2025 年普特南競賽(通常被認為是北美最難的大學數學競賽)中的表現,成為這一轉變的基準。雖然之前的模型甚至難以獲得幾分,但據報導 AxiomProver 獲得了 12/12 的滿分。這一壯舉意味著其具備了能很好地推廣到特定訓練數據集之外的解題多樣性。

然而,學術界的反應仍保持謹慎樂觀。雖然證明的速度和準確性不容置疑,但關於「可解釋性」的問題依然存在。在 Lean 中經過形式化驗證的證明雖然保證正確,但並不總是具有傳統意義上的可讀性或「啟發性」。

該領域的知名人士發表了看法。菲爾茲獎得主 陶哲軒(Terence Tao) 長期以來一直倡導將 AI 整合到數學中,他表示這些結果表明 AI 達到重要里程碑的時間早於預期。相反,通用人工智慧(AGI)研究人員如 Ben Goertzel 則認為,雖然這些是「狹義」的超常成就,但邁向通用創造性智慧的跨越仍是 2027-2028 年的挑戰。

AI 輔助研究的未來

Axiom 的突破標誌著 AI 在科學領域角色的一種轉變:從搜尋引擎或代碼助手轉變為主要研究者。這家吸引了 François Charton 和 Hugh Leather 等人才的新創公司,旨在構建一個「自我改進的超智慧推理器」。

對於機構和企業而言,AxiomProver 所展示的技術在以下方面具有潛在應用:

  • 軟體驗證(Software Verification): 證明關鍵代碼(如航空航天或金融領域)是無錯誤的。
  • 密碼學(Cryptography): 在不法分子之前識別加密算法中的漏洞。
  • 材料科學(Material Science): 以數學精度模擬複雜的分子相互作用。

正如 小野謙 所指出的,人類直覺與機器精度之間的合作才剛剛開始。「AI 尚未解決黎曼猜想(Riemann Hypothesis),」小野在引用最著名的未解難題之一時告訴記者。「但它已經找到了困擾專家多年問題的答案。這是一個開始。」

這一發展使 Axiom 處於「數學-AI」領域的前沿,有別於以聊天機器人為中心的競爭對手,並為 21 世紀的運算可能性樹立了新標準。

精選
ex ads 202603311112
1111111111111
BlazeGard
Blazeguard provides unparalleled fire safety through innovative fire-rated sheathing technology.
Test Face Swap
Test Face Swap Test Face Swap Test Face Swap Test Face Swap Test Face Swap Test Face Swap
Midjourney for Slack
Bring AI-generated images directly to your Slack workspace with Midjourney for Slack.
AI Bot Eye
Transform your security with AI-driven surveillance technology.
amy
Amy is a comprehensive workplace assistant that streamlines tasks, schedules meetings, and manages projects.
sharkfoto-20250108-quick
Remove background from the image with just one click and convert the image to or from 200+ formats.
test 2 face swap 2
test 2 face swap 2test 2 face swap 2test 2 face swap 2test 2 face swap 2test 2 face swap 2test 2 face swap 2test 2 face
Gptzero me
GPTZero is a tool to detect AI-generated text accurately and easily.
sharkfoto-20250108-free
AI-powered tool for background removal and image conversion in over 200 formats.
BGRemover
Easily remove image backgrounds online with SharkFoto BGRemover.
sharkfoto agent test 202510111844
SharkFoto offers AI-powered free photo editing tools including background removal and colorization.
WorkViz
Workviz: AI-powered platform optimizing team performance through comprehensive analytics.
FreeAiKit
FreeAiKit offers a collection of free AI tools for various content creation needs.
TAROT ARCANA
Unveil your future with Tarot Arcana, an AI-powered tarot reading app.
Skywork
Skywork 將簡單的輸入轉化為多模式內容,例如報告和幻燈片。
sharkfoto svip 20250715
BrowseGPTs
Daily updated directory for diverse ChatGPT models.
blockbank
All-in-one crypto neo banking app combining DeFi and CeFi technologies.
Sharkfoto Quick 091801
SharkFoto offers free AI-powered image editing tools including background removal and photo colorization.
Neuronwriter
Advanced tool for content optimization using semantic models.
Novel
Novel helps you craft a comprehensive professional profile.
AI Fortunist (AI-Powered Tarot Readings)
AI Fortunist provides personalized tarot readings, coffee readings, and dream interpretations using advanced AI.
ParrotPDF
ParrotPDF lets users engage with PDF files interactively.
Flove
Flove is a minimalist movement tracking app with innovative features.
Franklin AI
AI tool to streamline business operations and enhance decision-making.
Durable AI
AI-powered website builder to get your business online in 30 seconds.
JungGPT
An AI tool for emotional reflection and psychological insights.
ChartX
AI-powered medical documentation for efficient and accurate patient care.
eztalks-20250226-0424003
輕鬆地去除圖片背景並轉換圖片格式,盡在SharkFoto。
Udemy Summary with ChatGPT
Summarize Udemy videos with ChatGPT and take notes effortlessly.
Astro Answer New Tab
Discover astrology with personalized AI-generated horoscopes.
aiBot копирайтер
Effortlessly enhance your text with aiBot копирайтер.
PageSage
PageSage simplifies web browsing by generating questions and answers instantly.
GPU Finder
GPU Finder helps discover available GPU instances from global public cloud providers.
Skyworker
AI-powered platform for tech job seekers and recruiters.
Craft
Craft is a powerful document creation and collaboration tool for teams and individuals.
GottaMeme. AI Meme Generator
Create hilarious memes effortlessly with GottaMeme's AI-powered generator.
Recap
Easily summarize any webpage portion with Recap, an open-source browser extension utilizing ChatGPT.
kimi quick test 20250417-121312223
一個創新的平台,用於提升個人生產力。
Magazine Luiza
Efficient shopping assistant for Magazine Luiza users.
sharkfoto svip test 202512241034
SharkFoto 是一個由 AI 驅動的平台,可輕鬆創建與編輯影片、圖像和音樂。
Bigjpg AI
Bigjpg enhances image quality through advanced AI upscaling.
kimi test 20250328-3
使用由AI驅動的工具免費提升、轉換和編輯圖像。
viddo.ai
Veo3 by Viddo AI enables AI-powered text or image to high-quality video creation rapidly.
Simplifly
Summarize lengthy articles easily with Simplifly.
BearGPT - Chatgpt Enhancer
Enhance your ChatGPT experience with BearGPT for better navigation and customization.
2026 Face Swap
2026 Face Wwap2026 Face Wwap2026 Face Wwap2026 Face Wwap2026 Face Wwap2026 Face Wwap2026 Face Wwap2026 Face Wwap2026 Fac
TextPal
TextPal utilizes AI to summarize and manage webpage text effortlessly.
AlgoDocs
AlgoDocs: AI-powered document data extraction made easy.
Audioread: Ultra-Realistic Text-to-Speech
Listen to articles with ultra-realistic AI voices.
GPTXtend
Enhance your ChatGPT experience with powerful sharing tools.
Free Email Extractor from Website
Free email extraction tool for scraping emails, phone numbers, and social profiles from websites.
Skypher
Streamline your security reviews with Skypher's automation.
AI PDF chatbot agent built with LangChain & LangGraph
SharkFoto 提供免費的 AI 驅動照片編輯工具,用於背景移除、著色、增強和調整圖片大小。
Wan 2.2-test
Wan 2 AI offers fast, high-quality 1080p AI video generation with advanced motion control.
Tappy AI
AI browser extension for adding thoughtful comments to LinkedIn posts.
sharkfoto-svip-092202
SharkFoto offers free AI-powered image editing tools like background removal and coloring.
Letz DM
Automate TikTok influencer marketing without the hassle.
Belly Buddy
Track food intake and digestive symptoms with Belly Buddy.
sharkfoto svip test 202509221443
SharkFoto offers free AI-powered photo editing tools for automatic background removal and image enhancement.
sharkfoto-svip-0922-changename
SharkFoto 提供免費的 AI 驅動照片工具,自動移除背景並提升圖像質量。
Alltum
Organizes emails, tasks, and files with AI-driven project management.

AI 新創公司 Axiom 使用 AxiomProver 破解四個先前未解的數學問題

Axiom 的 AI 工具 AxiomProver 成功解決了代數幾何與數論中四個長期存在的數學難題,標誌著 AI 推理上的一大突破。