AIモデルが複雑な数学問題を解決し、自律的な研究能力を前進させる
OpenAIのGPT-5.2は、未解決のエルデシュ(Erdős)数学問題を解く画期的な能力を示しています。クリスマス以降、AIの関与により15件の問題が未解決から解決へと移りました。

人工知能と数理科学の決定的な瞬間において、AI研究スタートアップのAxiomは、これまで未解決だった4つの数学的問題の解決に成功したと発表した。同社独自のニューロ・シンボリック(neuro-symbolic)エンジンであるAxiomProverによるこの突破口は、大規模言語モデル(LLM)に典型的な統計的近似からの大きな脱却を意味している。その代わりに、研究レベルでの厳密で創造的、かつ形式的に検証された推論能力を示している。
2026年2月4日に行われたこの発表は、学術界に波紋を広げた。解決された問題の中には、5年間専門家を足止めさせていた代数幾何学(algebraic geometry)の複雑な予想や、シュリニヴァーサ・ラマヌジャン(Srinivasa Ramanujan)の著作に関連する新しい証明が含まれている。この進展は、AIがもはや単なる計算やデータ分類のツールではなく、真の発見が可能な協力者へと進化したことを示唆している。
これらの成果の中で最も注目されているのは、微分(曲面に沿った距離を測定するために使用される微積分学の要素)を含む代数幾何学における特定の障害に関するものである。5年前、数学者の**Dawei Chen氏とQuentin Gendron**氏は、特定の幾何学的構造を分類しようとして理論的な閉塞に直面した。彼らの主張は、証明も正当化もできなかった数論の「奇妙な公式」に依存しており、発見を定理ではなく予想として発表せざるを得なかった。
解決のきっかけは、2026年1月にワシントンD.C.で開催された数学会議での偶然の出会いだった。著名な数学者であり、Axiomの幹部に新たに就任した**Ken Ono**氏は、停滞していた問題についてChen氏から相談を受けた。報告によると、Ono氏は翌朝、完全に形式化され検証された証明をChen氏に提示したという。
「その後、すべてが自然に収まりました」と、Chen氏はarXivリポジトリへの証明の公開後のインタビューで語った。「AxiomProverが見つけたのは、すべての人間が見落としていたものだったのです。」
このAIは、代数幾何学の問題と、もともと19世紀に研究されていた数値現象との間の微妙な関連性を特定していた。もっともらしいが数学的には無効なリンクを「ハルシネーション(幻覚)」として生成する可能性がある標準的なLLMとは異なり、AxiomProverは証明を生成すると同時に、形式数学のための専門的なプログラミング言語である**Lean**を使用してその正しさを検証した。
Axiomの核心的な革新はそのアーキテクチャにある。GPT-4やGeminiのような生成モデルは、膨大なトレーニングデータに基づいてシーケンス内の次のトークンを予測することに優れているが、高度な数学に必要な厳密な論理的一貫性に苦労することが多い。AxiomProverは、ニューラルネットワークの直感的なパターン認識と、形式的定理証明機の厳格な論理的足場を組み合わせたニューロ・シンボリック(neuro-symbolic)アプローチを利用している。
Axiomの共同創設者であり、システムの主要な設計者である24歳の**Carina Hong**氏は、数学をテキストとしてではなく、制約と論理規則のシステムとして扱うようにAxiomProverを設計した。Leanと統合することで、システムは生成された証明のすべてのステップが受け入れられる前に、数学的に有効であることを保証する。
この「生成と検証(generate-and-verify)」のループにより、AIは、認知バイアスや必要な計算の膨大な複雑さのために人間の数学者が見落とす可能性のある新しい解決経路を探索できる。フェルの予想(Fel's Conjecture)(解決された4つの問題のもう一つ)の場合、AxiomProverは最初から最後まで自律的に証明を考案した。この問題は、多項式間の関係を記述する数学的表現である**シュジー(syzygies)に関するもので、伝説的なインドの数学者シュリニヴァーサ・ラマヌジャン(Srinivasa Ramanujan)**のノートに見られる公式が予期せず含まれていた。
以下の表は、今回の発表でAxiomProverが達成した具体的な突破口の概要を示し、タスクの複雑さと結果を対比させている。
表1:AxiomProverによる主な数学的成果(2026年2月)
| 問題/課題 | 分野 | AxiomProverの結果 |
|---|---|---|
| チェン・ジャンドロン予想 | 代数幾何学 & 数論(Number Theory) | 19世紀の関連性を特定、完全な形式証明 |
| フェルの予想 | シュジー(可換代数) | 自律的なエンドツーエンドの証明、ラマヌジャンの関連性を発見 |
| パトナム 2025 競技会 | 学部レベルの数学 | 12/12 満点(人間の平均スコア:0-1) |
| 未指定のトポロジー問題 | トポロジー | 新しい証明を生成(詳細は査読待ち) |
この成功の影響は、証明された特定の定理をはるかに超えて広がる。広範なAI業界にとって、Axiomの成功は、純粋な「生成(generative)」モデルよりも「推論(reasoning)」モデルへの多額の投資を正当化するものである。
北米で最も困難な学部生向けの数学競技会と一般にみなされている**パトナム数学競技会 2025(Putnam 2025)**における同スタートアップのパフォーマンスは、この変化のベンチマークとなっている。以前のモデルは数点を得るのにも苦労したが、AxiomProverは12/12の満点を獲得したと報告されている。この快挙は、特定のトレーニングデータセットをはるかに超えて一般化できるレベルの問題解決の多様性を暗示している。
しかし、学術界の反応は慎重な楽観論を保っている。証明の速度と正確さは否定できないが、「説明可能性(explainability)」に関する疑問は残っている。Leanによる形式的に検証された証明は、正しいことは保証されているが、伝統的な意味で人間が読める、あるいは「洞察力に満ちた」ものであるとは限らない。
この分野の著名な人物たちが意見を述べている。数学へのAIの統合を長年提唱してきたフィールズ賞受賞者の**テレンス・タオ(Terence Tao)**氏は、これらの結果は、AIが予想よりも早く重要なマイルストーンに到達していることを示していると示唆した。逆に、ベン・ゲルツェル(Ben Goertzel)のような汎用人工知能(AGI)の研究者は、これらは「限定的な」超絶的成果であり、一般的な創造的知能への飛躍は依然として2027年から2028年の展望における課題であると主張している。
Axiomの突破口は、科学におけるAIの役割が、検索エンジンやコードアシスタントから、主要な研究者へと移行することを予兆している。François Charton氏やHugh Leather氏といった人材を引きつけている同スタートアップは、「自己改善する超知能推論機」の構築を目指している。
企業や機関にとって、AxiomProverが示した技術は以下の分野に応用できる可能性がある:
Ken Ono氏が指摘したように、人間の直感とマシンの精度のコラボレーションはまだ始まったばかりだ。「AIはまだリーマン予想(Riemann Hypothesis)を解決していません」と、最も有名な未解決問題の一つに言及しながら、Ono氏は記者団に語った。「しかし、専門家を何年も悩ませてきた問いへの答えを見つけ出しました。それは始まりなのです。」
この進展により、Axiomはチャットボットに焦点を当てた競合他社とは一線を画す「数学AI(Math-AI)」分野の最前線に位置づけられ、21世紀に計算機的に何が可能かという新しい基準を確立した。