AI 모델들이 복잡한 수학 문제를 해결하며 자율 연구 역량을 향상시키다
OpenAI의 GPT-5.2는 해결되지 않은 에르되시(Erdős) 수학 문제들을 해결하는 획기적인 능력을 보여줍니다. 크리스마스 이후 AI의 참여로 15개의 문제가 미해결 상태에서 해결로 전환되었습니다.

인공지능(AI)과 수학 과학 분야의 획기적인 순간으로 기록될 이번 발표에서, 인공지능 연구 스타트업인 Axiom은 이전에 해결되지 않았던 4가지 수학적 문제를 성공적으로 해결했다고 발표했습니다. 독자적인 신경-기호 엔진(Neuro-symbolic engine)인 AxiomProver를 통해 이루어진 이 성과는 대규모 언어 모델(Large Language Models, LLM)의 전형적인 통계적 근사치 추정 방식에서 벗어난 중요한 진전을 의미합니다. 대신, 연구 수준에서의 엄격하고 창의적이며 공식적으로 검증된 추론 능력을 입증했습니다.
2026년 2월 4일에 발표된 이 소식은 학계에 큰 파장을 일으켰습니다. 해결된 문제 중에는 5년 동안 전문가들을 난처하게 했던 대수 기하학(Algebraic geometry)의 복잡한 추측과 스리니바사 라마누잔(Srinivasa Ramanujan)의 업적과 관련된 새로운 증명이 포함되어 있습니다. 이러한 발전은 AI가 단순한 계산이나 데이터 분류 도구를 넘어 진정한 발견을 수행할 수 있는 협력자로 진화했음을 시사합니다.
이번 성과 중 가장 주목받는 것은 곡면을 따라 거리를 측정하는 데 사용되는 미분(Differentials)과 관련된 대수 기하학의 특정 장애물을 해결한 것입니다. 5년 전, 수학자 **Dawei Chen**과 Quentin Gendron은 특정 기하학적 구조를 분류하려다 이론적 봉착에 부딪혔습니다. 이들의 주장은 증명하거나 정당화할 수 없는 수론의 "기묘한 공식"에 의존하고 있었으며, 이로 인해 연구 결과를 정리가 아닌 추측으로 발표할 수밖에 없었습니다.
해결의 실마리는 2026년 1월 워싱턴 D.C.에서 열린 수학 컨퍼런스에서의 우연한 만남에서 시작되었습니다. 저명한 수학자이자 Axiom의 임원으로 새로 임명된 **Ken Ono**는 정체된 문제와 관련하여 Chen의 접근을 받았습니다. 보고에 따르면, Ono는 바로 다음 날 아침 Chen에게 완전하고 공식적으로 검증된 증명을 제시했습니다.
"그 후에는 모든 것이 자연스럽게 풀렸습니다." Chen은 증명을 arXiv 저장소에 공개한 후 진행된 인터뷰에서 이렇게 말했습니다. "AxiomProver가 발견한 것은 모든 인간이 놓쳤던 것이었습니다."
AI는 대수 기하학 문제와 19세기에 처음 연구된 수치적 현상 사이의 미묘한 연결 고리를 찾아냈습니다. 그럴듯하게 들리지만 수학적으로는 타당하지 않은 연결을 "환각(Hallucinate)"할 수 있는 일반적인 LLM과 달리, AxiomProver는 증명을 생성하는 동시에 형식 수학을 위한 특수 프로그래밍 언어인 **Lean**을 사용하여 그 정확성을 검증했습니다.
Axiom의 핵심 혁신은 그 아키텍처에 있습니다. GPT-4나 Gemini 같은 생성형 모델(Generative models)은 방대한 학습 데이터를 바탕으로 시퀀스의 다음 토큰을 예측하는 데 뛰어나지만, 고등 수학에 필요한 엄격한 논리적 일관성에는 종종 어려움을 겪습니다. AxiomProver는 신경망의 직관적인 패턴 인식과 형식 정리 증명기의 엄격한 논리적 구조를 결합한 신경-기호(Neuro-symbolic) 방식을 활용합니다.
Axiom의 24세 공동 창업자이자 시스템의 주요 설계자인 **Carina Hong**은 수학을 텍스트가 아닌 제약 조건과 논리 규칙의 시스템으로 처리하도록 AxiomProver를 설계했습니다. Lean과의 통합을 통해 시스템은 생성된 증명의 모든 단계가 수락되기 전에 수학적으로 유효한지 확인합니다.
이러한 "생성 및 검증" 루프를 통해 AI는 인간 수학자가 인지적 편향이나 필요한 계산의 엄청난 복잡성 때문에 놓칠 수 있는 새로운 솔루션 경로를 탐색할 수 있습니다. 펠 추측(Fel's Conjecture)—해결된 4가지 문제 중 또 다른 하나—의 경우, AxiomProver는 처음부터 끝까지 독자적으로 증명을 고안해 냈습니다. 이 문제는 다항식 간의 관계를 설명하는 수학적 표현인 **시지지(Syzygies)**에 관한 것이었으며, 전설적인 인도 수학자 **스리니바사 라마누잔(Srinivasa Ramanujan)**의 노트에서 발견된 공식이 예상치 못하게 포함되었습니다.
다음 표는 이번 발표에서 AxiomProver가 달성한 구체적인 성과를 요약하고, 작업의 복잡성과 결과를 대조하여 보여줍니다.
표 1: AxiomProver의 주요 수학적 성과 (2026년 2월)
| 문제/과제 | 분야 | AxiomProver 결과 |
|---|---|---|
| 첸-겐드론 추측(Chen-Gendron Conjecture) | 대수 기하학 및 수론(Number Theory) | 19세기 연결 고리 식별; 완전한 공식 증명 |
| 펠 추측(Fel's Conjecture) | 시지지 (가환대수학) | 독자적인 엔드 투 엔드 증명; 라마누잔 연결성 발견 |
| Putnam 2025 경시 대회 | 학부 수학 | 12/12점 만점 (인간 중앙값: 0-1) |
| 미지정 위상수학 문제 | 위상수학 | 새로운 증명 생성 (동료 검토 대기 중) |
이 성공의 함의는 증명된 특정 정리를 훨씬 넘어섭니다. 광범위한 AI 산업 측면에서 Axiom의 성공은 순수 "생성형" 모델보다 "추론" 모델에 대한 막대한 투자가 타당함을 입증합니다.
북미에서 가장 어려운 학부 수학 경시 대회로 꼽히는 Putnam 2025에서 이 스타트업이 보여준 성과는 이러한 변화의 벤치마크 역할을 합니다. 이전 모델들이 단 몇 점을 얻는 데도 어려움을 겪었던 것과 달리, AxiomProver는 12/12점 만점을 기록한 것으로 보고되었습니다. 이러한 성과는 특정 학습 데이터셋을 넘어 일반화될 수 있는 수준의 문제 해결 다재다능함을 의미합니다.
그러나 학계의 반응은 조심스럽게 낙관적입니다. 증명의 속도와 정확성은 부인할 수 없지만, "설명 가능성"에 대한 의문은 여전히 남아 있습니다. Lean으로 공식 검증된 증명은 정확성이 보장되지만, 그것이 항상 인간이 읽기 쉽거나 전통적인 의미에서 "통찰력"이 있는 것은 아니기 때문입니다.
이 분야의 저명한 인물들도 의견을 냈습니다. 오랫동안 수학 분야에서 AI 통합을 옹호해 온 필즈상 수상자 **테렌스 타오(Terence Tao)**는 이러한 결과가 AI가 예상보다 일찍 중요한 이정표에 도달하고 있음을 나타낸다고 시사했습니다. 반면, **벤 괴르첼(Ben Goertzel)**과 같은 인공 일반 지능(AGI) 연구자들은 이것이 "특화된" 초고도 성취이긴 하지만, 일반적인 창의적 지능으로의 도약은 여전히 2027~2028년의 과제로 남아 있다고 주장했습니다.
Axiom의 돌파구는 과학 분야에서 AI의 역할이 검색 엔진이나 코드 보조 도구에서 주요 연구자로 전환되고 있음을 알리는 신호입니다. 프랑수아 샤르통(François Charton)과 휴 레더(Hugh Leather) 같은 인재를 영입한 이 스타트업은 "자기 개선형 초지능 추론기" 구축을 목표로 하고 있습니다.
기관 및 기업에 있어 AxiomProver가 입증한 기술은 다음과 같은 분야에 잠재적으로 응용될 수 있습니다:
Ken Ono가 언급했듯이, 인간의 직관과 기계의 정밀함 사이의 협업은 이제 시작일 뿐입니다. Ono는 기자들에게 "AI가 아직 리만 가설을 해결한 것은 아닙니다"라며 가장 유명한 미해결 문제 중 하나를 언급했습니다. "하지만 수년 동안 전문가들을 당혹스럽게 했던 질문들에 대한 답을 찾아냈습니다. 그것이 시작입니다."
이러한 발전은 Axiom을 챗봇 중심의 경쟁사와 차별화된 "수학-AI" 분야의 선두 주자로 위치시키며, 21세기에 계산적으로 가능한 것이 무엇인지에 대한 새로운 표준을 정립했습니다.