Anthropic의 Claude AI 에이전트가 자율적으로 10만 줄 C 컴파일러를 구축
16개의 Claude Opus 4.6 AI 에이전트가 병렬로 작업하여 2주 만에 작동하는 C 컴파일러를 만들어 자율 코딩 능력의 획기적인 발전을 입증했습니다.
16개의 Claude Opus 4.6 AI 에이전트가 병렬로 작업하여 2주 만에 작동하는 C 컴파일러를 만들어 자율 코딩 능력의 획기적인 발전을 입증했습니다.
MIT CSAIL 연구진이 EnCompass를 소개합니다. 이는 백트래킹과 병렬 탐색을 활용해 AI 에이전트의 신뢰성 및 효율성을 획기적으로 향상시키는 획기적인 프레임워크입니다.
Google의 Gemini 2.5 Pro가 LMArena 순위에서 최고 등급을 기록하며 추론, 수학, 과학 및 코딩 벤치마크에서 OpenAI, Claude, DeepSeek를 능가했습니다.
Axiom의 AI 도구 AxiomProver는 대수기하학과 정수론에서 오랫동안 풀리지 않았던 네 가지 수학 문제를 성공적으로 해결하여 AI 추론에 있어 획기적인 진전을 이뤘다.