Anthropic の Claude AI エージェントが自律的に 10 万行の C コンパイラを構築
16 の Claude Opus 4.6 AI エージェントが並列に作業して、2 週間で動作する C コンパイラを作成し、自律的なコーディング能力の画期的な進展を示しました。
16 の Claude Opus 4.6 AI エージェントが並列に作業して、2 週間で動作する C コンパイラを作成し、自律的なコーディング能力の画期的な進展を示しました。
MIT CSAILの研究者たちはEnCompassを発表しました。これはバックトラッキングと並列探索を用いて、AIエージェントの信頼性と効率を飛躍的に向上させる画期的なフレームワークです。
GoogleのGemini 2.5 ProはLMArenaのランキングでトップに立ち、推論、数学、科学、コーディングのベンチマークでOpenAI、Claude、DeepSeekを上回りました。
AxiomのAIツールAxiomProverは、代数幾何学と数論における長年の数学的問題4件を見事に解決し、AIによる推論の突破口となった。