AI News

Inception Labs побила рекорды скорости с Mercury 2: первой моделью рассуждения на основе диффузии (Diffusion-Based Reasoning Model)

В переломный момент для генеративного ИИ (Generative AI) компания Inception Labs официально представила Mercury 2 — революционную языковую модель, которая в корне меняет представление о том, как машины генерируют текст. Отказавшись от стандартной для индустрии авторегрессионной архитектуры (Autoregressive architecture) в пользу параллельной обработки на основе диффузии (Diffusion-based parallel processing), Mercury 2 достигает ошеломляющей пропускной способности — более 1 000 токенов в секунду на графических процессорах (GPU) NVIDIA Blackwell. Этот релиз знаменует собой первый случай, когда модель, способная к рассуждению, преодолела «барьер задержки» (Latency wall), который долгое время сдерживал применение ИИ в реальном времени. Решение работает в пять-десять раз быстрее ближайших конкурентов, при этом значительно снижая текущие ценовые стандарты.

Конец авторегрессионного узкого места

В течение многих лет в сфере больших языковых моделей (Large Language Model, LLM) доминировали авторегрессионные трансформеры. Модели вроде GPT-4 и Claude генерируют текст последовательно, предсказывая по одному токену (примерно одно слово или часть слова) за раз. Несмотря на эффективность, этот серийный процесс создает неизбежное ограничение скорости: модель не может сгенерировать конец предложения, пока не закончит начало. По мере роста моделей и усложнения задач на рассуждение этот подход «токен за токеном» стал узким местом для приложений, чувствительных к задержкам.

Mercury 2 разрушает эту парадигму, используя диффузионную архитектуру. Вместо последовательного «печатания» ответа, Mercury 2 действует скорее как скульптор, извлекающий статую из глыбы мрамора. Она начинает с зашумленного, грубого черновика всего ответа и уточняет все токены одновременно в ходе параллельных шагов. Это позволяет модели «видеть» будущее предложения, исправляя его начало, что обеспечивает глобальную связность и самокоррекцию, которых последовательным моделям трудно достичь без дорогостоящего возврата назад.

По заявлению Inception Labs, этот архитектурный сдвиг позволяет Mercury 2 генерировать сложные результаты рассуждений со сквозной задержкой всего в 1,7 секунды — лишь малая часть времени, требуемого традиционным моделям для аналогичных задач.

Непревзойденная производительность и экономика

Показатели производительности, опубликованные Inception Labs, описывают модель, занимающую новую категорию эффективности. Работая на оборудовании NVIDIA Blackwell, Mercury 2 достигает пропускной способности примерно в 1 009 токенов в секунду (TPS). Для сравнения: ведущие авторегрессионные модели, оптимизированные по скорости, обычно достигают пика между 70 и 100 TPS.

Важно отметить, что эта скорость не идет в ущерб способности к рассуждению. В бенчмарке AIME 2025, проверяющем продвинутое математическое мышление, Mercury 2 набрала 91,1 балла, значительно превзойдя небольшие модели, ориентированные на скорость, и напрямую конкурируя с гораздо более крупными передовыми моделями.

Inception Labs также позиционирует Mercury 2 как ценового дизраптора. Стоимость модели составляет $0,25 за миллион входных токенов и $0,75 за миллион выходных токенов. Эта ценовая стратегия существенно подрывает позиции основных конкурентов, делая высокоскоростной ИИ уровня рассуждения доступным для масштабных корпоративных рабочих нагрузок.

Сравнительный анализ: Mercury 2 против остальных

Чтобы понять масштаб этого скачка, необходимо сравнить Mercury 2 с нынешним поколением «быстрых» моделей, таких как Claude 4.5 Haiku и GPT-5 Mini. Данные свидетельствуют о том, что Inception Labs добилась улучшения пропускной способности на порядок.

Таблица 1: Сравнение производительности и стоимости

Название модели Архитектура Пропускная способность (ток/сек) Входная стоимость (за 1 млн) Выходная стоимость (за 1 млн) Бенчмарк AIME
Mercury 2 Диффузионная ~1,009 $0.25 $0.75 91.1
Claude 4.5 Haiku Авторегрессионная ~89 $1.00 $5.00 39.0
GPT-5 Mini Авторегрессионная ~71 N/A N/A 27.0
Gemini 3 Flash Авторегрессионная ~100 $0.50 $3.00 N/A

Примечание: Баллы бенчмарков и показатели скорости основаны на данных, опубликованных Inception Labs, и независимых ранних тестах, цитируемых в технических отчетах.

Рассуждение в реальном времени: новые горизонты для агентов

Значение Mercury 2 выходит за рамки сухих цифр бенчмарков. Низкая задержка модели призвана революционизировать развертывание ИИ-агентов. В сложных рабочих процессах, где ИИ должен планировать, использовать инструменты и итерировать, традиционные модели часто вносят секундные задержки на каждом шагу, что приводит к медлительности интерфейса. Возможности Mercury 2 по обработке данных менее чем за секунду позволяют создавать «плотные циклы», в которых агенты могут думать, действовать и исправлять себя почти мгновенно.

Это особенно актуально для голосового ИИ, ассистентов по написанию кода и поиска в реальном времени, где пользователи ожидают почти мгновенной реакции. Например, ассистент кодинга на базе Mercury 2 мог бы провести рефакторинг целого файла кода за то время, которое требуется стандартной модели для написания первых нескольких строк.

Доступность в индустрии

Inception Labs сделала Mercury 2 доступной немедленно через API, совместимый с OpenAI, что позволяет разработчикам интегрировать её в существующую инфраструктуру с минимальными усилиями. Модель поддерживает окно контекста (Context window) 128k, вызов инструментов (Tool calling) и структурированные выходные данные JSON, гарантируя соответствие практическим требованиям современных производственных сред.

Пока индустрия ИИ продолжает искать «следующую большую вещь» за пределами Трансформеров, Mercury 2 дает веский аргумент в пользу того, что будущее может лежать в плоскости диффузии. Решив проблему узкого места скорости вывода, Inception Labs не просто выпустила более быструю модель, но и потенциально обнулила базовые ожидания от того, чего может достичь ИИ в реальном времени.

Рекомендуемые
ex ads 202603311112
1111111111111
BlazeGard
Blazeguard provides unparalleled fire safety through innovative fire-rated sheathing technology.
Test Face Swap
Test Face Swap Test Face Swap Test Face Swap Test Face Swap Test Face Swap Test Face Swap
Midjourney for Slack
Bring AI-generated images directly to your Slack workspace with Midjourney for Slack.
AI Bot Eye
Transform your security with AI-driven surveillance technology.
amy
Amy is a comprehensive workplace assistant that streamlines tasks, schedules meetings, and manages projects.
sharkfoto-20250108-quick
Remove background from the image with just one click and convert the image to or from 200+ formats.
test 2 face swap 2
test 2 face swap 2test 2 face swap 2test 2 face swap 2test 2 face swap 2test 2 face swap 2test 2 face swap 2test 2 face
Gptzero me
GPTZero is a tool to detect AI-generated text accurately and easily.
sharkfoto-20250108-free
AI-powered tool for background removal and image conversion in over 200 formats.
BGRemover
Easily remove image backgrounds online with SharkFoto BGRemover.
sharkfoto agent test 202510111844
SharkFoto offers AI-powered free photo editing tools including background removal and colorization.
WorkViz
Workviz: AI-powered platform optimizing team performance through comprehensive analytics.
FreeAiKit
FreeAiKit offers a collection of free AI tools for various content creation needs.
TAROT ARCANA
Unveil your future with Tarot Arcana, an AI-powered tarot reading app.
Skywork
Skywork преобразует простой ввод в мультимодальный контент, такой как отчеты и слайды.
sharkfoto svip 20250715
BrowseGPTs
Daily updated directory for diverse ChatGPT models.
blockbank
All-in-one crypto neo banking app combining DeFi and CeFi technologies.
Sharkfoto Quick 091801
SharkFoto offers free AI-powered image editing tools including background removal and photo colorization.
Neuronwriter
Advanced tool for content optimization using semantic models.
Novel
Novel helps you craft a comprehensive professional profile.
AI Fortunist (AI-Powered Tarot Readings)
AI Fortunist provides personalized tarot readings, coffee readings, and dream interpretations using advanced AI.
ParrotPDF
ParrotPDF lets users engage with PDF files interactively.
Flove
Flove is a minimalist movement tracking app with innovative features.
Franklin AI
AI tool to streamline business operations and enhance decision-making.
Durable AI
AI-powered website builder to get your business online in 30 seconds.
JungGPT
An AI tool for emotional reflection and psychological insights.
ChartX
AI-powered medical documentation for efficient and accurate patient care.
eztalks-20250226-0424003
Удаляйте фоны с изображений и беспрепятственно преобразуйте форматы изображений с помощью SharkFoto.
Udemy Summary with ChatGPT
Summarize Udemy videos with ChatGPT and take notes effortlessly.
Astro Answer New Tab
Discover astrology with personalized AI-generated horoscopes.
aiBot копирайтер
Effortlessly enhance your text with aiBot копирайтер.
PageSage
PageSage simplifies web browsing by generating questions and answers instantly.
GPU Finder
GPU Finder helps discover available GPU instances from global public cloud providers.
Skyworker
AI-powered platform for tech job seekers and recruiters.
Craft
Craft is a powerful document creation and collaboration tool for teams and individuals.
GottaMeme. AI Meme Generator
Create hilarious memes effortlessly with GottaMeme's AI-powered generator.
Recap
Easily summarize any webpage portion with Recap, an open-source browser extension utilizing ChatGPT.
kimi quick test 20250417-121312223
Инновационная платформа для повышения личной продуктивности.
Magazine Luiza
Efficient shopping assistant for Magazine Luiza users.
sharkfoto svip test 202512241034
SharkFoto — платформа с поддержкой ИИ для лёгкого создания и редактирования видео, изображений и музыки.
Bigjpg AI
Bigjpg enhances image quality through advanced AI upscaling.
kimi test 20250328-3
Инновационная платформа, позволяющая безупречное сотрудничество и продуктивность.
viddo.ai
Veo3 by Viddo AI enables AI-powered text or image to high-quality video creation rapidly.
Simplifly
Summarize lengthy articles easily with Simplifly.
BearGPT - Chatgpt Enhancer
Enhance your ChatGPT experience with BearGPT for better navigation and customization.
2026 Face Swap
2026 Face Wwap2026 Face Wwap2026 Face Wwap2026 Face Wwap2026 Face Wwap2026 Face Wwap2026 Face Wwap2026 Face Wwap2026 Fac
TextPal
TextPal utilizes AI to summarize and manage webpage text effortlessly.
AlgoDocs
AlgoDocs: AI-powered document data extraction made easy.
Audioread: Ultra-Realistic Text-to-Speech
Listen to articles with ultra-realistic AI voices.
GPTXtend
Enhance your ChatGPT experience with powerful sharing tools.
Free Email Extractor from Website
Free email extraction tool for scraping emails, phone numbers, and social profiles from websites.
Skypher
Streamline your security reviews with Skypher's automation.
AI PDF chatbot agent built with LangChain & LangGraph
SharkFoto предлагает бесплатные инструменты для редактирования фотографий на базе ИИ для удаления фона, колоризации, улучшения и изменения размера изображений.
Wan 2.2-test
Wan 2 AI offers fast, high-quality 1080p AI video generation with advanced motion control.
Tappy AI
AI browser extension for adding thoughtful comments to LinkedIn posts.
sharkfoto-svip-092202
SharkFoto offers free AI-powered image editing tools like background removal and coloring.
Letz DM
Automate TikTok influencer marketing without the hassle.
Belly Buddy
Track food intake and digestive symptoms with Belly Buddy.
sharkfoto svip test 202509221443
SharkFoto offers free AI-powered photo editing tools for automatic background removal and image enhancement.
sharkfoto-svip-0922-changename
SharkFoto предоставляет бесплатные инструменты для фото на базе ИИ, автоматически удаляющие фон и улучшающие изображения.
Alltum
Organizes emails, tasks, and files with AI-driven project management.

Inception Labs выпускает Mercury 2: самое быстрое в мире LLM для рассуждений достигает более 1000 токенов в секунду благодаря диффузионной архитектуре

Inception Labs выпустила Mercury 2, диффузионную модель языка для рассуждений, которая генерирует более 1000 токенов в секунду на GPU NVIDIA Blackwell — более чем в пять раз быстрее ведущих авторегрессионных конкурентов. В отличие от традиционного последовательного декодирования, Mercury 2 использует параллельную доработку токенов, обеспечивая качество уровня рассуждений в рамках бюджетов латентности в реальном времени по стоимости $0.25 за миллион входных токенов.