AI News

Inception Labs Quebra Limites de Velocidade com o Mercury 2: O Primeiro Modelo de Raciocínio Baseado em Difusão (Diffusion-Based Reasoning Model)

Em um momento decisivo para a IA generativa (Generative AI), a Inception Labs lançou oficialmente o Mercury 2, um modelo de linguagem inovador que reinventa fundamentalmente a forma como as máquinas geram texto. Ao abandonar a arquitetura autorregressiva (autoregressive) padrão da indústria em favor do processamento paralelo baseado em difusão, o Mercury 2 atinge uma vazão (throughput) impressionante de mais de 1.000 tokens por segundo em GPUs NVIDIA Blackwell. Este lançamento marca a primeira vez que um modelo capaz de raciocínio quebra a "parede de latência" que há muito restringe as aplicações de IA em tempo real, oferecendo uma solução que é cinco a dez vezes mais rápida que seus concorrentes mais próximos, reduzindo significativamente os modelos de preços atuais.

O Fim do Gargalo Autorregressivo

Durante anos, o cenário dos grandes modelos de linguagem (Large Language Models - LLMs) foi dominado por transformadores (transformers) autorregressivos. Modelos como GPT-4 e Claude geram texto sequencialmente, prevendo um token (aproximadamente uma palavra ou parte de uma palavra) por vez. Embora eficaz, esse processo serial cria um limite de velocidade inevitável: o modelo não pode gerar o final de uma frase antes de terminar o início. À medida que os modelos cresceram e as tarefas de raciocínio tornaram-se mais complexas, essa abordagem "token por token" tornou-se um gargalo para aplicações sensíveis à latência.

Mercury 2 desmantela esse paradigma ao utilizar uma arquitetura de difusão. Em vez de "digitar" uma resposta sequencialmente, o Mercury 2 age mais como um escultor revelando uma estátua de um bloco de mármore. Ele começa com um rascunho ruidoso e bruto de toda a resposta e refina todos os tokens simultaneamente em etapas paralelas. Isso permite que o modelo "veja" o futuro da frase enquanto corrige o início, permitindo coerência global e autocorreção que modelos sequenciais lutam para alcançar sem retrocessos dispendiosos.

De acordo com a Inception Labs, essa mudança arquitetônica permite que o Mercury 2 gere saídas de raciocínio complexas com uma latência de ponta a ponta de apenas 1,7 segundos, uma fração do tempo exigido por modelos tradicionais para tarefas semelhantes.

Desempenho e Economia Inigualáveis

As métricas de desempenho divulgadas pela Inception Labs retratam um modelo que ocupa uma nova categoria de eficiência. Operando em hardware NVIDIA Blackwell, o Mercury 2 atinge uma vazão de aproximadamente 1.009 tokens por segundo (TPS). Para contextualizar, os principais modelos autorregressivos otimizados para velocidade normalmente chegam ao máximo entre 70 e 100 TPS.

Crucialmente, essa velocidade não parece vir à custa da capacidade de raciocínio. No benchmark AIME 2025, que testa raciocínio matemático avançado, o Mercury 2 marcou 91,1, superando significativamente modelos menores focados em velocidade e competindo diretamente com modelos de fronteira muito maiores.

Inception Labs também posicionou o Mercury 2 como um disruptor de custos. O modelo tem o preço de $0,25 por milhão de tokens de entrada e $0,75 por milhão de tokens de saída. Essa estratégia de preços reduz significativamente os principais concorrentes, tornando a IA de alta velocidade e nível de raciocínio acessível para cargas de trabalho empresariais de alto volume.

Análise Comparativa: Mercury 2 vs. O Mercado

Para entender a magnitude desse salto, é essencial comparar o Mercury 2 com a geração atual de modelos "rápidos", como o Claude 4.5 Haiku e o GPT-5 Mini. Os dados sugerem que a Inception Labs alcançou uma melhoria de uma ordem de magnitude na vazão.

Tabela 1: Comparação de Desempenho e Custo

Nome do Modelo Arquitetura Vazão (Tokens/Seg) Custo de Entrada (por 1M) Custo de Saída (por 1M) Benchmark AIME
Mercury 2 Difusão ~1.009 $0,25 $0,75 91,1
Claude 4.5 Haiku Autorregressiva ~89 $1,00 $5,00 39,0
GPT-5 Mini Autorregressiva ~71 N/A N/A 27,0
Gemini 3 Flash Autorregressiva ~100 $0,50 $3,00 N/A

Nota: As pontuações de benchmark e as velocidades baseiam-se em dados divulgados pela Inception Labs e em benchmarks iniciais independentes citados em relatórios técnicos.

Raciocínio em Tempo Real: Uma Nova Fronteira para Agentes

As implicações do Mercury 2 estendem-se além dos benchmarks brutos. A baixa latência do modelo está preparada para revolucionar a implantação de agentes de IA. Em fluxos de trabalho complexos onde uma IA deve planejar, usar ferramentas e iterar, os modelos tradicionais frequentemente introduzem segundos de atraso a cada etapa, resultando em experiências de usuário lentas. As capacidades de processamento sub-segundo do Mercury 2 permitem "ciclos fechados" onde os agentes podem pensar, agir e se corrigir quase instantaneamente.

Isso é particularmente relevante para IA de voz, assistentes de codificação e busca em tempo real, onde os usuários esperam respostas quase instantâneas. Um assistente de codificação alimentado pelo Mercury 2, por exemplo, poderia refatorar um arquivo inteiro de código no tempo que um modelo padrão leva para escrever as primeiras linhas.

Disponibilidade na Indústria

A Inception Labs disponibilizou o Mercury 2 imediatamente através de uma API compatível com OpenAI, permitindo que os desenvolvedores o integrem na infraestrutura existente com o mínimo de atrito. O modelo suporta uma janela de contexto de 128k, chamada de ferramentas (tool calling) e saídas JSON estruturadas, garantindo que atenda às demandas práticas dos ambientes de produção modernos.

As a indústria de IA continua a buscar a "próxima grande coisa" além do Transformer, o Mercury 2 fornece um argumento convincente de que o futuro pode estar na difusão. Ao resolver o gargalo da velocidade de inferência, a Inception Labs não apenas lançou um modelo mais rápido, mas potencialmente redefiniu as expectativas básicas para o que a IA em tempo real pode alcançar.

Em Destaque
ex ads 202603311112
1111111111111
BlazeGard
Blazeguard fornece segurança contra incêndios incomparável através de tecnologia de revestimento resistente ao fogo inovadora.
Test Face Swap
Test Face Swap Test Face Swap Test Face Swap Test Face Swap Test Face Swap Test Face Swap
Midjourney for Slack
Leve imagens geradas por IA diretamente para seu workspace Slack com Midjourney para Slack.
AI Bot Eye
Transforme sua segurança com tecnologia de vigilância impulsionada por IA.
amy
Amy é uma assistente abrangente de escritório que simplifica tarefas, agenda reuniões e gerencia projetos.
sharkfoto-20250108-quick
Remove background from the image with just one click and convert the image to or from 200+ formats.
test 2 face swap 2
test 2 face swap 2test 2 face swap 2test 2 face swap 2test 2 face swap 2test 2 face swap 2test 2 face swap 2test 2 face
Gptzero me
GPTZero é uma ferramenta para detectar texto gerado por AI com precisão e facilidade.
sharkfoto-20250108-free
AI-powered tool for background removal and image conversion in over 200 formats.
BGRemover
Remova facilmente os fundos de imagens online com o SharkFoto BGRemover.
sharkfoto agent test 202510111844
SharkFoto offers AI-powered free photo editing tools including background removal and colorization.
WorkViz
Workviz: Plataforma movida por IA que otimiza o desempenho da equipe através de análises abrangentes.
FreeAiKit
FreeAiKit oferece uma coleção de ferramentas de IA gratuitas para várias necessidades de criação de conteúdo.
TAROT ARCANA
Desvende seu futuro com o Tarot Arcana, um aplicativo de leitura de tarô alimentado por IA.
Skywork
Skywork transforma entradas simples em conteúdo multimodal, como relatórios e slides.
sharkfoto svip 20250715
BrowseGPTs
Diretório atualizado diariamente de diversos modelos ChatGPT.
blockbank
Aplicativo de neo-banco criptográfico tudo-em-um que combina tecnologias DeFi e CeFi.
Sharkfoto Quick 091801
SharkFoto offers free AI-powered image editing tools including background removal and photo colorization.
Neuronwriter
Ferramenta avançada para otimização de conteúdo usando modelos semânticos.
Novel
O Novel ajuda você a criar um perfil profissional abrangente.
AI Fortunist (AI-Powered Tarot Readings)
AI Fortunist fornece leitura de tarô personalizada, leitura de café e interpretações de sonhos usando IA avançada.
ParrotPDF
ParrotPDF permite que os usuários interajam com arquivos PDF de forma interativa.
Flove
Flove é um aplicativo de rastreamento de movimento minimalista com recursos inovadores.
Franklin AI
Ferramenta de IA para simplificar operações comerciais e melhorar a tomada de decisões.
Durable AI
Construtor de sites impulsionado por IA para colocar seu negócio online em 30 segundos.
JungGPT
Uma ferramenta de IA para reflexão emocional e insights psicológicos.
ChartX
Documentação médica potenciada por IA para cuidados eficientes e precisos com pacientes.
eztalks-20250226-0424003
Remova fundos de imagens e converta formatos de imagem sem esforço com o SharkFoto.
Udemy Summary with ChatGPT
Resuma vídeos do Udemy com ChatGPT e faça anotações sem esforço.
Astro Answer New Tab
Descubra a astrologia com horóscopos personalizados gerados por IA.
aiBot копирайтер
Melhore seu texto sem esforço com aiBot копирайтер.
PageSage
PageSage simplifica a navegação na web gerando perguntas e respostas instantaneamente.
GPU Finder
O GPU Finder ajuda a descobrir instâncias de GPU disponíveis de provedores de nuvem pública global.
Skyworker
Plataforma impulsionada por IA para candidatos a empregos em tecnologia e recrutadores.
Craft
Craft é uma ferramenta poderosa de criação e colaboração de documentos para equipes e indivíduos.
GottaMeme. AI Meme Generator
Crie memes hilários sem esforço com o gerador de IA do GottaMeme.
Recap
Resuma facilmente qualquer parte de uma página da web com o Recap, uma extensão de navegador de código aberto que utiliza o ChatGPT.
kimi quick test 20250417-121312223
Kimi é uma ferramenta de IA inovadora projetada para produtividade e suporte.
Magazine Luiza
Assistente de compras eficiente para usuários do Magazine Luiza.
sharkfoto svip test 202512241034
SharkFoto é uma plataforma com IA para criar e editar vídeos, imagens e músicas com facilidade.
Bigjpg AI
Bigjpg melhora a qualidade das imagens através de upscale avançado de IA.
kimi test 20250328-3
Aprimore, transforme e edite imagens com ferramentas alimentadas por IA gratuitamente.
viddo.ai
Veo3 by Viddo AI enables AI-powered text or image to high-quality video creation rapidly.
Simplifly
Resuma artigos longos facilmente com o Simplifly.
BearGPT - Chatgpt Enhancer
Aprimore sua experiência com o ChatGPT com o BearGPT para melhor navegação e personalização.
2026 Face Swap
2026 Face Wwap2026 Face Wwap2026 Face Wwap2026 Face Wwap2026 Face Wwap2026 Face Wwap2026 Face Wwap2026 Face Wwap2026 Fac
TextPal
O TextPal utiliza IA para resumir e gerenciar textos de páginas da web sem esforço.
AlgoDocs
AlgoDocs: Extração de dados de documentos com inteligência artificial facilitada.
Audioread: Ultra-Realistic Text-to-Speech
Ouça artigos com vozes AI ultra-realistas.
GPTXtend
Melhore sua experiência com ChatGPT com poderosas ferramentas de compartilhamento.
Free Email Extractor from Website
Ferramenta gratuita de extração de e-mails para coletar e-mails, números de telefone e perfis sociais de sites.
Skypher
Agilize suas avaliações de segurança com a automação do Skypher.
AI PDF chatbot agent built with LangChain & LangGraph
SharkFoto oferece ferramentas gratuitas de edição de fotos com inteligência artificial para remoção de fundo, colorização, aprimoramento e redimensionamento de imagens.
Wan 2.2-test
Wan 2 AI offers fast, high-quality 1080p AI video generation with advanced motion control.
Tappy AI
Extensão de navegador AI para adicionar comentários reflexivos em posts do LinkedIn.
sharkfoto-svip-092202
SharkFoto offers free AI-powered image editing tools like background removal and coloring.
Letz DM
Automatize o marketing de influenciadores no TikTok sem complicações.
Belly Buddy
Acompanhe a ingestão de alimentos e sintomas digestivos com Belly Buddy.
sharkfoto svip test 202509221443
SharkFoto offers free AI-powered photo editing tools for automatic background removal and image enhancement.
sharkfoto-svip-0922-changename
SharkFoto oferece ferramentas fotográficas gratuitas com IA para remover fundos automaticamente e melhorar imagens.
Alltum
Organiza e-mails, tarefas e arquivos com gerenciamento de projetos impulsionado por IA.

Inception Labs lança Mercury 2: o LLM de raciocínio mais rápido do mundo atinge mais de 1.000 tokens por segundo via arquitetura de difusão

A Inception Labs lançou o Mercury 2, um modelo de linguagem de raciocínio baseado em difusão que gera mais de 1.000 tokens por segundo em GPUs NVIDIA Blackwell — mais de cinco vezes mais rápido do que os principais concorrentes autoregressivos. Ao contrário da decodificação sequencial tradicional, o Mercury 2 usa refinamento paralelo de tokens, permitindo qualidade de nível de raciocínio dentro de orçamentos de latência em tempo real com um custo de $0.25 por milhão de tokens de entrada.