AI News

Inception Labs rompe los límites de velocidad con Mercury 2: El primer modelo de razonamiento basado en difusión (diffusion-based reasoning model)

En un momento decisivo para la IA generativa (Generative AI), Inception Labs ha lanzado oficialmente Mercury 2, un modelo de lenguaje innovador que reinventa fundamentalmente cómo las máquinas generan texto. Al abandonar la arquitectura autorregresiva (autoregressive architecture) estándar de la industria en favor del procesamiento paralelo basado en difusión (diffusion-based parallel processing), Mercury 2 alcanza un rendimiento (throughput) asombroso de más de 1,000 tokens por segundo en las GPUs NVIDIA Blackwell. Este lanzamiento marca la primera vez que un modelo capaz de razonar rompe el "muro de latencia" (latency wall) que durante mucho tiempo ha limitado las aplicaciones de IA en tiempo real, ofreciendo una solución que es de cinco a diez veces más rápida que sus competidores más cercanos, al tiempo que reduce significativamente los modelos de precios actuales.

El fin del cuello de botella autorregresivo

Durante años, el panorama de los grandes modelos de lenguaje (LLM, Large Language Model) ha estado dominado por los transformadores (transformers) autorregresivos. Modelos como GPT-4 y Claude generan texto de forma secuencial, prediciendo un token (aproximadamente una palabra o parte de una palabra) a la vez. Aunque es eficaz, este proceso en serie crea un límite de velocidad inevitable: el modelo no puede generar el final de una oración antes de haber terminado el principio. A medida que los modelos han crecido y las tareas de razonamiento se han vuelto más complejas, este enfoque "token por token" se ha convertido en un cuello de botella para las aplicaciones sensibles a la latencia.

Mercury 2 desmantela este paradigma utilizando una arquitectura de difusión (diffusion architecture). En lugar de "escribir" una respuesta de forma secuencial, Mercury 2 actúa más como un escultor que revela una estatua a partir de un bloque de mármol. Comienza con un borrador ruidoso y aproximado de toda la respuesta y refina todos los tokens simultáneamente en pasos paralelos. Esto permite que el modelo "vea" el futuro de la oración mientras corrige el principio, habilitando una coherencia global y una autocorrección que los modelos secuenciales tienen dificultades para lograr sin un costoso retroceso.

Según Inception Labs, este cambio arquitectónico permite a Mercury 2 generar resultados de razonamiento complejos con una latencia de extremo a extremo de solo 1.7 segundos, una fracción del tiempo requerido por los modelos tradicionales para tareas similares.

Rendimiento y economía inigualables

Las métricas de rendimiento publicadas por Inception Labs describen un modelo que ocupa una nueva categoría de eficiencia. Al ejecutarse en hardware NVIDIA Blackwell, Mercury 2 alcanza un rendimiento de aproximadamente 1,009 tokens por segundo (TPS). Para contextualizar, los modelos autorregresivos líderes optimizados para la velocidad suelen alcanzar un máximo de entre 70 y 100 TPS.

Crucialmente, esta velocidad no parece ir en detrimento de la capacidad de razonamiento. En el benchmark AIME 2025, que pone a prueba el razonamiento matemático avanzado, Mercury 2 obtuvo una puntuación de 91.1, superando significativamente a los modelos más pequeños enfocados en la velocidad y compitiendo directamente con modelos de frontera mucho más grandes.

Inception Labs también ha posicionado a Mercury 2 como un disruptor de costes. El modelo tiene un precio de $0.25 por millón de tokens de entrada y $0.75 por millón de tokens de salida. Esta estrategia de precios reduce significativamente los costes frente a los principales competidores, haciendo que la IA de alta velocidad y nivel de razonamiento sea accesible para cargas de trabajo empresariales de gran volumen.

Análisis comparativo: Mercury 2 frente al sector

Para comprender la magnitud de este salto, es esencial comparar a Mercury 2 con la generación actual de modelos "rápidos", como Claude 4.5 Haiku y GPT-5 Mini. Los datos sugieren que Inception Labs ha logrado una mejora de un orden de magnitud en el rendimiento.

Tabla 1: Comparación de rendimiento y coste

Nombre del modelo Arquitectura Rendimiento (Tokens/Seg) Coste de entrada (por 1M) Coste de salida (por 1M) Benchmark AIME
Mercury 2 Difusión ~1,009 $0.25 $0.75 91.1
Claude 4.5 Haiku Autorregresiva ~89 $1.00 $5.00 39.0
GPT-5 Mini Autorregresiva ~71 N/A N/A 27.0
Gemini 3 Flash Autorregresiva ~100 $0.50 $3.00 N/A

Nota: Las puntuaciones y velocidades de los benchmarks se basan en datos publicados por Inception Labs y benchmarks iniciales independientes citados en informes técnicos.

Razonamiento en tiempo real: Una nueva frontera para los agentes

Las implicaciones de Mercury 2 se extienden más allá de los benchmarks brutos. La baja latencia del modelo está preparada para revolucionar el despliegue de agentes de IA. En flujos de trabajo complejos donde una IA debe planificar, usar herramientas e iterar, los modelos tradicionales suelen introducir segundos de retraso en cada paso, lo que resulta en experiencias de usuario lentas. Las capacidades de procesamiento de menos de un segundo de Mercury 2 permiten "bucles cerrados" (tight loops) donde los agentes pueden pensar, actuar y corregirse casi instantáneamente.

Esto es particularmente relevante para la IA de voz, los asistentes de programación y la búsqueda en tiempo real, donde los usuarios esperan respuestas casi instantáneas. Un asistente de programación impulsado por Mercury 2, por ejemplo, podría refactorizar un archivo completo de código en el tiempo que le toma a un modelo estándar escribir las primeras líneas.

Disponibilidad en la industria

Inception Labs ha puesto a Mercury 2 a disposición de inmediato a través de una API compatible con OpenAI, lo que permite a los desarrolladores integrarlo en la infraestructura existente con una fricción mínima. El modelo admite una ventana de contexto de 128k, llamada a herramientas (tool calling) y salidas JSON estructuradas, lo que garantiza que cumple con las demandas prácticas de los entornos de producción modernos.

A medida que la industria de la IA continúa buscando la "próxima gran novedad" más allá del Transformer, Mercury 2 ofrece un argumento convincente de que el futuro puede residir en la difusión. Al resolver el cuello de botella de la velocidad de inferencia, Inception Labs no solo ha lanzado un modelo más rápido, sino que potencialmente ha restablecido las expectativas básicas de lo que la IA en tiempo real puede lograr.

Destacados
ex ads 202603311112
1111111111111
BlazeGard
Blazeguard brinda una seguridad contra incendios inigualable a través de tecnología innovadora de revestimiento resistente al fuego.
Test Face Swap
Test Face Swap Test Face Swap Test Face Swap Test Face Swap Test Face Swap Test Face Swap
Midjourney for Slack
Lleve imágenes generadas por IA directamente a su espacio de trabajo de Slack con Midjourney para Slack.
AI Bot Eye
Transforma tu seguridad con tecnología de vigilancia impulsada por IA.
amy
Amy es un asistente integral en el lugar de trabajo que simplifica tareas, programa reuniones y gestiona proyectos.
sharkfoto-20250108-quick
Remove background from the image with just one click and convert the image to or from 200+ formats.
test 2 face swap 2
test 2 face swap 2test 2 face swap 2test 2 face swap 2test 2 face swap 2test 2 face swap 2test 2 face swap 2test 2 face
Gptzero me
GPTZero es una herramienta para detectar texto generado por IA de manera precisa y fácil.
sharkfoto-20250108-free
AI-powered tool for background removal and image conversion in over 200 formats.
BGRemover
Elimina fácilmente los fondos de imágenes en línea con SharkFoto BGRemover.
sharkfoto agent test 202510111844
SharkFoto offers AI-powered free photo editing tools including background removal and colorization.
WorkViz
Workviz: Una plataforma impulsada por IA que optimiza el rendimiento del equipo a través de análisis completos.
FreeAiKit
FreeAiKit ofrece una colección de herramientas de IA gratuitas para diversas necesidades de creación de contenido.
TAROT ARCANA
Descubre tu futuro con Tarot Arcana, una aplicación de lectura de tarot impulsada por IA.
Skywork
Skywork transforma entradas simples en contenido multimodal como informes y diapositivas.
sharkfoto svip 20250715
BrowseGPTs
Directorio actualizado diariamente para diversos modelos de ChatGPT.
blockbank
Aplicación de nuevo banco criptográfico todo-en-uno que combina tecnologías DeFi y CeFi.
Sharkfoto Quick 091801
SharkFoto offers free AI-powered image editing tools including background removal and photo colorization.
Neuronwriter
Herramienta avanzada para la optimización de contenido utilizando modelos semánticos.
Novel
Novel te ayuda a crear un perfil profesional integral.
AI Fortunist (AI-Powered Tarot Readings)
AI Fortunist proporciona lecturas de tarot personalizadas, lecturas de café e interpretaciones de sueños utilizando IA avanzada.
ParrotPDF
ParrotPDF permite a los usuarios interactuar de manera interactiva con archivos PDF.
Flove
Flove es una aplicación de seguimiento de movimientos minimalista con características innovadoras.
Franklin AI
Herramienta de IA para simplificar las operaciones comerciales y mejorar la toma de decisiones.
Durable AI
Constructor de sitios web impulsado por IA para poner su negocio en línea en 30 segundos.
JungGPT
Una herramienta de IA para la reflexión emocional y la comprensión psicológica.
ChartX
Documentación médica impulsada por IA para un cuidado de pacientes eficiente y preciso.
eztalks-20250226-0424003
Elimina fondos de imágenes y convierte formatos de imagen sin esfuerzo con SharkFoto.
Udemy Summary with ChatGPT
Resume los videos de Udemy con ChatGPT y toma notas sin esfuerzo.
Astro Answer New Tab
Descubre la astrología con horóscopos personalizados generados por IA.
aiBot копирайтер
Mejora tu texto sin esfuerzo con aiBot копирайтер.
PageSage
PageSage simplifica la navegación web generando preguntas y respuestas al instante.
GPU Finder
GPU Finder ayuda a descubrir instancias de GPU disponibles de proveedores de nube pública global.
Skyworker
Plataforma impulsada por IA para buscadores de empleo en tecnología y reclutadores.
Craft
Craft es una poderosa herramienta de creación de documentos y colaboración para equipos e individuos.
GottaMeme. AI Meme Generator
Crea memes hilarantes sin esfuerzo con el generador impulsado por IA de GottaMeme.
Recap
Resume fácilmente cualquier parte de una página web con Recap, una extensión de navegador de código abierto que utiliza ChatGPT.
kimi quick test 20250417-121312223
Kimi es una herramienta de IA innovadora diseñada para aumentar la productividad y el apoyo.
Magazine Luiza
Asistente de compras eficiente para usuarios de Magazine Luiza.
sharkfoto svip test 202512241034
SharkFoto es una plataforma impulsada por IA para crear y editar videos, imágenes y música sin esfuerzo.
Bigjpg AI
Bigjpg mejora la calidad de las imágenes mediante escalado avanzado por IA.
kimi test 20250328-3
Mejora, transforma y edita imágenes con herramientas impulsadas por IA de forma gratuita.
viddo.ai
Veo3 by Viddo AI enables AI-powered text or image to high-quality video creation rapidly.
Simplifly
Resume artículos largos fácilmente con Simplifly.
BearGPT - Chatgpt Enhancer
Mejore su experiencia con ChatGPT con BearGPT para una mejor navegación y personalización.
2026 Face Swap
2026 Face Wwap2026 Face Wwap2026 Face Wwap2026 Face Wwap2026 Face Wwap2026 Face Wwap2026 Face Wwap2026 Face Wwap2026 Fac
TextPal
TextPal utiliza IA para resumir y gestionar textos de páginas web sin esfuerzo.
AlgoDocs
AlgoDocs: extracción de datos de documentos impulsada por IA hecha fácil.
Audioread: Ultra-Realistic Text-to-Speech
Escucha artículos con voces AI ultra-realistas.
GPTXtend
Mejore su experiencia con ChatGPT con potentes herramientas de compartición.
Free Email Extractor from Website
Herramienta gratuita de extracción de correos electrónicos para raspar correos electrónicos, números de teléfono y perfiles sociales de sitios web.
Skypher
Agiliza tus revisiones de seguridad con la automatización de Skypher.
AI PDF chatbot agent built with LangChain & LangGraph
SharkFoto ofrece herramientas gratuitas de edición de fotos con inteligencia artificial para eliminar fondos, colorear, mejorar y cambiar el tamaño de imágenes.
Wan 2.2-test
Wan 2 AI offers fast, high-quality 1080p AI video generation with advanced motion control.
Tappy AI
Extensión de navegador AI para añadir comentarios reflexivos a publicaciones de LinkedIn.
sharkfoto-svip-092202
SharkFoto offers free AI-powered image editing tools like background removal and coloring.
Letz DM
Automatiza el marketing de influencers en TikTok sin complicaciones.
Belly Buddy
Realiza un seguimiento de la ingesta de alimentos y los síntomas digestivos con Belly Buddy.
sharkfoto svip test 202509221443
SharkFoto offers free AI-powered photo editing tools for automatic background removal and image enhancement.
sharkfoto-svip-0922-changename
SharkFoto ofrece herramientas fotográficas gratuitas con tecnología de IA para eliminar fondos automáticamente y mejorar imágenes.
Alltum
Organiza correos electrónicos, tareas y archivos con gestión de proyectos impulsada por IA.

Inception Labs lanza Mercury 2: el LLM de razonamiento más rápido del mundo alcanza más de 1.000 tokens por segundo mediante arquitectura de difusión

Inception Labs ha lanzado Mercury 2, un modelo de lenguaje de razonamiento basado en difusión que genera más de 1.000 tokens por segundo en GPUs NVIDIA Blackwell — más de cinco veces más rápido que los principales competidores autorregresivos. A diferencia de la decodificación secuencial tradicional, Mercury 2 utiliza refinamiento paralelo de tokens, permitiendo calidad de nivel de razonamiento dentro de presupuestos de latencia en tiempo real a un coste de $0.25 por millón de tokens de entrada.