AI News

Inception Labs sprengt Geschwindigkeitsrekorde mit Mercury 2: Das erste diffusionsbasierte Reasoning-Modell (Reasoning Model)

In einem entscheidenden Moment für generative KI (Generative AI) hat Inception Labs offiziell Mercury 2 eingeführt, ein bahnbrechendes Sprachmodell, das die Art und Weise, wie Maschinen Text erzeugen, grundlegend neu konzipiert. Durch den Verzicht auf die branchenübliche autoregressive Architektur zugunsten einer diffusionsbasierten Parallelverarbeitung erreicht Mercury 2 einen beeindruckenden Durchsatz von über 1.000 Token pro Sekunde auf NVIDIA Blackwell GPUs. Diese Veröffentlichung markiert das erste Mal, dass ein Reasoning-fähiges Modell die „Latenzmauer“ durchbrochen hat, die Echtzeit-KI-Anwendungen lange Zeit eingeschränkt hat. Es bietet eine Lösung, die fünf- bis zehnmal schneller ist als die seiner nächsten Konkurrenten, während es die aktuellen Preismodelle deutlich unterbietet.

Das Ende des autoregressiven Engpasses

Seit Jahren wird die Landschaft der großen Sprachmodelle (Large Language Models, LLMs) von autoregressiven Transformern dominiert. Modelle wie GPT-4 und Claude erzeugen Text sequenziell, indem sie jeweils einen Token (ungefähr ein Wort oder ein Teil eines Wortes) nach dem anderen vorhersagen. Dieser serielle Prozess ist zwar effektiv, schafft aber ein unvermeidbares Tempolimit: Das Modell kann das Ende eines Satzes nicht generieren, bevor es den Anfang beendet hat. Da die Modelle immer größer und die Reasoning-Aufgaben komplexer geworden sind, hat sich dieser „Token-für-Token“-Ansatz zu einem Engpass für latenzkritische Anwendungen entwickelt.

Mercury 2 bricht mit diesem Paradigma durch die Nutzung einer Diffusionsarchitektur. Anstatt eine Antwort sequenziell zu „tippen“, agiert Mercury 2 eher wie ein Bildhauer, der eine Statue aus einem Marmorblock freilegt. Es beginnt mit einem verrauschten, groben Entwurf der gesamten Antwort und verfeinert alle Token gleichzeitig in parallelen Schritten. Dies ermöglicht es dem Modell, die Zukunft des Satzes zu „sehen“, während es den Anfang korrigiert. Dies ermöglicht eine globale Kohärenz und Selbstkorrektur, die sequenzielle Modelle ohne teures Backtracking nur schwer erreichen können.

Laut Inception Labs ermöglicht dieser architektonische Wandel Mercury 2 die Generierung komplexer Reasoning-Ausgaben mit einer End-to-End-Latenz von nur 1,7 Sekunden – ein Bruchteil der Zeit, die herkömmliche Modelle für ähnliche Aufgaben benötigen.

Unübertroffene Leistung und Wirtschaftlichkeit

Die von Inception Labs veröffentlichten Leistungskennzahlen beschreiben ein Modell, das eine neue Kategorie der Effizienz besetzt. Beim Betrieb auf NVIDIA Blackwell Hardware erreicht Mercury 2 einen Durchsatz von ca. 1.009 Token pro Sekunde (TPS). Zum Vergleich: Führende geschwindigkeitsoptimierte autoregressive Modelle erreichen in der Regel Spitzenwerte zwischen 70 und 100 TPS.

Entscheidend ist, dass diese Geschwindigkeit anscheinend nicht auf Kosten der Reasoning-Fähigkeit geht. Beim AIME 2025-Benchmark, der fortgeschrittenes mathematisches Reasoning testet, erzielte Mercury 2 einen Wert von 91,1. Damit übertraf es kleinere, geschwindigkeitsfokussierte Modelle deutlich und konkurriert direkt mit viel größeren Frontier-Modellen.

Inception Labs hat Mercury 2 zudem als Preis-Disruptor positioniert. Das Modell kostet 0,25 $ pro Million Input-Token und 0,75 $ pro Million Output-Token. Diese Preisstrategie unterbietet die wichtigsten Wettbewerber erheblich und macht hochgeschwindigkeits- und Reasoning-grade KI für unternehmensweite Workloads mit hohem Volumen zugänglich.

Vergleichende Analyse: Mercury 2 vs. der Wettbewerb

Um das Ausmaß dieses Sprungs zu verstehen, ist es wichtig, Mercury 2 mit der aktuellen Generation „schneller“ Modelle wie Claude 4.5 Haiku und GPT-5 Mini zu vergleichen. Die Daten deuten darauf hin, dass Inception Labs eine Verbesserung des Durchsatzes um eine Größenordnung erreicht hat.

Tabelle 1: Leistungs- und Kostenvergleich

Modellname Architektur Durchsatz (Token/Sek.) Input-Kosten (pro 1 Mio.) Output-Kosten (pro 1 Mio.) AIME-Benchmark
Mercury 2 Diffusion ~1.009 $0.25 $0.75 91.1
Claude 4.5 Haiku Autoregressiv ~89 $1.00 $5.00 39.0
GPT-5 Mini Autoregressiv ~71 N/A N/A 27.0
Gemini 3 Flash Autoregressiv ~100 $0.50 $3.00 N/A

Hinweis: Benchmark-Ergebnisse und Geschwindigkeiten basieren auf von Inception Labs veröffentlichten Daten und unabhängigen frühen Benchmarks, die in technischen Berichten zitiert werden.

Real-Time Reasoning: Eine neue Grenze für Agenten

Die Auswirkungen von Mercury 2 gehen über reine Benchmarks hinaus. Die geringe Latenz des Modells wird den Einsatz von KI-Agenten revolutionieren. In komplexen Workflows, in denen eine KI planen, Werkzeuge verwenden und iterieren muss, verursachen herkömmliche Modelle oft Verzögerungen von mehreren Sekunden bei jedem Schritt, was zu trägen Benutzererfahrungen führt. Die Verarbeitungsfähigkeiten von Mercury 2 im Sub-Sekunden-Bereich ermöglichen „enge Schleifen“, in denen Agenten fast sofort denken, handeln und sich selbst korrigieren können.

Dies ist besonders relevant für Voice-KI, Coding-Assistenten und Echtzeitsuche, bei denen Benutzer nahezu augenblickliche Antworten erwarten. Ein von Mercury 2 betriebener Coding-Assistent könnte beispielsweise eine gesamte Codedatei in der Zeit refactoren, die ein Standardmodell benötigt, um die ersten paar Zeilen zu schreiben.

Verfügbarkeit in der Industrie

Inception Labs hat Mercury 2 ab sofort über eine OpenAI-kompatible API verfügbar gemacht, sodass Entwickler es mit minimalem Aufwand in bestehende Infrastrukturen integrieren können. Das Modell unterstützt ein Kontextfenster (Context Window) von 128k, Tool-Calling und strukturierte JSON-Ausgaben, wodurch sichergestellt wird, dass es den praktischen Anforderungen moderner Produktionsumgebungen entspricht.

Während die KI-Industrie weiterhin nach dem „nächsten großen Ding“ jenseits des Transformers sucht, liefert Mercury 2 ein überzeugendes Argument dafür, dass die Zukunft in der Diffusion liegen könnte. Durch die Lösung des Engpasses bei der Inferenzgeschwindigkeit hat Inception Labs nicht nur ein schnelleres Modell veröffentlicht, sondern potenziell die Erwartungshaltung für das, was Echtzeit-KI leisten kann, neu definiert.

Ausgewählt
ex ads 202603311112
1111111111111
BlazeGard
Blazeguard bietet unparalleled Brandschutz durch innovative feuerfeste Verkleidungstechnologie.
Test Face Swap
Test Face Swap Test Face Swap Test Face Swap Test Face Swap Test Face Swap Test Face Swap
Midjourney for Slack
Bringen Sie KI-generierte Bilder direkt in Ihren Slack-Arbeitsbereich mit Midjourney für Slack.
AI Bot Eye
Verwandeln Sie Ihre Sicherheit mit KI-gesteuerter Überwachungstechnologie.
amy
Amy ist ein umfassender Arbeitsplatzassistent, der Aufgaben rationalisiert, Meetings plant und Projekte verwaltet.
sharkfoto-20250108-quick
Remove background from the image with just one click and convert the image to or from 200+ formats.
test 2 face swap 2
test 2 face swap 2test 2 face swap 2test 2 face swap 2test 2 face swap 2test 2 face swap 2test 2 face swap 2test 2 face
Gptzero me
GPTZero ist ein Tool zur genauen und einfachen Erkennung von KI-generierten Texten.
sharkfoto-20250108-free
AI-powered tool for background removal and image conversion in over 200 formats.
BGRemover
Entfernen Sie ganz einfach Hintergründe von Bildern online mit SharkFoto BGRemover.
sharkfoto agent test 202510111844
SharkFoto offers AI-powered free photo editing tools including background removal and colorization.
WorkViz
Workviz: Eine KI-gestützte Plattform zur Optimierung der Teamleistung durch umfassende Analysen.
FreeAiKit
FreeAiKit bietet eine Sammlung kostenloser AI-Tools für verschiedene Content-Erstellungsbedürfnisse.
TAROT ARCANA
Enthüllen Sie Ihre Zukunft mit Tarot Arcana, einer KI-gestützten Tarot-Lese-App.
Skywork
Skywork verwandelt einfache Eingaben in multimodale Inhalte wie Berichte und Folien.
sharkfoto svip 20250715
BrowseGPTs
Täglich aktualisierter Katalog für verschiedene ChatGPT-Modelle.
blockbank
All-in-One-Krypto-Neo-Banking-App, die DeFi- und CeFi-Technologien kombiniert.
Sharkfoto Quick 091801
SharkFoto offers free AI-powered image editing tools including background removal and photo colorization.
Neuronwriter
Fortschrittliches Tool zur Inhaltsoptimierung mit semantischen Modellen.
Novel
Novel hilft Ihnen, ein umfassendes professionelles Profil zu erstellen.
AI Fortunist (AI-Powered Tarot Readings)
AI Fortunist bietet personalisierte Tarot-Lesungen, Kaffee-Lesungen und Trauminterpretationen mithilfe fortschrittlicher KI.
ParrotPDF
ParrotPDF ermöglicht es Benutzern, interaktiv mit PDF-Dateien zu arbeiten.
Flove
Flove ist eine minimalistische Bewegungsverfolgungs-App mit innovativen Funktionen.
Franklin AI
KI-Tool zur Rationalisierung von Geschäftsabläufen und zur Verbesserung der Entscheidungsfindung.
Durable AI
KI-gesteuerter Website-Builder, um Ihr Unternehmen in 30 Sekunden online zu bringen.
JungGPT
Ein KI-Tool für emotionale Reflexion und psychologische Einsichten.
ChartX
AI-gestützte medizinische Dokumentation für effiziente und genaue Patientenversorgung.
eztalks-20250226-0424003
Entfernen Sie Hintergründe aus Bildern und konvertieren Sie Bildformate mühelos mit SharkFoto.
Udemy Summary with ChatGPT
Fassen Sie Udemy-Videos mit ChatGPT zusammen und machen Sie mühelos Notizen.
Astro Answer New Tab
Entdecken Sie Astrologie mit personalisierten, von KI generierten Horoskopen.
aiBot копирайтер
Verbessern Sie mühelos Ihren Text mit aiBot копирайтер.
PageSage
PageSage vereinfacht das Surfen im Web, indem es sofort Fragen und Antworten generiert.
GPU Finder
GPU Finder hilft dabei, verfügbare GPU-Instanzen von globalen öffentlichen Cloud-Anbietern zu entdecken.
Skyworker
KI-gesteuerte Plattform für technische Jobuchsuchende und Recruiter.
Craft
Craft ist ein leistungsstarkes Dokumentenerstellungs- und Kollaborationstool für Teams und Einzelpersonen.
GottaMeme. AI Meme Generator
Erstellen Sie mühelos lustige Memes mit dem KI-gestützten Generator von GottaMeme.
Recap
Fassen Sie jeden Abschnitt einer Webseite ganz einfach mit Recap zusammen, einer Open-Source-Browsererweiterung, die ChatGPT nutzt.
kimi quick test 20250417-121312223
Eine innovative Plattform zur Steigerung der persönlichen Produktivität.
Magazine Luiza
Effizienter Einkaufsassistent für Magazine Luiza-Nutzer.
sharkfoto svip test 202512241034
SharkFoto ist eine KI-gestützte Plattform zum mühelosen Erstellen und Bearbeiten von Videos, Bildern und Musik.
Bigjpg AI
Bigjpg verbessert die Bildqualität durch fortschrittliches KI-Hochskalieren.
kimi test 20250328-3
Verbessern, verwandeln und bearbeiten Sie Bilder mit KI-gestützten Tools kostenlos.
viddo.ai
Veo3 by Viddo AI enables AI-powered text or image to high-quality video creation rapidly.
Simplifly
Fassen Sie lange Artikel mit Simplifly einfach zusammen.
BearGPT - Chatgpt Enhancer
Verbessern Sie Ihr ChatGPT-Erlebnis mit BearGPT für eine bessere Navigation und Anpassung.
2026 Face Swap
2026 Face Wwap2026 Face Wwap2026 Face Wwap2026 Face Wwap2026 Face Wwap2026 Face Wwap2026 Face Wwap2026 Face Wwap2026 Fac
TextPal
TextPal nutzt KI, um Webseitentexte mühelos zusammenzufassen und zu verwalten.
AlgoDocs
AlgoDocs: KI-gestützte Dokumentendatenextraktion leicht gemacht.
Audioread: Ultra-Realistic Text-to-Speech
Hören Sie Artikel mit ultra-realistischen KI-Stimmen.
GPTXtend
Verbessern Sie Ihr ChatGPT-Erlebnis mit leistungsstarken Sharing-Tools.
Free Email Extractor from Website
Kostenloses E-Mail-Extraktionswerkzeug zum Scraping von E-Mails, Telefonnummern und sozialen Profilen von Webseiten.
Skypher
Optimieren Sie Ihre Sicherheitsprüfungen mit der Automatisierung von Skypher.
AI PDF chatbot agent built with LangChain & LangGraph
SharkFoto bietet kostenlose KI-gestützte Foto-Bearbeitungstools für Hintergrundentfernung, Kolorierung, Verbesserung und Größenänderung von Bildern an.
Wan 2.2-test
Wan 2 AI offers fast, high-quality 1080p AI video generation with advanced motion control.
Tappy AI
AI-Browsererweiterung zum Hinzufügen von durchdachten Kommentaren zu LinkedIn-Posts.
sharkfoto-svip-092202
SharkFoto offers free AI-powered image editing tools like background removal and coloring.
Letz DM
Automatisiere das Influencer-Marketing auf TikTok ohne Aufwand.
Belly Buddy
Verfolge die Nahrungsaufnahme und Verdauungssymptome mit Belly Buddy.
sharkfoto svip test 202509221443
SharkFoto offers free AI-powered photo editing tools for automatic background removal and image enhancement.
sharkfoto-svip-0922-changename
SharkFoto bietet kostenlose KI-gestützte Fotowerkzeuge, um Hintergründe automatisch zu entfernen und Bilder zu verbessern.
Alltum
Organisiert E-Mails, Aufgaben und Dateien mit KI-gestütztem Projektmanagement.

Inception Labs veröffentlicht Mercury 2: Das weltweit schnellste Reasoning-LLM erreicht über 1.000 Tokens pro Sekunde durch Diffusionsarchitektur

Inception Labs hat Mercury 2 veröffentlicht, ein diffusionsbasiertes Reasoning-Sprachmodell, das auf NVIDIA Blackwell GPUs über 1.000 Tokens pro Sekunde erzeugt — mehr als fünffach schneller als führende autoregressive Konkurrenten. Anders als beim traditionellen sequentiellen Decoding verwendet Mercury 2 parallele Token-Verfeinerung und ermöglicht Reasoning-Qualität innerhalb von Echtzeit-Latenzbudgets zu Kosten von $0.25 pro Million Eingabetokens.