AI News

Inception Labs が Mercury 2 で速度制限を打破:初の拡散ベースの推論モデル

生成式 AI(Generative AI)にとって決定的な瞬間として、Inception Labs は、マシンのテキスト生成方法を根本的に再構想する画期的な言語モデル「Mercury 2」を正式にリリースしました。業界標準の自己回帰型アーキテクチャ(Autoregressive architecture)を捨て、拡散ベース(Diffusion-based)の並列処理を採用することで、Mercury 2 は NVIDIA Blackwell GPU 上で毎秒 1,000 トークンを超える驚異的なスループットを実現しました。このリリースは、推論能力を持つモデルが、長らくリアルタイム AI アプリケーションを制約してきた「レイテンシの壁」を初めて突破したことを意味し、現在の価格モデルを大幅に下回りながら、最も近い競合他社よりも 5 倍から 10 倍高速なソリューションを提供します。

自己回帰型ボトルのネックの解消

長年、大規模言語モデル(LLM)の展望は自己回帰型トランスフォーマーによって支配されてきました。GPT-4 や Claude などのモデルは、一度に 1 つのトークン(大まかに 1 つの単語または単語の一部)を予測し、テキストを逐次的に生成します。このシリアルプロセスは効果的ではあるものの、回避不可能な速度制限を生み出します。つまり、モデルは文の冒頭を書き終える前に文末を生成することができません。モデルが巨大化し、推論タスクがより複雑になるにつれて、この「トークンごと」のアプローチは、レイテンシに敏感なアプリケーションにとってボトルネックとなってきました。

Mercury 2 は、拡散アーキテクチャを利用することでこのパラダイムを解体します。Mercury 2 は、回答を逐次的に「タイピング」するのではなく、大理石のブロックから像を削り出す彫刻家のように振る舞います。まず回答全体のノイズの多いラフドラフトから開始し、並列ステップですべてのトークンを同時に洗練させていきます。これにより、モデルは文の先を見通しながら冒頭を修正することが可能になり、逐次型モデルが高価なバックトラッキングなしでは達成に苦労する、全域的な一貫性と自己修正を実現します。

Inception Labs によれば、このアーキテクチャの転換により、Mercury 2 はわずか 1.7 秒というエンドツーエンドのレイテンシで複雑な推論出力を生成できます。これは、同様のタスクに対して従来のモデルが必要とする時間のわずかな一部にすぎません。

比類なきパフォーマンスと経済性

Inception Labs が発表したパフォーマンス指標は、このモデルが新しいカテゴリーの効率性を占めていることを示しています。NVIDIA Blackwell ハードウェア上で動作する Mercury 2 は、約 1,009 トークン/秒(TPS)のスループットを達成しました。参考までに、主要な速度最適化済み自己回帰モデルのスループットは、通常 70 から 100 TPS の間に留まります。

重要なのは、この速度が推論能力を犠牲にして実現されたものではないという点です。高度な数学的推論をテストする AIME 2025 ベンチマークにおいて、Mercury 2 は 91.1 というスコアを記録し、速度重視の小型モデルを大幅に上回り、はるかに巨大なフロンティアモデルと直接競合しています。

また、Inception Labs は Mercury 2 をコスト・ディスラプター(価格破壊者)として位置づけています。このモデルの価格は、入力トークン 100 万回あたり 0.25 ドル出力トークン 100 万回あたり 0.75 ドルに設定されています。この価格戦略は主要な競合他社を大幅に下回っており、高速で推論グレードの AI を、大量のエンタープライズ・ワークロードで利用可能にします。

比較分析:Mercury 2 対 既存モデル

この飛躍の大きさを理解するには、Mercury 2 を Claude 4.5 Haiku や GPT-5 Mini といった現世代の「高速」モデルと比較することが不可欠です。データは、Inception Labs がスループットにおいて桁違いの改善を達成したことを示唆しています。

表 1: パフォーマンスとコストの比較

モデル名 アーキテクチャ スループット (トークン/秒) 入力コスト (1Mあたり) 出力コスト (1Mあたり) AIME ベンチマーク
Mercury 2 拡散 ~1,009 $0.25 $0.75 91.1
Claude 4.5 Haiku 自己回帰 ~89 $1.00 $5.00 39.0
GPT-5 Mini 自己回帰 ~71 N/A N/A 27.0
Gemini 3 Flash 自己回帰 ~100 $0.50 $3.00 N/A

注:ベンチマークスコアと速度は、Inception Labs が発表したデータおよび技術レポートで引用された独立した初期ベンチマークに基づいています。

リアルタイム推論:エージェントの新たなフロンティア

Mercury 2 の影響は、生のベンチマークにとどまりません。このモデルの低レイテンシは、AI エージェントの展開に革命をもたらそうとしています。AI が計画を立て、ツールを使用し、反復する必要がある複雑なワークフローにおいて、従来のモデルは各ステップで数秒の遅延を伴うことが多く、結果としてユーザー体験を低下させていました。Mercury 2 の 1 秒未満の処理能力により、エージェントがほぼ瞬時に思考し、行動し、自らを修正できる「タイトなループ」が可能になります。

これは、ユーザーがほぼ即時の応答を期待する音声 AI、コーディングアシスタント、リアルタイム検索において特に重要です。例えば、Mercury 2 を搭載したコーディングアシスタントは、標準的なモデルが最初の数行を書いている間に、コードファイル全体をリファクタリングできる可能性があります。

業界での利用可能性

Inception Labs は、OpenAI 互換の API を通じて Mercury 2 を即時提供開始しており、開発者は最小限の摩擦で既存のインフラに組み込むことができます。このモデルは 128k のコンテキストウィンドウ、ツール呼び出し、および構造化された JSON 出力をサポートしており、現代のプロダクション環境の実践的な要求を確実に満たしています。

AI 業界がトランスフォーマーを超えた「次なる大きなもの」を模索し続ける中、Mercury 2 は、未来が拡散モデルにあるかもしれないという説得力のある論拠を提示しました。推論速度のボトルネックを解消することで、Inception Labs は単に高速なモデルをリリースしただけでなく、リアルタイム AI が達成できることの基準値を潜在的に再設定したのです。

フィーチャー
ex ads 202603311112
1111111111111
BlazeGard
Blazeguardは、革新的な耐火性被覆技術を通じて比類のない火災安全を提供します。
Test Face Swap
Test Face Swap Test Face Swap Test Face Swap Test Face Swap Test Face Swap Test Face Swap
Midjourney for Slack
Midjourney for Slackを使用して、AI生成画像を直接Slackワークスペースに取り込むことができます。
AI Bot Eye
AI駆動の監視技術でセキュリティを変革します。
amy
Amyは、タスクを合理化し、会議をスケジュールし、プロジェクトを管理する総合的な職場アシスタントです。
sharkfoto-20250108-quick
Remove background from the image with just one click and convert the image to or from 200+ formats.
test 2 face swap 2
test 2 face swap 2test 2 face swap 2test 2 face swap 2test 2 face swap 2test 2 face swap 2test 2 face swap 2test 2 face
Gptzero me
GPTZeroは、AI生成テキストを正確かつ簡単に検出するツールです。
sharkfoto-20250108-free
AI-powered tool for background removal and image conversion in over 200 formats.
BGRemover
SharkFoto BGRemoverでオンラインで簡単に画像の背景を削除できます。
sharkfoto agent test 202510111844
SharkFoto offers AI-powered free photo editing tools including background removal and colorization.
WorkViz
Workviz:包括包括された分析を通じてチーム成績を最適化するAI駆動プラットフォーム。
FreeAiKit
FreeAiKitは、さまざまなコンテンツ作成ニーズに対応する無料のAIツールのコレクションを提供します。
TAROT ARCANA
タロット・アルカナであなたの未来を明らかにしましょう。AI搭載のタロットカードリーディングアプリです。
Skywork
Skyworkは、シンプルな入力をレポートやスライドのようなマルチモーダルコンテンツに変換します。
sharkfoto svip 20250715
BrowseGPTs
多様なChatGPTモデルの毎日更新されるディレクトリ。
blockbank
DeFiとCeFi技術を組み合わせたオールインワン暗号通貨ネオバンキングアプリ。
Sharkfoto Quick 091801
SharkFoto offers free AI-powered image editing tools including background removal and photo colorization.
Neuronwriter
意味論モデルを使用したコンテンツ最適化のための高度なツール。
Novel
Novelは、包括的なプロフェッショナルプロフィールを作成するのに役立ちます。
AI Fortunist (AI-Powered Tarot Readings)
AIフォーチュニストは、先進的なAIを使用して、パーソナライズされたタロットリーディング、コーヒーリーディング、夢の解釈を提供します。
ParrotPDF
ParrotPDFは、ユーザーがPDFファイルと対話的に関わることを可能にします。
Flove
Floveは革新的な機能を備えたミニマリストの動き追跡アプリです。
Franklin AI
ビジネス運営を効率化し、意思決定を強化するためのAIツール。
Durable AI
AI搭載のウェブサイトビルダーで、30秒でビジネスをオンラインにします。
JungGPT
感情の反映と心理的洞察のためのAIツール。
ChartX
効率的で正確な患者ケアのためのAI駆動の医療文書。
eztalks-20250226-0424003
SharkFotoで、画像から背景を簡単に削除し、画像形式を変換します。
Udemy Summary with ChatGPT
ChatGPTを使ってUdemy動画を要約し、簡単にノートを取る。
Astro Answer New Tab
パーソナライズされたAI生成のホロスコープで占星術を発見しましょう。
aiBot копирайтер
aiBot копирайтер を使って、簡単にテキストを強化しましょう。
PageSage
PageSage は、ウェブブラウジングを簡素化し、即座に質問と答えを生成します。
GPU Finder
GPU Finderは、グローバルなパブリッククラウドプロバイダーから利用可能なGPUインスタンスを発見するのを助けます。
Skyworker
テクノロジーの求職者とリクルーターのためのAI駆動プラットフォーム。
Craft
Craftは、チームや個人向けの強力な文書作成およびコラボレーションツールです。
GottaMeme. AI Meme Generator
GottaMemeのAI駆動のジェネレーターで手軽に面白いミームを作成しましょう。
Recap
Recapを使って、ChatGPTを活用したオープンソースのブラウザ拡張機能で任意のウェブページの部分を簡単に要約します。
kimi quick test 20250417-121312223
個人の生産性を向上させるための革新的なプラットフォーム。
Magazine Luiza
Magazine Luizaユーザーのための効率的なショッピングアシスタント。
sharkfoto svip test 202512241034
SharkFotoは、動画、画像、音楽を手軽に作成・編集できるAI搭載プラットフォームです。
Bigjpg AI
Bigjpgは、高度なAIアップスケーリング技術を通じて画像品質を向上させます。
kimi test 20250328-3
シームレスなコラボレーションと生産性を実現する革新的なプラットフォーム。
viddo.ai
Veo3 by Viddo AI enables AI-powered text or image to high-quality video creation rapidly.
Simplifly
Simpliflyで長い記事を簡単に要約します。
BearGPT - Chatgpt Enhancer
BearGPTでチャットGPT体験を向上させ、より良いナビゲーションとカスタマイズを実現しましょう。
2026 Face Swap
2026 Face Wwap2026 Face Wwap2026 Face Wwap2026 Face Wwap2026 Face Wwap2026 Face Wwap2026 Face Wwap2026 Face Wwap2026 Fac
TextPal
TextPalはAIを活用して、ウェブページのテキストを簡単に要約し管理します。
AlgoDocs
AlgoDocs:AI駆動のドキュメントデータ抽出が簡単に。
Audioread: Ultra-Realistic Text-to-Speech
超リアルなAI音声で記事を聴いてください。
GPTXtend
強力な共有ツールであなたのChatGPT体験を向上させましょう。
Free Email Extractor from Website
ウェブサイトからメール、電話番号、ソーシャルプロファイルをスクレイピングするための無料のメール抽出ツール。
Skypher
Skypherの自動化でセキュリティレビューを効率化します。
AI PDF chatbot agent built with LangChain & LangGraph
SharkFotoは、背景除去、カラー化、強調、画像サイズ変更のための無料のAI搭載写真編集ツールを提供します。
Wan 2.2-test
Wan 2 AI offers fast, high-quality 1080p AI video generation with advanced motion control.
Tappy AI
LinkedInの投稿に思慮深いコメントを追加するためのAIブラウザ拡張。
sharkfoto-svip-092202
SharkFoto offers free AI-powered image editing tools like background removal and coloring.
Letz DM
手間をかけずにTikTokインフルエンサーのマーケティングを自動化します。
Belly Buddy
Belly Buddyを使用して食事の摂取と消化症状を追跡します。
sharkfoto svip test 202509221443
SharkFoto offers free AI-powered photo editing tools for automatic background removal and image enhancement.
sharkfoto-svip-0922-changename
SharkFotoは無料のAI搭載の写真ツールを提供しており、背景の自動削除や画像の強化を行います。
Alltum
AI駆動のプロジェクト管理を使って、メール、タスク、ファイルを整理します。

Inception Labs、Mercury 2を発表:拡散アーキテクチャにより世界最速の推論LLMが毎秒1,000トークン超を実現

Inception LabsはMercury 2をリリースしました。これは拡散ベースの推論型言語モデルで、NVIDIA Blackwell GPU上で毎秒1,000トークン以上を生成し、主要な自己回帰型競合よりも5倍以上高速です。従来の逐次デコーディングとは異なり、Mercury 2は並列トークン精練を用いてリアルタイムのレイテンシ予算内で推論レベルの品質を実現し、入力100万トークンあたりのコストは $0.25 です。