Inception Labs 推出 Mercury 2:全球最快的推理型 LLM,透過擴散架構達成每秒 1,000+ 代幣
Inception Labs 發布了 Mercury 2,一款基於擴散的推理語言模型,在 NVIDIA Blackwell GPU 上每秒產生超過 1,000 個代幣——比主要的自回歸競品快超過五倍。與傳統的序列解碼不同,Mercury 2 採用並行的代幣精煉,能在實時延遲預算內達到推理級品質,輸入每百萬代幣的成本為 $0.25。
Inception Labs 發布了 Mercury 2,一款基於擴散的推理語言模型,在 NVIDIA Blackwell GPU 上每秒產生超過 1,000 個代幣——比主要的自回歸競品快超過五倍。與傳統的序列解碼不同,Mercury 2 採用並行的代幣精煉,能在實時延遲預算內達到推理級品質,輸入每百萬代幣的成本為 $0.25。
根據The Information,Meta Platforms已簽署一項為期多年的數十億美元協議,租用Google的張量處理單元(TPU)以用於AI模型開發。此交易標誌著從Nvidia GPU的重要多元化,並緊隨Meta近期與AMD和Nvidia達成的晶片協議,突顯出2026年業界在AI基礎設施上的大規模投資熱潮。
Anthropic 執行長 Dario Amodei 表示公司『出於良心無法』遵從五角大廈要求移除其 Claude AI 模型的安全防護措施的最後通牒。國防部長 Pete Hegseth 威脅若未在 2026 年 2 月 27 日星期五前提供不受限制的軍事存取,將取消一筆 2 億美元的合約,並將 Anthropic 標籤為『供應鏈風險』。