Meta представила четыре кастомные AI‑чипа MTIA, созданные с Broadcom, утверждает, что производительность превосходит Nvidia

Стратегический сдвиг: Meta делает ставку на собственные чипы

В условиях, когда инфраструктура искусственного интеллекта (Artificial Intelligence, AI) определяет лидерство на рынке, Meta заявила о масштабной трансформации своей стратегии центров обработки данных. Отойдя от сильной зависимости от поставщиков коммерческих GPU, гигант социальных сетей недавно представил четыре поколения своих проприетарных чипов Meta Training and Inference Accelerator (MTIA): серии 300, 400, 450 и 500. Разработанная в рамках стратегического сотрудничества с Broadcom, эта надежная дорожная карта специально разработана для решения конкретных, энергоемких задач крупномасштабного вывода AI (AI inference), стремясь к тому, что Meta характеризует как развертывание в гигаваттном масштабе в ближайшие годы.

Презентация, состоявшаяся в марте 2026 года, знаменует собой не просто инженерное достижение; это декларация независимости для операций Meta в области AI. В то время как индустрия долгое время оставалась сосредоточенной на GPU общего назначения как для обучения, так и для вывода, Meta делает ставку на будущее «специализированных чипов» (bespoke silicon). Адаптируя оборудование к своим собственным внутренним стекам программного обеспечения — преимущественно PyTorch и vLLM — компания надеется извлечь значительно более высокую эффективность для своих моделей генеративного AI (Generative AI), рекомендательных движков и алгоритмов ранжирования рекламы.

Технический глубокий анализ: Спецификации серии MTIA

Новая линейка чипов Meta отличается модульностью и быстрой итерацией. Используя чиплетную архитектуру (chiplet-based architecture), Meta удалось стандартизировать базовое шасси, стойку и сетевую инфраструктуру для моделей 400, 450 и 500, что позволяет выполнять обновления «горячей заменой» (drop-in) без замены всей аппаратной базы. Эта модульность является критической особенностью, которая способствует их агрессивному шестимесячному циклу выпуска — графику, который нарушает традиционные многолетние циклы разработки аппаратного обеспечения.

В таблице ниже приведены основные характеристики четырех представленных поколений MTIA, иллюстрирующие резкий рост вычислительной производительности и производительности памяти от серии 300 до серии 500.

Модель MTIA	Фокус рабочей нагрузки	TDP	Пропускная способность HBM	Ключевая характеристика
MTIA 300	Обучение R&R	800 Вт	6,1 ТБ/с	Базовая сетка вычислительных блоков
MTIA 400	Общий AI/Вывод	1 200 Вт	9,2 ТБ/с	Первый конкурентоспособный производительный блок
MTIA 450	Вывод GenAI	1 400 Вт	18,4 ТБ/с	Дизайн, оптимизированный по пропускной способности
MTIA 500	Вывод GenAI	1 700 Вт	27,6 ТБ/с	Масштабирование высокопроизводительного развертывания

Помимо показателей чистой пропускной способности, критическим проектным решением команды Meta-Broadcom является сильный акцент на HBM (High Bandwidth Memory, память с высокой пропускной способностью). На «фазе декодирования» (decode phase) вывода крупномасштабных трансформерных моделей пропускная способность памяти часто является основным узким местом, а не чистые вычислительные FLOPS. Модели MTIA 450 и 500 радикально увеличивают пропускную способность по сравнению с предыдущими итерациями — удваивая ее с 400 до 450 и добавляя еще 50 процентов для 500 — позиционируя их специально для решения высокоскоростных и ресурсоемких требований современных приложений генеративного AI.

Эффективность и стратегия «вывод прежде всего»

Исторически индустрия отдавала приоритет чипам, которые преуспевают в обучении крупномасштабных моделей. Эти высокопроизводительные GPU чрезвычайно мощны, однако их архитектурные накладные расходы — созданные для предварительного обучения — могут привести к неэффективности энергопотребления и затрат, когда они перепрофилируются исключительно для вывода. Подход Meta отвергает этот менталитет «один размер подходит всем».

Перейдя к стратегии «вывод прежде всего» (inference-first), Meta отказалась от функций, оптимизированных для массового параллельного обучения, которые не нужны компании для развертывания. Вместо этого чипы сосредоточены на:

Оптимизация низкой точности (Low-precision optimization): Пользовательские типы данных, совместно разработанные для вывода, позволяющие ускорить обработку с меньшими накладными расходами на программную конвертацию.
Ускорение FlashAttention: Прямая аппаратная поддержка ключевых компонентов, таких как FlashAttention и вычислительные блоки смеси экспертов (Mixture-of-Experts, MoE).
Модульная архитектура: Возможность бесшовного обновления в том же физическом пространстве по мере изменения спроса.

Эта специализация не существует в вакууме. Чтобы обеспечить беспроблемное внедрение, Meta создала свой аппаратный стек таким образом, чтобы он был нативно совместим с PyTorch и Triton. Это гарантирует, что инженерам-программистам Meta не нужно переписывать модели с нуля; они могут просто переносить рабочие нагрузки на устройства MTIA. Поддерживая эту программную совместимость, Meta значительно снижает операционные расходы на замену устаревшего коммерческого оборудования проприетарными чипами, напрямую бросая вызов привязке к поставщику (vendor lock-in), преобладающей в текущей инфраструктуре AI.

Операционная скорость и роль Broadcom

Отличительным элементом этого анонса является темп разработки. Как правило, циклы проектирования специализированных чипов растягиваются на два года и более. Используя модульный подход к проектированию «повторное использование и доработка», Meta стабилизировала темп разработки примерно в шесть месяцев на итерацию.

Такой уровень скорости был бы невозможен без возможностей интеграции и цепочки поставок, предоставленных их партнером, Broadcom. В то время как многие технологические гиганты стремятся создавать внутреннее оборудование, разрыв в исполнении — переход от архитектурной схемы к миллионам работающих, термически стабильных и надежных чипов — это то, где многие терпят неудачу. Сотрудничество с Broadcom, по-видимому, устраняет этот разрыв, предоставляя проверенный в отрасли опыт в области корпусирования и межсоединений, необходимый для превращения этих проектов в, как заявила Meta, массивный парк чипов.

Взгляд в будущее: Влияние на рынок

Раскрытие серии MTIA 500 служит четким сигналом для действующих лидеров в области полупроводников. Поскольку Meta внедряет эти чипы наряду со своим долгосрочным соглашением по инфраструктуре AI на сумму 100 миллиардов долларов с AMD, компания диверсифицирует свой портфель, чтобы минимизировать зависимости.

Мы наблюдаем зрелость нового уровня специализированных компонентов центров обработки данных. Смещая акцент с чистых FLOP на производительность, ограниченную памятью и оптимизированную для вывода GenAI, Meta не только меняет способы развертывания AI, но и, возможно, устанавливает стандарт того, что крупные поставщики интернет-услуг требуют от своих партнеров по производству чипов. Последуют ли другие гиперскейлеры (hyperscalers) тому же пути вертикальной интеграции — или предпочтут все более кастомизированные, но готовые коммерческие альтернативы — остается центральным вопросом для рынка инфраструктуры AI в преддверии 2027 года.

Эпоха центров обработки данных AI «общего профиля», возможно, уходит в прошлое, сменяясь точной, узкоспециализированной и быстро развивающейся архитектурой чипов, которую Meta сейчас вывела на передний план. Для Creati.ai это остается одним из наиболее важных трендов в области аппаратного обеспечения, за которым необходимо следить в течение следующего финансового года.