AI News

Стратегический сдвиг: Meta делает ставку на собственные чипы

В условиях, когда инфраструктура искусственного интеллекта (Artificial Intelligence, AI) определяет лидерство на рынке, Meta заявила о масштабной трансформации своей стратегии центров обработки данных. Отойдя от сильной зависимости от поставщиков коммерческих GPU, гигант социальных сетей недавно представил четыре поколения своих проприетарных чипов Meta Training and Inference Accelerator (MTIA): серии 300, 400, 450 и 500. Разработанная в рамках стратегического сотрудничества с Broadcom, эта надежная дорожная карта специально разработана для решения конкретных, энергоемких задач крупномасштабного вывода AI (AI inference), стремясь к тому, что Meta характеризует как развертывание в гигаваттном масштабе в ближайшие годы.

Презентация, состоявшаяся в марте 2026 года, знаменует собой не просто инженерное достижение; это декларация независимости для операций Meta в области AI. В то время как индустрия долгое время оставалась сосредоточенной на GPU общего назначения как для обучения, так и для вывода, Meta делает ставку на будущее «специализированных чипов» (bespoke silicon). Адаптируя оборудование к своим собственным внутренним стекам программного обеспечения — преимущественно PyTorch и vLLM — компания надеется извлечь значительно более высокую эффективность для своих моделей генеративного AI (Generative AI), рекомендательных движков и алгоритмов ранжирования рекламы.

Технический глубокий анализ: Спецификации серии MTIA

Новая линейка чипов Meta отличается модульностью и быстрой итерацией. Используя чиплетную архитектуру (chiplet-based architecture), Meta удалось стандартизировать базовое шасси, стойку и сетевую инфраструктуру для моделей 400, 450 и 500, что позволяет выполнять обновления «горячей заменой» (drop-in) без замены всей аппаратной базы. Эта модульность является критической особенностью, которая способствует их агрессивному шестимесячному циклу выпуска — графику, который нарушает традиционные многолетние циклы разработки аппаратного обеспечения.

В таблице ниже приведены основные характеристики четырех представленных поколений MTIA, иллюстрирующие резкий рост вычислительной производительности и производительности памяти от серии 300 до серии 500.

Модель MTIA Фокус рабочей нагрузки TDP Пропускная способность HBM Ключевая характеристика
MTIA 300 Обучение R&R 800 Вт 6,1 ТБ/с Базовая сетка вычислительных блоков
MTIA 400 Общий AI/Вывод 1 200 Вт 9,2 ТБ/с Первый конкурентоспособный производительный блок
MTIA 450 Вывод GenAI 1 400 Вт 18,4 ТБ/с Дизайн, оптимизированный по пропускной способности
MTIA 500 Вывод GenAI 1 700 Вт 27,6 ТБ/с Масштабирование высокопроизводительного развертывания

Помимо показателей чистой пропускной способности, критическим проектным решением команды Meta-Broadcom является сильный акцент на HBM (High Bandwidth Memory, память с высокой пропускной способностью). На «фазе декодирования» (decode phase) вывода крупномасштабных трансформерных моделей пропускная способность памяти часто является основным узким местом, а не чистые вычислительные FLOPS. Модели MTIA 450 и 500 радикально увеличивают пропускную способность по сравнению с предыдущими итерациями — удваивая ее с 400 до 450 и добавляя еще 50 процентов для 500 — позиционируя их специально для решения высокоскоростных и ресурсоемких требований современных приложений генеративного AI.

Эффективность и стратегия «вывод прежде всего»

Исторически индустрия отдавала приоритет чипам, которые преуспевают в обучении крупномасштабных моделей. Эти высокопроизводительные GPU чрезвычайно мощны, однако их архитектурные накладные расходы — созданные для предварительного обучения — могут привести к неэффективности энергопотребления и затрат, когда они перепрофилируются исключительно для вывода. Подход Meta отвергает этот менталитет «один размер подходит всем».

Перейдя к стратегии «вывод прежде всего» (inference-first), Meta отказалась от функций, оптимизированных для массового параллельного обучения, которые не нужны компании для развертывания. Вместо этого чипы сосредоточены на:

  • Оптимизация низкой точности (Low-precision optimization): Пользовательские типы данных, совместно разработанные для вывода, позволяющие ускорить обработку с меньшими накладными расходами на программную конвертацию.
  • Ускорение FlashAttention: Прямая аппаратная поддержка ключевых компонентов, таких как FlashAttention и вычислительные блоки смеси экспертов (Mixture-of-Experts, MoE).
  • Модульная архитектура: Возможность бесшовного обновления в том же физическом пространстве по мере изменения спроса.

Эта специализация не существует в вакууме. Чтобы обеспечить беспроблемное внедрение, Meta создала свой аппаратный стек таким образом, чтобы он был нативно совместим с PyTorch и Triton. Это гарантирует, что инженерам-программистам Meta не нужно переписывать модели с нуля; они могут просто переносить рабочие нагрузки на устройства MTIA. Поддерживая эту программную совместимость, Meta значительно снижает операционные расходы на замену устаревшего коммерческого оборудования проприетарными чипами, напрямую бросая вызов привязке к поставщику (vendor lock-in), преобладающей в текущей инфраструктуре AI.

Операционная скорость и роль Broadcom

Отличительным элементом этого анонса является темп разработки. Как правило, циклы проектирования специализированных чипов растягиваются на два года и более. Используя модульный подход к проектированию «повторное использование и доработка», Meta стабилизировала темп разработки примерно в шесть месяцев на итерацию.

Такой уровень скорости был бы невозможен без возможностей интеграции и цепочки поставок, предоставленных их партнером, Broadcom. В то время как многие технологические гиганты стремятся создавать внутреннее оборудование, разрыв в исполнении — переход от архитектурной схемы к миллионам работающих, термически стабильных и надежных чипов — это то, где многие терпят неудачу. Сотрудничество с Broadcom, по-видимому, устраняет этот разрыв, предоставляя проверенный в отрасли опыт в области корпусирования и межсоединений, необходимый для превращения этих проектов в, как заявила Meta, массивный парк чипов.

Взгляд в будущее: Влияние на рынок

Раскрытие серии MTIA 500 служит четким сигналом для действующих лидеров в области полупроводников. Поскольку Meta внедряет эти чипы наряду со своим долгосрочным соглашением по инфраструктуре AI на сумму 100 миллиардов долларов с AMD, компания диверсифицирует свой портфель, чтобы минимизировать зависимости.

Мы наблюдаем зрелость нового уровня специализированных компонентов центров обработки данных. Смещая акцент с чистых FLOP на производительность, ограниченную памятью и оптимизированную для вывода GenAI, Meta не только меняет способы развертывания AI, но и, возможно, устанавливает стандарт того, что крупные поставщики интернет-услуг требуют от своих партнеров по производству чипов. Последуют ли другие гиперскейлеры (hyperscalers) тому же пути вертикальной интеграции — или предпочтут все более кастомизированные, но готовые коммерческие альтернативы — остается центральным вопросом для рынка инфраструктуры AI в преддверии 2027 года.

Эпоха центров обработки данных AI «общего профиля», возможно, уходит в прошлое, сменяясь точной, узкоспециализированной и быстро развивающейся архитектурой чипов, которую Meta сейчас вывела на передний план. Для Creati.ai это остается одним из наиболее важных трендов в области аппаратного обеспечения, за которым необходимо следить в течение следующего финансового года.

Рекомендуемые
ex ads 202603311112
1111111111111
BlazeGard
Blazeguard provides unparalleled fire safety through innovative fire-rated sheathing technology.
Test Face Swap
Test Face Swap Test Face Swap Test Face Swap Test Face Swap Test Face Swap Test Face Swap
Midjourney for Slack
Bring AI-generated images directly to your Slack workspace with Midjourney for Slack.
AI Bot Eye
Transform your security with AI-driven surveillance technology.
amy
Amy is a comprehensive workplace assistant that streamlines tasks, schedules meetings, and manages projects.
sharkfoto-20250108-quick
Remove background from the image with just one click and convert the image to or from 200+ formats.
test 2 face swap 2
test 2 face swap 2test 2 face swap 2test 2 face swap 2test 2 face swap 2test 2 face swap 2test 2 face swap 2test 2 face
Gptzero me
GPTZero is a tool to detect AI-generated text accurately and easily.
sharkfoto-20250108-free
AI-powered tool for background removal and image conversion in over 200 formats.
BGRemover
Easily remove image backgrounds online with SharkFoto BGRemover.
sharkfoto agent test 202510111844
SharkFoto offers AI-powered free photo editing tools including background removal and colorization.
WorkViz
Workviz: AI-powered platform optimizing team performance through comprehensive analytics.
FreeAiKit
FreeAiKit offers a collection of free AI tools for various content creation needs.
TAROT ARCANA
Unveil your future with Tarot Arcana, an AI-powered tarot reading app.
Skywork
Skywork преобразует простой ввод в мультимодальный контент, такой как отчеты и слайды.
sharkfoto svip 20250715
BrowseGPTs
Daily updated directory for diverse ChatGPT models.
blockbank
All-in-one crypto neo banking app combining DeFi and CeFi technologies.
Sharkfoto Quick 091801
SharkFoto offers free AI-powered image editing tools including background removal and photo colorization.
Neuronwriter
Advanced tool for content optimization using semantic models.
Novel
Novel helps you craft a comprehensive professional profile.
AI Fortunist (AI-Powered Tarot Readings)
AI Fortunist provides personalized tarot readings, coffee readings, and dream interpretations using advanced AI.
ParrotPDF
ParrotPDF lets users engage with PDF files interactively.
Flove
Flove is a minimalist movement tracking app with innovative features.
Franklin AI
AI tool to streamline business operations and enhance decision-making.
Durable AI
AI-powered website builder to get your business online in 30 seconds.
JungGPT
An AI tool for emotional reflection and psychological insights.
ChartX
AI-powered medical documentation for efficient and accurate patient care.
eztalks-20250226-0424003
Удаляйте фоны с изображений и беспрепятственно преобразуйте форматы изображений с помощью SharkFoto.
Udemy Summary with ChatGPT
Summarize Udemy videos with ChatGPT and take notes effortlessly.
Astro Answer New Tab
Discover astrology with personalized AI-generated horoscopes.
aiBot копирайтер
Effortlessly enhance your text with aiBot копирайтер.
PageSage
PageSage simplifies web browsing by generating questions and answers instantly.
GPU Finder
GPU Finder helps discover available GPU instances from global public cloud providers.
Skyworker
AI-powered platform for tech job seekers and recruiters.
Craft
Craft is a powerful document creation and collaboration tool for teams and individuals.
GottaMeme. AI Meme Generator
Create hilarious memes effortlessly with GottaMeme's AI-powered generator.
Recap
Easily summarize any webpage portion with Recap, an open-source browser extension utilizing ChatGPT.
kimi quick test 20250417-121312223
Инновационная платформа для повышения личной продуктивности.
Magazine Luiza
Efficient shopping assistant for Magazine Luiza users.
sharkfoto svip test 202512241034
SharkFoto — платформа с поддержкой ИИ для лёгкого создания и редактирования видео, изображений и музыки.
Bigjpg AI
Bigjpg enhances image quality through advanced AI upscaling.
kimi test 20250328-3
Инновационная платформа, позволяющая безупречное сотрудничество и продуктивность.
viddo.ai
Veo3 by Viddo AI enables AI-powered text or image to high-quality video creation rapidly.
Simplifly
Summarize lengthy articles easily with Simplifly.
BearGPT - Chatgpt Enhancer
Enhance your ChatGPT experience with BearGPT for better navigation and customization.
2026 Face Swap
2026 Face Wwap2026 Face Wwap2026 Face Wwap2026 Face Wwap2026 Face Wwap2026 Face Wwap2026 Face Wwap2026 Face Wwap2026 Fac
TextPal
TextPal utilizes AI to summarize and manage webpage text effortlessly.
AlgoDocs
AlgoDocs: AI-powered document data extraction made easy.
Audioread: Ultra-Realistic Text-to-Speech
Listen to articles with ultra-realistic AI voices.
GPTXtend
Enhance your ChatGPT experience with powerful sharing tools.
Free Email Extractor from Website
Free email extraction tool for scraping emails, phone numbers, and social profiles from websites.
Skypher
Streamline your security reviews with Skypher's automation.
AI PDF chatbot agent built with LangChain & LangGraph
SharkFoto предлагает бесплатные инструменты для редактирования фотографий на базе ИИ для удаления фона, колоризации, улучшения и изменения размера изображений.
Wan 2.2-test
Wan 2 AI offers fast, high-quality 1080p AI video generation with advanced motion control.
Tappy AI
AI browser extension for adding thoughtful comments to LinkedIn posts.
sharkfoto-svip-092202
SharkFoto offers free AI-powered image editing tools like background removal and coloring.
Letz DM
Automate TikTok influencer marketing without the hassle.
Belly Buddy
Track food intake and digestive symptoms with Belly Buddy.
sharkfoto svip test 202509221443
SharkFoto offers free AI-powered photo editing tools for automatic background removal and image enhancement.
sharkfoto-svip-0922-changename
SharkFoto предоставляет бесплатные инструменты для фото на базе ИИ, автоматически удаляющие фон и улучшающие изображения.
Alltum
Organizes emails, tasks, and files with AI-driven project management.

Meta представила четыре кастомные AI‑чипа MTIA, созданные с Broadcom, утверждает, что производительность превосходит Nvidia

Meta представила четыре новых чипа MTIA, созданных Broadcom (серии 300–500) для инференса ИИ, утверждая, что некоторые из них превосходят ведущие коммерческие кремниевые решения, с графиком выпуска каждые шесть месяцев и целью развёртывания в масштабе гигаватт.