
По мере того как модели искусственного интеллекта (Artificial Intelligence, ИИ) становятся сложнее — охватывая миллиарды параметров и требуя огромной вычислительной пропускной способности — кремниевая инфраструктура, поддерживающая этот бум, сталкивается с фундаментальным вызовом. Мы достигаем термических пределов и ограничений эффективности архитектуры фон Неймана (von Neumann architecture). В течение десятилетий разделение вычислительных блоков и памяти было стандартом; однако эта архитектура требует постоянной «перетасовки данных», которая тратит колоссальное количество энергии, так как электричество выделяет тепло при перемещении битов туда и обратно.
В Creati.ai мы постоянно отслеживаем переход к более устойчивым парадигмам ИИ. Важная веха в этом поиске эффективности была достигнута в Кембриджском университете (University of Cambridge), где исследователи представили революционный подход к аппаратной архитектуре: чип-мемристор, вдохновленный работой мозга. Эта инновация предполагает, что мы могли бы сократить энергопотребление ИИ более чем на 70%, бросая вызов энергоемкому статус-кво современных ускорителей ИИ.
Традиционные мемристоры — важные компоненты в разработке нейроморфных вычислений (neuromorphic computing) — исторически сталкивались с проблемами стабильности. Обычные мемристоры на основе оксида гафния (HfO2) работают посредством процесса, называемого «филаментарным резистивным переключением». В этом процессе внутри оксида растут и разрываются крошечные проводящие пути, или филаменты. Хотя это эффективно создает состояния памяти, филаменты ведут себя непредсказуемым, стохастическим образом. Этот врожденный хаос приводит к плохой однородности между чипами и циклами, что резко ограничивает точность вычислений, необходимую для надежного вывода ИИ.
Группа исследователей из Кембриджа под руководством доктора Бабака Бахита (Babak Bakhit) с факультета материаловедения и металлургии отошла от этого непредсказуемого филаментарного подхода. Вместо того чтобы полагаться на случайный рост, их новая архитектура устройства использует многокомпонентную тонкую пленку, которая формирует внутренний p-n-переход (p-n junction). Легируя оксид гафния стронцием и титаном, команда спроектировала слой, который переключает состояния путем регулировки энергетического барьера на границе раздела.
Полученные результаты в производительности впечатляют. Согласно данным, опубликованным в журнале Science Advances, эти устройства работают при токах переключения примерно в миллион раз ниже, чем их филаментарные предшественники. Снижая физическую потребность в энергоемкой электрической стимуляции, это аппаратное обеспечение ИИ (AI hardware) демонстрирует, что стабильность и низкое энергопотребление не должны быть взаимоисключающими.
Чтобы визуализировать переход от текущих массовых решений для хранения памяти к этой высокоэффективной архитектуре, вдохновленной мозгом, рассмотрим следующее сравнение производительности.
| Метрика | Традиционные филаментарные мемристоры | Новые кембриджские мемристоры |
|---|---|---|
| Механизм переключения | Стохастические проводящие филаменты | Спроектированный интерфейс p-n-перехода |
| Операционная стабильность | Высокая вариативность (стохастичность) | Исключительная однородность |
| Ток переключения | Высокий (миллиамперы/микроамперы) | Сверхнизкий (<10 наноампер) |
| Влияние на энергопотребление системы | Базовое энергопотребление | Потенциальное снижение энергии более чем на 70% |
| Предсказуемость масштабирования | Низкая из-за случайных вариаций | Высокая благодаря предсказуемым сдвигам барьера |
Эта разработка значима, потому что она приближает нейроморфные вычисления (neuromorphic computing) к практической реальности, а не просто к теоретической концепции. В основе мощи мозга лежит интеграция обработки и памяти — он не извлекает данные с жесткого диска или кэша ОЗУ (RAM), чтобы думать; процесс мышления и хранения происходит одновременно.
Интегрируя этот принцип, кембриджский мемристор представляет собой огромный шаг в архитектуре вычислений в памяти (processing-in-memory, PIM). Возможность выполнять аналоговые вычисления непосредственно внутри компонента памяти устраняет проблему «стены памяти» (memory wall), которая ограничивает текущие системы на базе графических процессоров (GPU). Как отметила наша команда в Creati.ai, модели ИИ больше не ограничены только вычислительной мощностью, но и физической транспортировкой данных. Эта технология предлагает дорожную карту для преодоления этого барьера, обеспечивая синаптические обновления с затратами энергии в диапазоне от 2,5 пикоджоулей до 45 фемтоджоулей.
Для разработчиков и архитекторов оборудования это трансформационный сдвиг. Внедрение этой технологии могло бы обеспечить работу «всегда включенного» ИИ на периферии (edge), где сложные модели работают локально на маломощных устройствах, от автономных роботов до инфраструктуры умных городов с множеством датчиков, без необходимости постоянной поддержки облачных центров обработки данных.
Несмотря на оптимизм, переход от лабораторного прототипа к аппаратному обеспечению коммерческого уровня сопряжен с трудностями. Команда из Кембриджа (Cambridge) открыто заявила об одной существенной технической проблеме: текущий процесс осаждения требует температуры около 700°C.
Для современной полупроводниковой промышленности это требование к производству представляет собой точку трения, так как оно превышает стандартные уровни допуска для производства комплементарных структур металл-оксид-полупроводник (КМОП, CMOS). Достижение этого прорыва в коммерческом масштабе требует либо разработки новых КМОП-совместимых производственных процессов, либо совершенствования процесса наслоения материалов для работы при более низких порогах нагрева.
Однако есть веские причины для уверенности. Команда подтвердила, что все материалы, используемые в настоящее время в стеке устройства, уже полностью совместимы с КМОП. В настоящее время они сосредоточивают свои исследовательские усилия на оптимизации теплового профиля, необходимого при изготовлении. Если это температурное ограничение удастся преодолеть, интеграция этих устройств в стандартные производственные линии может пройти значительно более гладко, чем экспериментальные разработки чипов прошлого.
Потенциал энергоэффективности (energy efficiency) в области искусственного интеллекта является самой актуальной технической дискуссией в Кремниевой долине (Silicon Valley) и мировых производственных кругах сегодня. Поскольку центры обработки данных потребляют все более значительную долю мировых энергетических сетей, архитектурные инновации, подобные разработке Кембриджского университета, являются не просто новыми — они необходимы для долгосрочного масштабирования революции ИИ.
Creati.ai продолжает внимательно следить за этими разработками. Хотя широкое внедрение такого высокоэффективного оборудования может быть еще впереди, успешная демонстрация надежного мемристора с высокой однородностью, который избегает стохастической нестабильности традиционных методов, представляет собой поворотный момент для отрасли. Акцент смещается с простого наращивания мощности для создания еще более крупных моделей методом «грубой силы» в сторону проектирования архитектур, которые работают с интеллектуальной элегантностью биологического мозга.
В этом мы видим устойчивый путь вперед. Используя фундаментальные достижения в области материаловедения для создания лучшего аппаратного обеспечения, мы можем потенциально поддерживать рост моделей ИИ, одновременно резко снижая их экологические и экономические издержки.