Материалы Международного семинара по схемам памяти

Материалы Международного семинара по схемам памяти

Выпуск 13(6737) от 08 июля 2021 г.
РУБРИКА: МИКРОЭЛЕКТРОНИКА

На виртуальном Международном семинаре по схемам памяти (IEEE International Memory Workshop, IMW) был представлен широкий спектр презентаций и докладов, посвященных различным типам ИС ЗУ (NAND, DRAM, ReRAM и FRAM). Большое внимание во всех выступлениях уделялось вопросам удовлетворения требований к памяти со стороны средств и систем искусственного интеллекта (ИИ) и машинного обучения. Новые парадигмы, такие как вычисления в памяти, 3D-память (помимо 3D-флэш-памяти NAND-типа) и продвижение ReRAM для нейроморфных вычислений (использующих принципы работы мозга), также освещались докладчиками из разных стран мира.


Преимущества вычислений в памяти

Одно из преимуществ вычислений в памяти – ​возможность постоянно кэшировать непрерывно возрастающие объемы данных, обеспечивая при этом малое время отклика на запросы. Для этого существует несколько способов.

Специалисты Hewlett Packard Enterprise (HPE) рассказали о возможностях использования аналого--цифровых ассоциативных ЗУ (АЗУ). Можно сказать, что функционально АЗУ – ​своего рода обратная сторона ОЗУ. Памяти присваивается определенный адрес, который отправляется в ОЗУ – ​по нему осуществляется считывание данных, хранящиеся в данном адресном местоположении. Вывод данных из АЗУ осуществляется при совпадении данных поиска и хранимых данных. Такая память с адресацией по содержимому обеспечивает высокую пропускную способность операций поиска.

Аналоговые и цифровые АЗУ могут применяться в приложениях безопасности, геномики и деревьев решений, а также отображать широкий спектр вычислительных моделей (рис. 1). Специалисты HPE, в частности, изучают АЗУ на основе мемристоров и используют их для вычислений. Эти энергонезависимые аналоговые перестраиваемые устройства могут применяться для программирования матрицы значений в матричном переключателе. Вектор напряжения подается вдоль строк, а токи, собранные по столбцам, выполняют умножение векторных матриц. Подход находит широкое применение в машинном обучении (МО) и полносвязных нейронных сетях – ​области интенсивного изучения, а также в научных вычислениях.



Источник: Hewlett Packard Labs

Рисунок 1. Аналоговые и цифровые ассоциативные ЗУ могут быть реализованы в приложениях безопасности, геномики и деревьях решений, отображая широкий спектр вычислительных моделей


АЗУ уже используются во многих коммерческих системах, требующих операций сравнения с высокой пропускной способностью, таких как построение сетей, когда требуется IP-маршрутизация для управления качеством обслуживания. Это очень высокопроизводительные структуры, работающие по принципам, близким к работе человеческой памяти, – ​с получением входного сигнала наподобие того, как у человека при определенном звуке или запахе открывается доступ к мозгу и его системе запоминания.

Доклад представителей IBM Research был посвящен гиперразмерным вычислениям, также использующим принципы работы человеческого мозга. Аппаратное обеспечение вычислений в памяти применяется специалистами компании для преодоления некоторых проблем, связанных с современными вычислениями глубокого обучения, которые уже в значительной степени обеспечены полупроводниковыми технологиями, но все еще не так эффективны, как человеческий мозг, а также очень энергозатратны при обучении. По сути, только на обу-чение модели сегодня тратится энергия, эквивалентная двум неделям энергопотребления одиночного домохозяйства, что ставит крест на использовании глубокого обучения в Интернете вещей и приборах краевых вычислений.

Другая главная проблема глубокого обучения – ​сложность устройств. Большинство моделей ИИ сегодня работают на больших серверах, и при всех многочисленных требованиях к надежности, сетевой передаче данных, безопасности и управлению они по-прежнему не работают так же хорошо, как человеческий мозг. Чтобы справиться с проблемой, нужно найти альтернативу глубокому обучению и принять на этапе обучения и формирования логического вывода (по результатам МО) более простую модель операций – ​гиперразмерные вычисления. Для решения проблемы энергоэффективности специалисты IBM Research используют аппаратное обеспечение вычислений в памяти, а не традиционную принстонскую (фон-неймановскую) архитектуру.

Вся идея гиперразмерных вычислений состоит в использовании для представления данных гиперразмерных векторов (рис. 2), вместо того чтобы представлять данные с 32- или 64‑битовым потоком в определенном порядке. Гиперразмерные векторы представляют собой случайный битовый поток и способны очень быстро обучаться. Это общая и масштабируемая модель вычислений. Подход также чрезвычайно ориентирован на память, что делает его очень удобным для реализации с помощью аппаратного обеспечения вычислений в памяти.



Источник: IBM Research

Рисунок 2. Полная гиперразмерная вычислительная система с вычислениями в памяти

* SA (sense amplifier) – усилитель считывания.

* Победитель получает все (winner-take-all, WTA) – принцип, применяемый в нейронных сетях при принятии решений и в задачах классификации. В соответствии с ним решением считается такая альтернатива, у которой выходное значение соответствующего нейрона является максимальным.


Гиперразмерные вычисления сочетают хранение в памяти и архитектуру кодирования. Данные кодируются в ЗУ на эффекте изменения фазового состояния (phase--change memory, PCM), причем единицы и нули соответствуют состояниям с высоким и низким сопротивлением. Полная система, реализованная исследовательской группой IBM Research с использованием PCM, генерирует точные данные, и предполагается, что такие гиперразмерные вычисления в памяти будут в шесть раз более энергоэффективными, чем при использовании вместо PCM эквивалентных им стандартных цифровых КМОП ИС ЗУ.

Есть еще много возможностей для совершенствования, однако исследование в целом показало, что можно создать полную гиперразмерную систему вычислений в памяти, действующую по принципам человеческого мозга и способную достичь высочайшей точности при реализации на PCM ИС – ​энергоэффективных, быстродействующих, надежных и прозрачных при работе в несовершенных наноразмерных устройствах.


3D – ​не только для флэш-памяти NAND-типа

В последнее время было много дискуссий о возможности создания 3D-памяти помимо 3D-флэш-памяти NAND-типа, а также о том, как лучше этажировать ИС ЗУ для обеспечения быстродействия, производительности и термических параметров, удовлетворяющих требованиям высокопроизводительных рабочих нагрузок, таких как искусственный интеллект и машинное обучение.

Создание 3D ДОЗУ считается возможным уже сейчас, но конкретный метод реализации пока неясен. Один из способов предложила фирма Xi’an UniICSemiconductors, использующая технологию 3D-интеграции для формирования встраиваемых ДОЗУ. Предполагается, что эти приборы преодолеют проблему «стены памяти», присущую принстонской архитектуре. Разрыв в производительности между процессором и памятью становится все больше, на передачу данных тратится больше времени, чем на обработку данных, и больше энергии, чем для реальных вычислений.

Современные подходы к интеграции систем памяти включают в себя печатные платы, «системы-в-модуле» с использованием проволочного монтажа, технологию TSV и интерпозеры в памяти с высокой пропускной способностью (HBM), а также встраиваемые приборы. Для каждого из них характерны свои проблемы с производительностью с точки зрения пропускной способности, времени ожидания, потребляемой мощности и надежности. Важными соображениями являются также форм-фактор и стоимость системы.

Специалисты Xi’an UniICSemiconductors создали этажированное встраиваемое ДОЗУ (stacked embedded DRAM, SeDRAM) на базе 3D гибридного процесса соединения, при этом логика помещается поверх SeDRAM (рис. 3). Ряд преимуществ этого подхода – ​межсоединения межслойного уровня в одном кристалле ИС (от «системы-на-кристалле» (SoC) до ДОЗУ), гибкий интерфейс «логика–память» и вертикальные межсоединения. Конструкция не требует быстродействующей шины данных и дополнительных крупных приборов физического уровня (PHY) в SoC и ДОЗУ. Энергопотребление, необходимое для передачи данных, снижается по сравнению с другими вариантами интеграции ИС ЗУ. Конструкция системы намного проще, а затраты намного ниже.



Источник: Xi’an UniICSemiconductors

Рисунок 3. Этажированное встраиваемое ДОЗУ (SeDRAM) с использованием 3D гибридного соединения, при этом логика размещается поверх SeDRAM

* CTRL – комплементарная резисторно-транзисторная логика.

** BIST (built-in self-test) – встроенные средства самотестирования; BISR (built-in self-repair) – встроенные средства самовосстановления.


Некоторые применения SeDRAM включают кэш последнего уровня, который сочетает в себе логическую пластину центрального процессора и пластину SeDRAM. В результате получается недорогое решение для кэша с очень высокой плотностью или часть «сэндвич--решения» для системы в одном кристалле с верхним слоем для вычислений, средним слоем для кэша данных и нижним слоем для хранения данных. Решение выглядит многообещающим для чувствительных к потребляемой мощности приложений, таких как Интернет вещей, позволяет достичь низкого уровня энергопотребления и в то же время очень малых форм-факторов.

Разработчики CEA-Leti представили доклад о выгодах 3D-интеграции при формировании схем резистивной памяти (ReRAM) с точки зрения увеличения емкости и плотности расположения элементов. Это особенно важно для удовлетворения требований ИИ, отличающегося в настоящее время высокой энергоемкостью. Память находится в центре энергетической проблемы в значительной степени потому, что на этапе обучения требуется много данных – ​одна модель ИИ хранит миллионы параметров. Издержки высокой потребляемой мощности, связанные с перемещением данных между памятью и процессором, создают потребность во внутрикристальной памяти высокой плотности, и резистивные ИС ЗУ могут играть здесь решающую роль.

Привлекательность резистивных ЗУ заключается в том, что они представляют собой быстродействующие энергонезависимые запоминающие устройства, которые могут быть встроены в ядро КМОП ИС. Такие приборы доступны в различных вариантах, включая ОЗУ на эффекте изменения фазового состояния (PCRAM), магнитные (магнитерезистивные) ОЗУ (MRAM) и сегнетоэлектрические ОЗУ (FRAM). Специалисты CEA-Leti представили две стратегии архитектур резистивной памяти: хранение в ячейке нескольких бит данных с использованием технологии ReRAM и 3D-интеграция. В первом сценарии главная сложность – ​множественное программирование, требующее интеллектуальной, итеративной стратегии программирования. Второй сценарий сочетает в себе первый с последовательной 3D-интеграцией.

Двухуровневый процесс последовательной 3D-интеграции, также известный как 3D монолитная интеграция, 3D СБИС или CoolCube, начинается с нижнего МОП полевого транзистора (MOSFET) с межсоединениями или без них, создания верхнего активного слоя с гидрофильной связью и термическим отжигом, за которым следует процесс формирования верхнего MOSFET. Уровень 2 – ​это 3D-контакты, формируемые в рамках BEOL. Процесс отличается от 3D-корпусирования, где уровни (слои) формируются параллельно на двух разных пластинах с последующим этапом этажирования или соединения.

Монолитный подход ограничен только возможностями литографии, а не совмещением связей, что позволяет значительно улучшить 3D-связность. На основе базовой пластины осуществляется вертикальная интеграция ReRAM – ​с целью формирования архитектуры 1T1R (один транзистор, один резистор). Эта архитектура обеспечивает выигрыш за счет высокой плотности размещения вертикально расположенных NS-транзисторов, обладающих отличной масштабируемостью и демонстрирующих то же электрическое поведение, что и планарные транзисторы.

В дальнейшем исследователи намерены создать структуры 3D-My--Cube, сочетающие в себе нанопроволоки кругового затвора (gate-all-around, GAA), вертикальные резистивные ЗУ и 3D монолитную интеграцию. Предлагаемая архитектура должна обеспечить самую высокую плотность размещения вертикально расположенных NS-транзисторов. Каждый горизонтальный канал GAA имеет независимый исток, подключенный к разрядной шине, и сток, непосредственно подключенный к столбиковому выводу ячеек памяти ReRAM.

Высокая плотность ReRAM, достигаемая за счет многоуровневого программирования и 3D-интеграции, а также перекрестной (crossbar) архитектуры, позволит разработать новое энергоэффективное аппаратное обеспечение ИИ, основанное на вычислениях вблизи памяти и в памяти, включая нейроморфные процессоры, созданные на принципах работы человеческого мозга.


Hilson Gary. IMW Highlights 3D Architectures, In--Memory Computing. EE Times, June 8, 2021: https://www.eetimes.com/imw-highlights-3d-architectures-in-memory-computing/?utm_source=newsletter&utm_campaign=link&utm_medium=EETimesDaily-20210608&oly_enc_id=5245B7817912J8Z


ЧИТАЙТЕ ТАКЖЕ

Выпуск 24/25 (6748/6749) от 23 декабря 2021 г. г.
Выпуск 24/25 (6748/6749) от 23 декабря 2021 г. г.