ВЫБОР РЕДАКЦИИ

Современное состояние и перспективы развития рынка САПР

Общее состояние и ближайшие перспективы рынка микроэлектроники

SEMI о состоянии полупроводниковой промышленности

SEMI о состоянии полупроводниковой промышленности

Вопросы развития краевых вычислений

Teraki совершает «квантовый скачок» в сфере больших данных

Вопросы развития краевых вычислений

Человеко-машинный интерфейс умных домов и краевой искусственный интеллект

Проблемы использования Wi-Fi в Интернете вещей

Вопросы обеспечения безопасности Интернета вещей

Перспективы развития микроконтроллеров с краевым искусственным интеллектом

В Корал-Гейблс запущена платформа Smart City Hub

Проблемы кибербезопасности Интернета вещей

Искусственный интеллект и модели обмена знаниями

Новая политика регулирования Интернета вещей ОАЭ

Состояние и перспективы рынка 300‑мм пластин: прогноз специалистов SEMI

Платформа Microchip Trust призвана упростить аппаратную безопасность Интернета вещей

Высокоэффективные макетные платы для разработки приборов Интернета вещей

Переход от полноразмерных облачных хранилищ к клаудлетам

Переход от полноразмерных облачных хранилищ к клаудлетам

Выпуск 18 (6717) от 17 сентября 2020 г.
РУБРИКА: ВЫЧИСЛИТЕЛЬНАЯ ТЕХНИКА

Технологии облачных вычислений продолжают развиваться. Пытаясь уменьшить время ожидания и повысить общую производительность обработки данных, облачные операторы начинают разворачивать ближе к источникам данных клаудлеты (распределенные «облака», «мини-облака», «облачка»). Но по мере того как этот подход набирает популярность, он порождает и некоторые новые проблемы, связанные с распределением, хранением и безопасностью данных. Растущая популярность распределенных «облаков» – ​это признание того, что классическая облачная модель имеет ограничения. Отправка растущего объема данных оконечных устройств в «облако» для обработки – ​ресурсоемкий, трудоемкий и крайне неэффективный процесс.

Современный образ жизни характерен тем, что каждый день создаются огромные объемы данных. Действительно, 90% всех существующих сегодня данных были получены за последние два года, и 80% из них – ​видео или изображения. Из этого объема анализируется только около 2%, и все эти данные необходимо передавать, хранить и обрабатывать, для чего требуются высокопроизводительные вычисления, передача с высокой пропускной способностью и хранение с высокой плотностью записи. Таким образом, наступило время для инноваций в области архитектур и проектирования полупроводниковых приборов, инструментальных средств САПР, в интеллектуальной собственности и производственной экосистеме. Появилась возможность формирования новых бизнес-моделей.

Большую часть данных необходимо анализировать на локальном уровне. Это заметный отход от первоначальной концепции Интернета вещей, которая предполагала, что 5G-технология миллиметрового диапазона (mmWave) обеспечит достаточную пропускную способность и скорость для десятков миллиардов устройств Интернета вещей, подключенных к «облаку», с почти мгновенным получением результатов. Однако выяснилось, что даже в идеальных условиях с использованием высоких частот это занимает слишком много времени. Технология 5G mmWave по сути – ​просто более быстрая версия 4G. Сигналы не проходят через окна или за углы, они легко прерываются и быстро затухают. В результате основное внимание при разработке средств 5G mmWave сместилось с почти повсеместного размещения малых ячеек снаружи или внутри зданий к более четко определенной инфраструктуре ближе к источникам данных. Ситуация также заставила переосмыслить вопрос, для чего именно будет использоваться 5G, а именно – ​для связи в пределах прямой видимости с некоторой возможностью огибать объекты с помощью формирования луча. Так 5G mmWave становится жизнеспособным вариантом для подключения гораздо большего числа устройств к серверам, расположенным на краю сети (оконечные серверы, серверы краевых вычислений), и этот вариант активно продвигается телекоммуникационными компаниями, поставщиками облачных услуг и производителями ИС.

Возникает потребность в действительно высоких возможностях подключения – ​до миллиона устройств на квадратный километр. Формируются децентрализованные «облака», в которых данные передаются в ближайшие центры обработки данных (ЦОД), т. е. парадигма сдвигается в сторону микроЦОД.

Наряду с развертыванием средств и сетей связи 5G появляется стремление сократить объем данных за счет отсеивания ненужных данных от полезной информации. Лучше всего осуществлять это в непосредственной близости от источника данных, для чего нужны значительные ресурсы искусственного интеллекта в краевых вычислениях и на оконечных устройствах, особенно в критически важных (в том числе с точки зрения безопасности) приложениях, где данные необходимо очищать гораздо более тщательно, чтобы не потерять важную информацию. После этого данные можно обрабатывать локально или удаленно и хранить там, где это имеет смысл.

С точки зрения чистой экономики хранения, централизованное «облако» почти всегда обеспечивает наилучший результат. Однако для оптимизации работы «облака» необходимо максимально сократить число этапов передачи данных – ​чем их больше, тем больше время ожидания и финансовые издержки (пользование сетями не бесплатно). Так что в некоторых случаях размещение ЦОД ближе к пользователю имеет немалый коммерческий смысл. «Облака» необходимы для приложений с интенсивными вычислениями, таких как алгоритмы обучения или фармацевтические исследования, но в то же время обладают определенными недостатками с точки зрения времени ожидания и конфиденциальности. С другой стороны, производительность краевых (оконечных) устройств постоянно и существенно улучшается, поскольку при их проектировании и производстве все шире используются специализированные элементы обработки данных и разнородные (гетерогенные) конструкции, что снижает необходимость отправлять все без исключения данные в удаленный ЦОД.

Немало различных данных можно обрабатывать ближе к источнику, и притом делать это быстрее. Такая возможность обеспечивается поставщиками СФ-блоков, расширяющих возможности производимых ИС. Постепенно назрела потребность в «мини-облаках» (клаудлетах), которые должны обладать средствами, обеспечивающими определенный уровень обработки и хранения данных. Также у них должно быть подключенное хранилище с малым временем ожидания. Правда, потенциально им, возможно, все равно придется подключаться к «облаку», поэтому есть потребность и в высокоскоростных межсоединениях.

По иронии судьбы первые ЦОД размещались непосредственно у источника данных. Но в течение последнего десятилетия они становились все более централизованными и перекочевывали в «облака», энергоемкость которых так возросла, что теперь зачастую приходится располагать их рядом с электростанциями. Теперь ЦОД снова рассредотачиваются ближе к источникам данных и становятся более разнообразными и независимыми, поскольку многие компании начали настраивать свои решения.

Кроме того, ускоряется развитие технологий нейронных сетей. Появилось множество приложений машинного зрения, таких как распознавание лиц (в камерах видеонаблюдения, у роботов и т. д.), навигация и т. п. Причем, если речь идет о навигации, ей не обязательно быть полностью автономной – ​достаточно помогать обходить объекты, проводить некоторые типы проверок, избегать столкновений.

В последнее время данная тематика вызывает повышенный интерес. По сути, облачные вычисления дезагрегируются и перемещаются в места, не контролируемые поставщиками облачных услуг. Основной движущей силой в этом процессе становятся требования безопасности, а один из краеугольных камней стратегии – ​возможность использовать аттестованные СФ-блоки обеспечения безопасности. Также существует возможность диверсификации обработки, поэтому для разгрузки вычислений будут использоваться разные архитектуры аппаратных команд с открытым исходным кодом (ISA). В настоящее время наблюдается огромный интерес к архитектурам, позволяющим использовать общую память даже удаленно – ​речь идет о новой иерархии вычислений, серверов и технологий, применяемых для перемещения данных между ними и внутри них (см. рисунок).



Источник: Semiconductor Engineering.

Иерархия вычислений, серверов и технологий, применяемых для перемещения данных между

ними и внутри них

* CXL (compute express link) – протокол высокоскоростной связи между процессором и другими устройствами – графическим процессором, вентильной матрицей, программируемой пользователем (FPGA) и памятью.

** CCIX (cache coherent shared virtual memory) – программируемая разделяемая виртуальная память согласованного кэша, протокол, обеспечивающий пересылку данных, хранящихся в кэшах процессоров и ускорителей, между компонентами разных производителей, реализованных по различным архитектурам. Для передачи данных достаточно одного указателя вместо сложной и длительной классической процедуры DMA (прямого доступа к памяти).

*** Туманные вычисления (fog computing) – многослойная модель обеспечения повсеместного доступа к совместно используемому континууму масштабируемых вычислительных ресурсов. Модель облегчает развертывание распределенных, учитывающих временное запаздывание (latency-aware) приложений и служб и состоит из туманных узлов (физических или виртуальных), располагающихся между интеллектуальными оконечными устройствами и централизованными (облачными) сервисами.

**** Легкотуманные вычисления (mist computing) – упрощенная рудиментарная форма туманных вычислений, которая в сетевой структуре находится ближе к ее «краю», приближая слой туманных вычислений к интеллектуальным оконечным устройствам.

В легкотуманных вычислениях используются микрокомпьютеры и микроконтроллеры для передачи данных в узлы туманных вычислений и, возможно, далее в централизованные (облачные) вычислительные сервисы.


Проблемы архитектуры

Одна из больших проблем будет заключаться в синхронизации работы ЦОД и сохранении когерентности данных при передаче на большие расстояния. Это относится как к структуре данных, так и к контенту, который может меняться в зависимости от зеркальных серверов по мере модификации данных. Обычно данные обновляются быстрее в сфере краевых, а не облачных вычислений, и эти изменения могут за доли секунды повлиять на чувствительные к фактору времени рынки, такие как банковское дело или автомобильная электроника.

Идея клаудлетных решений подразделяется на две сферы. Первая охватывает общие применения, для обеспечения достаточной производительности которых приемлемо время ожидания максимум 10 мс. Вторая сфера включает в себя более чувствительные к фактору времени решения (например, промышленная электроника), требующие максимального времени ожидания не более 1 мс.

Кроме того, существует несколько основных проблем, связанных с созданием этих систем и упрощением их использования. Одна из них – ​выяснить, как защитить данные в распределенной сети серверов. Вторая – ​сформировать общую инфраструктуру так, чтобы не приходилось каждый раз создавать все с нуля. Третья проблема заключается в том, чтобы иметь возможность создавать приложения при максимальном использовании базового оборудования, что в основном представляет собой подход, основанный на совместном проектировании программного и аппаратного обеспечения.

Необходимо спланировать эту инфраструктуру на основе интеграции нескольких процессов. При этом можно применять методы параллелизма – ​чтобы зарезервировать огромную вычислительную мощность только для процессов, которые в ней действительно нуждаются. Отрицательным моментом здесь становится перемещение больших объемов данных. Таким образом, необходимо сбалансировать загрузку краевых ресурсов с тем, что обрабатывается в «облаке», то есть не передавать в «облако» бесполезные там данные. Фильтрация может происходить прямо в источнике данных, и для этого не требуются большие вычислительные мощности.


Проблемы безопасности

Облачные ЦОД имеют прочную репутацию безопасных систем, несмотря на то что число атак на них неуклонно растет. Но для распределенных «облаков» проблема потенциально намного хуже.

Преимущество распределения данных заключается в том, что они перемещаются ближе к конечному пользователю. Сокращается время ожидания, что критично для приложений, работающих в реальном масштабе времени. Но как только система дезагрегируется, возникает проблема согласования нескольких устройств с разными уровнями безопасности. Из-за этого увеличивается вероятность успеха вредоносных атак. Некоторые из таких систем также имеют проблемы с конфигурацией, а многие направления атак связаны именно с неправильной конфигурацией и элементарными ошибками. Распределение данных увеличивает поверхность атаки, растет риск того, что злоумышленник найдет уязвимость. Кроме того, из-за разнообразия подходов и средств у каждой компании есть свой способ решения конкретных проблем, и при формировании «мини-облака» все это необходимо объединить в управляемую цепочку с едиными ПО и стандартами.

С другой стороны, ценность децентрализованных данных ниже, поэтому взлом мини-облачного хранилища менее выгоден, хотя и более доступен. Кроме того, хотя меньшие части более уязвимы, существуют возможности повысить уровень их безопасности. Таким образом, при использовании клаудлетов провайдеры мини-облачных решений – ​от локальных ИТ-отделов до удаленных ЦОД – ​должны будут пойти на некоторые компромиссы, связанные с безопасностью. Поскольку приложение может потребовать распределения данных по соображениям производительности, целью должно быть повышение уровня безопасности путем закреп-ления безопасного решения на используемом аппаратном обеспечении. Обеспечение безопасности локально хранимых данных, а также обмена данными имеет большое значение и применимо как к «мини-облакам», так и к ЦОД. В обоих случаях требуются одни и те же методики, начиная с корня доверия и заканчивая безопасностью сетевого протокола. Если «мини-облака» будут работать в более доступной среде, уровни защиты действительно придется повысить.


Связь

Значительную роль в этом контексте будут играть сети и средства связи 5G. Однако эта роль может сильно варьироваться в зависимости от региона. В США предполагаемые варианты использования 5G в основном связаны с автоматизацией промышленных предприятий и автомобилей. Один из таких вариантов касается использования микросотовых чипсетов для управления и мониторинга деятельности промышленных роботов. И хотя большинство из них стационарны, время ожидания имеет решающее значение. Другой пример – ​использование средств и сетей связи 5G для автоматизации производства, позволяющее отказаться от сетей Ethernet. Это выгодно – ​установка одного Ethernet-подключения на заводе может стоить до 1 тыс. долл., а стоимость точки подключения 5G намного ниже. Как следствие, стоимость развертывания средств ИИ снижается, они становятся более гибкими, а время модернизации и перенастройки сокращается.

У 5G есть и другие преимущества – ​аппаратное обеспечение этого стандарта беспроводной связи не создает помехи Wi-Fi-системам, в отличие от многих промышленных установок, в ходе работы которых возникает электрическая дуга.

В настоящее время наблюдается огромный интерес к архитектурам, позволяющим ЦОД совместно использовать память между системами, даже удаленно. Это, например, относится к протоколу CXL. Также растет использование оптических каналов – ​для экономии электроэнергии, избыточное потребление которой представляет собой большую проблему ЦОД.


Заключение

Есть две тенденции, на которые стоит обратить внимание с точки зрения использования распределенных «облаков». Одна из них связана с расширением вычислительных возможностей на краю сетей или ближе к нему. Все больше вычислений смещается от оконечных устройств к краевым ЦОД, что может существенно повлиять как на полезность данных, так и на то, кто владеет этими данными и имеет к ним доступ.

Вторая – ​это стремление поставщиков облачных услуг к созданию еще более быстрых систем, чему способствуют как использование оптических соединений внутри вычислительных модулей, так и развитие квантовых вычислений. Производительность очень больших вычислительно-ресурсоемких приложений может быть повышена на порядки, что еще больше отличает облачные вычисления от краевых. Однако на дальнейшее развитие облачной бизнес-модели в течение следующего десятилетия может повлиять то, где именно обрабатывается большая часть данных.

Независимо от того, как будут развиваться описанные тенденции, вычислительная иерархия снова меняется. Исторический опыт показывает, что каждый раз, когда подобное происходит (как уже происходило при появлении мини-компьютеров, персональных компьютеров, сетей и смартфонов), это оказывает значительное влияние на всю цепочку поставок полупроводниковых приборов. Новый этап развития отрасли только начинается, но его последствия будут ощущаться по всему миру.


Sperling Ed. From Cloud to Cloudlets. Semiconductor Engineering, August 17, 2020: https://semiengineering.com/from-cloud-to-cloudlets/ 


МНЕНИЕ ЭКСПЕРТА

Николай Харитонов

Мы живем в мире, где технологии должны быть всегда готовы отвечать вызовам бизнеса. Объемы данных постоянно растут, и у компаний появляется необходимость в решениях, которые могут стать альтернативой традиционным дата-центрам, требующим серьезных инвестиций и длительного развертывания. Здесь на помощь приходят новые решения, которые позволяют хранить данные в «облаке» или небольших дата-центрах, оснащенных необходимой для работы ИТ инфраструктурой.

Микро-дата-центры особенно привлекательны для малого и среднего бизнеса. Для таких компаний ряд зарубежных и российских производителей выпускают комплексные решения, куда включено все необходимое оборудование для организации ИТ-инфраструктуры. Также микроцентры обработки данных можно быстро и недорого масштабировать в региональных отделениях компаний, например в банковской или телекоммуникационной сферах.

Микроцентры обработки данных сочетают в себе системы бесперебойного питания, охлаждения, мониторинга и удаленного управления, подобранные с учетом требований компаний.


ЧИТАЙТЕ ТАКЖЕ

Выпуск 22(6746) от 11 ноября 2021 г. г.
Выпуск 21(6745) от 28 октября 2021 г. г.