Вопросы развития краевых вычислений
Рынок средств краевых вычислений находится в интересном положении – ни одна компания не доминирует на нем и не будет доминировать в обозримом будущем. Преимущество краевых вычислений – огромное число ниш, связанных с узкими вертикально-организованными рынками. Скорее всего, так и останется на долгие годы. Это и хорошо и плохо для полупроводниковых фирм – в зависимости от того, какое место они занимают в экосистеме и от их способности адаптироваться к постоянно меняющимся условиям.
В некоторых секторах полупроводниковой промышленности, в том числе у поставщиков инструментальных САПР, производственного оборудования, СФ-блоков, средств безопасности и аналитики данных, продажи растут. Другие поставщики могут столкнуться с сокращением контролируемой доли рынка, т. к. стоимость проектирования ИС с использованием минимальных проектных норм стремительно растет, а рынки конечного потребления, на которые ориентированы эти ИС, продолжают фрагментироваться. Таким образом, вместо того чтобы получать прибыль за счет продажи миллионов или миллиардов приборов, компаниям придется существенно увеличивать гибкость и конкурировать в сфере краевых вычислений за меньшие объемы поставок ИС в условиях, когда явных победителей пока нет.
Все это привело к ряду затруднений.
Наиболее прибыльным для поставщиков ИС всегда было проектирование ИС для серверов, смартфонов и автопроизводителей. Однако системные интеграторы, такие как корпорации Google, Facebook, Apple, а также крупные автомобильные ОЕМ (Volkswagen, BMW), в настоящее время предпочитают разрабатывать собственные ИС, стремясь использовать преимущества собственных алгоритмов искусственного интеллекта, машинного и глубокого обучения или программного обеспечения. Это заставляет традиционных изготовителей ИС соперничать в области проектирования ускорителей и управляющих логических приборов, что приводит к значительному снижению средних продажных цен.
Рынки средств краевых вычислений становятся все более узкими, особенно с учетом того, что в приборы добавляются интеллектуальные возможности для конкретных решений. Для максимизации эксплуатационных характеристик и энергоэффективности требуется совместное проектирование аппаратного и программного обеспечения, но это, в свою очередь, затрудняет разработку единой очень сложной «системы-на-кристалле», предназначенной для использования на рынках.
Внедрение средств краевых вычислений совпало с замедлением действия т. н. «закона Мура» и ростом стоимости разработок SoC, подстроенных под требования заказчика. Соответственно, увеличивается важность разработки базовых платформ, ориентированных на несколько применений, что также требует наличия чиплетови других СФ-блоков от различных поставщиков. В свою очередь, это приводит к снижению прибыли и изменению бизнес-модели.
Краевые вычисления и средства их реализации представляют собой точку перехода микроэлектронной промышленности в новое состояние. Этот переход обусловлен взрывным ростом объемов данных, повсеместным внедрением ИИ и высокой стоимостью отправных данных для облачных вычислений с точки зрения объемов используемой памяти и потребляемой мощности. Для небольших фирм, ищущих точку опоры, это открывает новые возможности.
Однако подобные новые рыночные окна будут открываться и закрываться быстрее, а сроки выхода на рынок – сокращаться.
В целом рынок ИС можно разделить на четыре основные области: облачные и краевые вычисления, краевые приборы и встроенные ускорители. Каждая из этих областей имеет свою специфику, но все связаны с потоками данных.
Представители корпорации Synopsys отмечают, что при выборе СФ-блоков их клиенты исходят из разных соображений. Это касается ускорителей облачных и краевых вычислений, ускорителей краевых приборов и встроенных ускорителей, которые могут быть мобильными приборами с ИИ, расширяющим возможности мобильного прикладного процессора. Примерно то же самое происходит в автомобильной промышленности. Использование разнообразных инноваций в ускорителях ИИ направлено в основном на ускорение работы прикладных процессоров.
Здесь возникает множество проблем, поскольку средства связи, автомобильная электроника и т. п. – это совершенно разные рынки. Автопроизводители пытаются создавать собственные нейронные сети. Разработчики, ориентированные на голосовое управление, пытаются использовать рекуррентные нейронные сети и узлы маломощных датчиков. Производители краевых приборов работают с наиболее перспективными технологиями, такими как спайковые нейронные сети (SNN), отличающиеся высокой плотностью и действующие наподобие человеческого мозга. Разработчики камер сосредотачиваются на технологиях распознавания лиц – этого им вполне достаточно, их основная цель – снижение стоимости. Устройства считывания номерных знаков автомобилей в настоящее время значительно упростились – в этом случае речь идет о потребляемой мощности и стоимости, а не об улучшении алгоритмов.
Определение краевых вычислений
Краевые вычисления можно определить как пятую волну развития приборов с вычислительными возможностями. Первой волной были персональные компьютеры, где основное внимание уделялось вычислительной мощности. Это был мир миллионов приборов с большими дорогими процессорами. Вторая волна характеризовалась возможностью подключаемости, что на порядок увеличило продажи приборов с новыми архитектурами наборов команд (ISA). Затем произошла революция мобильности, увеличившая продажи приборов с вычислительными возможностями еще на два порядка. При этом продолжалась миниатюризация приборов, сопровождаемая ростом давления цен. Четвертая волна, связанная с развертыванием Интернета вещей, добавит еще десятки миллиардов приборов, ключевая особенность здесь – сочетание размера, стоимости и потреб-ляемой мощности. В отличие от предыдущей волны, основное внимание уделяется тому, какой объем данных можно передавать и как далеко. Если нет необходимости ни в больших объемах данных, ни в их передаче на большие расстояния, то они должны быть доступны при малом времени ожидания с низкой задержкой. Это очень разные проблемы с трафиком.
Пятая волна связана с конвергенцией искусственного интеллекта, 5G и Интернета вещей как определяющих технологий. Простое создание десятков миллиардов недорогих устройств с отправкой всего объема их данных в «облако» неприемлемо. Перемещение больших объемов данных приводит к слишком большому времени ожидания для многих приложений даже при наличии самой быстродействующей инфраструктуры связи и обработки данных. Кроме того, растет озабоченность относительно конфиденциальности при обмене личными данными.
Все это, в свою очередь, способствовало стремлению перенести обработку данных ближе к источнику их генерации. Но достижение требуемого повышения производительности часто ограничивается емкостью источников вторичного электропитания (таких как аккумуляторные батареи) или малым балансом мощности. Соответственно, требуется фундаментальное переосмысление всего процесса проектирования. И поскольку данные теперь хранятся на приборах краевых вычислений, то помимо очистки и структурирования данных возникает потребность в больших возможностях обеспечения безопасности, чем в случае простых приборов Интернета вещей. В этой «триаде» оконечных (краевых) приборов, краевых, туманных и облачных вычислений и хранилищ требуется найти золотую середину (рис. 1).
Источник: Rambus
Рисунок 1. Золотая середина: еще не определена и не разработана
Проблемы проектирования
Одна из главных проблем для конкурирующих в этой области полупроводниковых компаний – убедить потенциальных клиентов в том, что их решение лучше, чем у конкурентов. Обычно для этого требуется сравнение производительности и мощности, но такие метрики работают лишь тогда, когда одно и то же ПО может быть запущено на разных системах. Например, для определения быстродействия ПК используются те же ресурсоемкие приложения. Это работает при сравнении графических процессоров, микроконтроллеров и вентильных матриц, программируемых пользователем (FPGA). Но в приложениях с высокой целевой направленностью варианты использования могут быть радикально различными, и для этих вариантов использования показатели необходимо настраивать.
Отношение пикоджоулей потребляемой мощности к операции умножения с накоплением просто говорит о том, насколько хорошо выполняются вычисления на умножителе или сумматоре. Но дело в том, что большая часть энергии тратится на перемещение данных с места на место. С этой точки зрения краевые вычисления действительно поддерживают архитектуру, в которой данные не перемещаются, а обрабатываются локально.
Например, корпорация Maxim Integrated недавно создала ускоритель сверточной нейронной сети с использованием 40-нм процесса для снижения затрат. Это не готовое решение, доступное на рынке, – ускоритель спроектирован с нуля именно для ускорения CNN. В свободной продаже действительно имеются средства нейронной помощи микроконтроллеру, отличающиеся несколько большим параллелизмом операций, но им по-прежнему требуется возможность получения данных и хранения промежуточных результатов, т. е. дополнительная периферия. Это основополагающая архитектура. В то же время кристалл ускорителя Maxim Integrated содержит ядро Arm Cortex M4 с флэш-памятью и СОЗУ, которые в основном предназначены для управления системой. Большая часть кристалла – это большое периферийное устройство, ускоритель нейронной сети. При загрузке весовые коэффициенты и другие параметры конфигурации загружаются из флэш-памяти в виртуальную память (weight memory), встроенную в ускоритель нейронной сети, которая определяет их приоритет. В результате достигается производительность на несколько порядков выше, а энергопотреб-ление меньше, чем у микроконтроллера общего назначения. Это другой подход к проектированию. Отмечается, что CNN используются в основном для распознавания изображений и видео, а также при обработке естественного языка. Но даже это намного шире, чем возможности некоторых других приложений, и именно здесь экономика проектирования кристаллов ИС начинает становиться проблематичной – и потенциально гораздо более интересной с точки зрения проектирования. Специалисты отмечают, что такие приложения машинного обучения, как идентификация объекта, существенно выигрывают от использования краевых вычислений (рис. 2).
Источник: Maxim Integrated
Рисунок 2. Приложения машинного обучения, такие как идентификация объекта, выигрывают от использования краевых вычислений
Продолжение статьи читайте в следующем выпуске.
Sperling Ed. Winners and Losers at the Edge. Semiconductor Engineering, July 1, 2020: https://semiengineering.com/winners-and-losers-at-the-edge/