ВЫБОР РЕДАКЦИИ

Перспективы развития микроконтроллеров с краевым искусственным интеллектом

Проблемы разработки программно-управляемого аппаратного обеспечения

Искусственный интеллект – перспективы развития

Наступление эры искусственного интеллекта реального масштаба времени

Искусственный интеллект и увеличение интереса к краевым вычислениям

Бесшовная связь – становой хребет Четвертой промышленной революции

Использование биометрии в Сухопутных войсках США

Вопросы развития краевых вычислений

Машинное обучение открывает новые возможности FPGA

Материалы Симпозиума SEMI по промышленной политике

Современное состояние и перспективы развития рынка САПР

Teraki совершает «квантовый скачок» в сфере больших данных

Бум стартапов во Франции

Материалы Симпозиума SEMI по промышленной политике

Вопросы развития краевых вычислений

Экономические аспекты развития технологий искусственного интеллекта

О перспективах рынка потребительской электроники

Средства искусственного интеллекта учатся распознавать звуки

Превосходство КНР в области искусственного интеллекта: правда или миф?

Некоторые проблемы развития памяти с высокой пропускной способностью

Искусственный интеллект и технология распознавания лиц

Искусственный интеллект и технология распознавания лиц

Выпуск 18(6692) от 12 сентября 2019 г.
РУБРИКА: УПРАВЛЕНИЕ И БЕЗОПАСНОСТЬ

Искусственный интеллект давно стал одной из самых обсуждаемых тем. В какой области он найдет свое первое массовое применение? Один из ответов – ​системы распознавания лиц. Эта технология все шире используется в развитых странах, в частности в Великобритании. При этом возникает ряд правовых и этических проблем – ​таких как распознавание лиц пассажиров и работников транспорта, осуществляемое без их ведома.


Станет ли распознавание лиц первым «захватчиком рынка» искусственного интеллекта?

При каждой новой смене технологической парадигмы требуется новый «захватчик рынка» (или, иначе, «убийственное применение»). Для искусственного интеллекта (ИИ) таким «захватчиком» может стать технология распознавания лиц. Основным применением распознавания лиц на основе глубокого изучения в настоящее время стали системы безопасности и контроля доступа. Разрабатываются и уже поступили в продажу более совершенные решения – ​такие как робот Sped, опытно-экспериментальная модель робота-помощника по покупкам, распознающего лица с целью определения пола и возраста клиента и на основании этого формулирующего рекомендации. Осуществление подобных операций возможно только при использовании ИИ в рамках технологий краевых вычислений – ​связь с «облаком» существенно замедляет процесс.

Недавно в Университете штата Вашингтон (г. Сиэтл) был проведен конкурс MegaFace Challenge, посвященный алгоритмам распознавания лиц. Лидером по итогам конкурса стала корпорация CyberLink (г. Тайбэй, Тайвань).


Высокопроизводительное распознавание лиц с использованием краевых вычислений

Конкурс MegaFace Challenge представлял собой серию эталонных тестов, проверяющих алгоритмы распознавания лиц различных разработчиков на больших наборах обучающих данных. Фотографии знаменитостей и людей с экстремальными возрастными различиями размещались в выборках, содержащих от 10 до 1,0 млн «отвлекающих факторов», к которым относились фотографии других лиц, а также объектов, которые при обучении ИИ были неправильно определены как лица.

Конкуренция была жесткой: алгоритмы корпораций Google, Tencent и ряда других на небольших наборах данных достигали точности идентификации около 90%. Но по мере увеличения отвлекающих факторов они работали все хуже и хуже. В результате механизм распознавания лиц FaceMe AI (основанный на алгоритме SphereFace) обошел механизмы FaceNet v8 от Google и SIATMMLAB от TencentVision, показав точность распознавания 98,4% на больших наборах данных. При этом FaceMe AI работает с технологией краевых вычислений.

FaceMe AI – ​это кроссплатформенный SDK-комплект, ориентированный на специалистов по распознаванию лиц, способный анализировать такие атрибуты, как возраст, пол и эмоции. Его нейронная сеть была предварительно обучена работе с большими базами изображений. Кроме того, он совместим с такими структурами, как TensorFlow и Core ML, что позволяет разработчикам интегрировать в FaceMe AI свои собственные данные обучения.

После обучения полученный механизм формирования логического вывода объединяется с алгоритмами предварительной обработки, которые сжимают его до 4 Мбайт. Эти алгоритмы также обеспечивают совместимость SDK с периферийными системами – ​от мобильных приборов до цифровых вывесок на основе Linux и решений для ПК с ОС Windows. Такой уровень совместимости аппаратного и программного обеспечения означает, что SDK FaceMe AI применим для интеллектуального наблюдения за городом, интеллектуального розничного маркетинга, персонализированных роботов умного дома.

В настоящее время большинство решений распознавания лиц таких разработчиков, как AWS, Google и Microsoft, работают с использованием «облака». В некоторых сценариях (например, системах допуска) облачное распознавание лиц неоптимально – ​приходится ждать 20–30 с для того, чтобы изображение или видео были загружены в «облако» и пришел ответ на локальное устройство.

FaceMe AI оптимизирован для приборов, работающих с краевыми вычислениями. К ним относятся ПК, мобильные устройства (сотовые телефоны с ОС Windows, iOS, Android), центральные и графические процессоры. В среде FaceMe AI можно настраивать различные параметры – ​размер захвата лица (в пикселах), частота смены кадров, коэффициент ложного доступа.

Некоторые системы распознавания лиц требуют меньшего времени реакции, повышенной точности, возможности захвата большего или меньшего числа изображений лиц одновременно. FaceMe AI позволяет разработчикам адаптировать свои алгоритмы так, чтобы использовать меньше вычислительной мощности (в случае мобильных приложений), сократить время ожидания (умный дверной замок) или захватывать одновременно больше изображений (интеллектуальное наблюдение за городом).


Ускоренное распознавание на нескольких платформах

При обеспечении совместимости механизмов формирования логического вывода с различными краевыми процессорами и операционными системами SDK FaceMe AI полагаются на такие технологии, как инструментальные средства OpenVINO корпорации Intel. OpenVINO Toolkit – ​инструментальное средство разработки, оптимизирующее алгоритмы формирования логических выводов на основе компьютерного зрения для использования в центральных и графических процессорах, вентильных матрицах, программируемых пользователем (FPGA), и ускорителях машинного обучения, таких как блоки обработки данных визуального распознавания (VPU) Movidius корпорации Intel (рис. 1).



Источник: Intel

Рисунок 1. Структура набора инструментов OpenVINO корпорации Intel для оптимизации механизма распознавания лиц FaceMe, используемого в различных нейронных сетевых процессорах и ускорителях

* OpenCV (Open Source Computer Vision Library) – библиотека алгоритмов компьютерного зрения, обработки

изображений и численных алгоритмов общего назначения с открытым кодом.

** OpenVX – открытый, бесплатный лицензионный стандарт для кроссплатформенного ускорения приложений

компьютерного зрения.

*** OpenCL (Open Computing Lanquage) – открытый стандарт параллельного программирования гетерогенных систем.


Для работы с нейронными сетями уже создано большое число инструментальных средств и механизмов формирования логических выводов. SDK FaceMe AI по сути может выступать по отношению к ним преобразователем данных. Одной из хороших платформ объединения в единый SDK для такого большого числа компонентов представляется набор инструментальных средств OpenVINO корпорации Intel.

При оснащении OpenVINO алгоритмами на основе FaceMe AI скорость распознавания лиц может быть увеличена на 500%. В то же время FaceMe AI сохраняет точность определения пола на 98%, а эмоций – ​до 86%. При этом средняя ошибка определения возраста составляет 5,8 года.


«Убийственное» ИИ-приложение – ​уже реальность

Возможность масштабирования производительности и использования энергии на различных платформах означает, что технология распознавания лиц может получить намного большее распространение, чем раньше. Легкость переноса SDK FaceMe AI подразумевает, что разработчики могут повторно использовать прикладные компоненты в своих средах разработки в целях ускорения развертывания собственных решений.

Обладая доступом к технологии распознавания лиц, по точности конкурирующей с решениями технологических гигантов, специалисты в области ИИ теперь могут создать коммерчески жизнеспособные средства распознавания лиц с непосредственным использованием краевых вычислений. Со временем это позволит повысить точность розничного маркетинга, усовершенствовать средства наблюдения и контроль доступа, а также создать роботов, выполняющих правдоподобные человеческие взаимодействия [1].


Практическое применение на примере Великобритании

В Лондоне проводятся испытания технологии распознавания лиц, причем сфера ее применения варьируется от несерьезных (в пивных барах) до более важных областей, таких как отслеживание пассажиров поездов.

Технологии распознавания лиц преследуют жителей Великобритании практически повсеместно, в силу чего привлекают большое внимание. Недавно был разработан бар, оборудованный технологией распознавания лиц, а пассажиры поездов и сотрудники на крупном лондонском вокзале отслеживаются системой распознавания лиц без их ведома.

Внедрение таких технологий становится все проще – ​недавно корпорация Amazon объявила о добавлении «страха» к эмоциям, обнаруживаемым с помощью программного обеспечения Rekognition. Помимо этого была повышена точность гендерной идентификации, точность оценки возрастного диапазона и точность определения семи эмоций: «счастье», «грусть», «злость», «удивление», «отвращение», «спокойствие», «растерянность». Технология не требует иметь опыт машинного обучения, что теоретически означает, что любой может добавить анализ распознавания лиц в свою систему. Все, что для этого нужно – ​отправлять изображения или видео в свой интерфейс прикладного программирования (API), и Amazon идентифицирует объекты и людей, обеспечит распознавание лиц и анализ. Более того, он учится на всех данных, поступающих в его систему.


Искусственный интеллект помогает избежать очереди при заказе пива в оживленном баре

В одном из популярных пабов Лондона недавно была протестирована система распознавания лиц. Цель – ​создать динамичную и продуманную очередь. Как говорится в пресс-релизе фирмы DataSparq, разработавшей систему, новая технология исключит резкое увеличение длины очередей в барах и пабах. Считается, что самое большое неудобство для посетителей британских пабов – ​люди, толкающиеся перед ними в ожидании возможности заказать напитки: более трех четвертей опрошенных британцев покидают переполненные бары из-за долгого времени ожидания.

Опрос 2000 посетителей британских пивных баров, проведенный по заказу DataSparq, показал, что почти две трети останутся в пабе и закажут пиво, если будут точно знать, сколько им ждать подачи. Вот почему компания разработала панель ИИ, которая, по ее словам, дает клиентам эту ясность.

Что же делает панель ИИ с распознаванием лиц? В переполненном баре она позволяет выполнить заказ быстрее и точнее, идентифицируя лица и затем помещая их в интеллектуальную виртуальную очередь. ИИ также будет выполнять более быстрые проверки идентификаторов – ​если кто-то выглядит несовершеннолетним, система предложит ему ввести идентификатор, прежде чем он достигнет начала очереди.



Источник: DataSparq

Рисунок. 2. Барная стойка с искусственным интеллектом, испытанная фирмой DataSparq в одном из баров Лондона


Дополнительные функциональные возможности, которые в настоящее время разрабатываются, включают возможность для клиентов переупорядочивать свои напитки, находясь в очереди. Система запоминает заказы посетителей и реагирует на простые жесты, обозначающие изменения. Еще одна функция (FaceTab) будет включать механизм, визуально добавляющий людей на вкладку панели. Упорядочить эту вкладку могут только определенные лица. ИИ-панель будет предлагаться как SaaS-продукт и работать с использованием стандартной веб-камеры, дисплея и подключения к Интернету.

Нововведение вызвало в Лондоне большой интерес. Представители DataSparq сообщают, что испытания в баре – ​это просто техническая репетиция, поставки реального продукта начнутся через месяц-другой. Уже заключены контракты с компаниями по производству напитков и владельцами пабов, чтобы развернуть технологию по всей Великобритании в течение следующих 12 месяцев. Система может быть установлена в любом месте и легко масштабируется – ​поэтому ожидается, что после установки в барах она будет развертываться на многолюдных музыкальных фестивалях и не только.

DataSparq начала разработку решения в мае 2019 г., используя целый набор доступных на рынке инструментов для обнаружения, распознавания и анализа лиц. Необходимо было принять решение, какие данные следует отправлять в «облако», а что обрабатывать локально. Большинство данных продукт DataSparq обрабатывает именно локально. Причина в том, что время отклика должно быть малым – ​необходимо оперативно реагировать на запросы клиентов в баре. Сам по себе API распознавания лиц обладает высоким быстродействием, но сравнение лиц занимает больше времени, потому что изображения отправляются в «облако». В следующем поколении решений данного типа предполагается перейти к краевым вычислениям. Система подключается к локальному серверу, получая данные со стандартной веб-камеры и используя всего три интерфейса – ​USB-вход, Ethernet-соединение и HDMI-выход. Что касается защиты личности пользователя, то данные после закрытия не сохраняются, т. е. система распознает и сравнивает лица в течение одного конкретного дня.


Отслеживание клиентов и работников на станции Кингс-Кросс

Иногда распознавание лиц вызывает споры. Так, на одной из самых оживленных железнодорожных станций Лондона, Кингс-Кросс, для отслеживания посетителей «во имя обеспечения общественной безопасности» используется система распознавания лиц. Это немаловажная проблема – ​на данном участке расположены лондонские центры разработки Facebook, Google и Samsung. Через станцию ежегодно проходит 176 млн человек.

Как сообщила группа по гражданским свободам Big Brother Watch, удалось идентифицировать камеру на станции, оснащенную встроенной расширенной функцией распознавания образов и самообучающейся видеоаналитикой с разрешением до 16 Мп. Исследователи технологий распознавания лиц сообщили Financial Times, что это тревожное событие для тех, кто не хочет участвовать в данных испытаниях, поскольку у них нет возможности отказаться от прогулок по Лондону или поездок на работу. Возникает вопрос: «Почему такое оборудование вообще испытывается, если эта технология является предметом судебного иска и члены парламента призывают ввести на нее мораторий?»

В начале 2019 г. в Лондоне мужчина был остановлен и оштрафован на 90 фунтов из-за того, что он закрыл лицо, чтобы избежать сканирования во время процесса распознавания лиц, проводимого местной полицией в общественном месте. По словам борцов за гражданские права, в этом человеке не было ничего подозрительного, он просто использовал свое право не подвергаться проверке с помощью камер.

Жители Великобритании за много лет уже привыкли к системам слежения во всех общественных местах – ​они были основным средством определения перемещений и идентификации террористов-смертников, причастных к взрывам в лондонском метро 7 июля 2005 г., а также использовались во многих других громких полицейских расследованиях, осуществленных с тех пор. Это означает, что камеры есть везде и британская публика воспринимает их как часть повседневной жизни. Но технологии распознавания лиц постоянно развиваются и скоро станут настолько точными, что «Большой Брат» будет не только всегда наблюдать за гражданами, но также знать об их эмоциях и чувствах. А возможно, кто-то даже станет жертвой ошибочного определения личности.

Возможно, ИИ, ускоряющий работу бара, – ​позитивная тенденция, но массовое применение его на станциях уже сейчас вызывает обеспокоенность многих горожан [2].


Lewis Brandon. Is Facial Recognition AI’s First «Killer App»? Insight tech. June 18, 2019: https://www.insight.tech/ai/is-facial-recognition-ai-s-first-killer-app?cid=em&source= elo&campid=iotg_WW_iotgsa_EMNL_EN_2019_Aug20_insight.tech_eng_C-MKA-3558_ T-MKA-13068&content=iotg_WW_iotgsa_EMNL_EN_2019_Aug20_insight.tech_eng_C-MKA- 3558_T-MKA-13068&elq_cid=46828&em_id=49545&elqrid= bd131be7c814478e86c00420e7b60920&elqcampid=32194&erpm_id=5128022&elqTrackId= e0a1f8aaff754100a2ee48a4b7f5d450&elq=bd131be7c814478e86c00420e7b60920&elqaid= 49545&elqat=1&elqCampaignId


В ЦЕНТРЕ ВНИМАНИЯ

CyberLink

Дата основания : 1996 г.
Количество сотрудников: 700 чел. (2013 г.).
Штабквартира: г. Новый Тайбэй, Тайвань.
Годовой доход: Валовая прибыль 1,896 млрд тайваньских долл. (2016 г.).

Компания владеет более чем 200 запатентованными технологиями, позволяющими развивать мультимедийный опыт и последовательно разрабатывать инновационные и совместимые решения.

Основная продукция:

системы редактирования видео и плагины;

системы фоторедактирования;

веб-камеры;

системы управления мультимедиа;

устройства записи и резервного копирования;

оборудование для делового общения;

мобильные приложения.


Новейшая разработка – ​FaceMe

Средство FaceMe, созданное с использованием технологий глубокого обучения, обеспечивает надежное, высокоточное распознавание лиц в режиме реального времени для приложений Интернета вещей, оснащенных искусственным интеллектом. Эти приложения используются в интеллектуальной розничной торговле, банковском деле, системах общественной безопасности и частной жизни. FaceMe входит в число самых точных алгоритмов в мире. Совместим с платформами Windows, Linux, Android и iOS и может работать на нескольких аппаратных конфигурациях, от мощных рабочих станций до небольших устройств с низким энергопотреблением. Запоминает до 106 ключевых точек лица, позволяя разработчикам создавать анимированные 3D-модели.


ЧИТАЙТЕ ТАКЖЕ

Выпуск 12(6686) от 20 июня 2019 г. г.
Выпуск 2(6726) от 28 января 2021 г. г.