Тайваньский стартап бросает вызов Google в области технологии распознавания жестов

Тайваньский стартап бросает вызов Google в области технологии распознавания жестов

Выпуск 21 (6695) от 24 октября 2019 г.
РУБРИКА: МИКРОЭЛЕКТРОНИКА

Похоже, что распознавание жестов скоро начнет применяться в смартфонах. Тайваньский стартап KaiKuTek, занимающийся проектированием ИС, собирается стать одним из крупнейших бенефициаров в этой новой категории технологий человеко-машинного интерфейса. Новые системы распознавания жестов используют 60-ГГц радары. При этом, если большинство поставщиков 60-ГГц радарных ИС производят свои приборы с использованием относительно дорогого SiGe-процесса, KaiKuTek намерена задействовать стандартный КМОП-процесс.


Общая ситуация на рынках ИС распознавания лиц, движения и жестов

По данным фирмы Markets and Markets Research, опубликованным в недавнем исследовании «Рынок распознавания лиц по компонентам (программное обеспечение, инструменты и услуги), области применения (распознавание эмоций, отслеживание и мониторинг посещаемости, контроль доступа, правоприменение), вертикально-организованным рынкам и регионам – ​мировой прогноз до 2024 г.» (Facial Recognition Market by Component (Software, Tools, and Services), Application Area (Emotion Recognition, Attendance Tracking and Monitoring, Access Control, Law Enforcement), Vertical, and Region – ​Global Forecast to 2024), объем мирового рынка продаж ИС распознавания лиц вырастет с 3,2 млрд долл. в 2019 г. до 7,0 млрд к 2024-му при совокупном среднегодовом темпе прироста в сложных процентах (CAGR) за этот период в 16,6%. Основные факторы роста рынка – ​увеличение количества пользователей и инициатив по обеспечению безопасности данных со стороны органов государственной власти, широкое использование мобильных устройств и растущий спрос на надежные системы обнаружения и предотвращения мошенничества [1].

По оценкам той же фирмы, опубликованным в исследовании «Рынок датчиков движения по технологиям распознавания движения (инфракрасные, ультразвуковые, микроволновые, двойные и томографические), приложениям (потребительская электроника, автомобильная, аэрокосмическая и оборонная промышленность, здравоохранение и производство) и географическим регионам – ​глобальный прогноз до 2025 г.» (Motion Sensor Market by Motion Technology (IR, Ultrasonic, Microwave, Dual Technology, & Tomographic), Application (Consumer Electronics, Automotive, Aerospace & Defense, Healthcare, & Industrial), and Geography – ​Global Forecast to 2025), объем мирового рынка продаж датчиков движения (включая датчики распознавания жестов) вырастет с 5,7 млрд долл. в 2019 г. до 9,3 млрд в 2025-м при CAGR = 8,3%. Рост рынка датчиков движения обусловлен такими факторами, как высокий спрос на потребительскую электронику, выгодные возможности в развивающихся странах и увеличение расходов на оборону для обновления сопутствующих товаров. Широкое распространение носимой электроники и растущая потребность в коммерциализации Интернета вещей, как ожидается, предоставят богатые возможности роста игрокам на этом рынке [2].


Новые функции человеко-машинного интерфейса в смартфонах

Представители корпорации Google в конце июля 2019 г. заявили, что будут поддерживать в своем следующем смартфоне Pixel 4 две новые функции человеко-машинного интерфейса (HMI) – ​распознавание лиц и распознавание движения. Отмечается, что новые функции в Pixel 4 – ​результат реализации проекта Project Soli группой специалистов фирмы Advanced Technology and Projects (ATAP), которая впервые начала рекламировать свою технологию обнаружения движения в 2015 г. Функция управления жестами (Motion Sense) для Pixel 4 позволяет пользователю переходить от одного приложения к другому с помощью жестов рук, даже не касаясь телефона. Подчеркивается, что это только начало. По мере совершенствования линейки Pixel функция Motion Sense также будет развиваться. Разработки велись с мая 2015 до второй половины 2019 г. Теперь новые возможности будут добавлены в HMI и на рынок выйдут ИС, обеспечивающие эти функции.

Корпорация Google не одинока в подобных работах. Созданная в январе 2017 г. тайваньская фирма KaiKuTek (г. Тайбэй, также известна как Cool Tech), разработала решение для распознавания жестов 3D, основанное на радиолокационной технологии миллиметрового диапазона (60 ГГц). В отличие от продукции некоторых производителей, изготавливающих радары миллиметрового диапазона 60 ГГц с использованием дорогостоящего SiGe-процесса, решение KaiKuTek для распознавания жестов основано на более зрелом и доступном КМОП-процессе.

Однокристальное решение («система-на-кристалле», SoC) фирмы объединяет антенны, состоящие из одного транзистора и трех резисторов (1T3R), и монолитные СВЧ ИС (MMIC). В него также встроен фирменный (проприетарный) ускоритель ИИ. Кристалл смонтирован в усовершенствованный модуль AiP («антенна-в-модуле»).

Утверждается, что прибор способен с высокой точностью распознавать жесты в пределах 30 см, причем его ускоритель ИИ потребляет менее 1 мВт. Схема (см. рисунок) будет официально запущена в серийное производство в следующем году. Одним из ее производителей станет крупнейший в мире кремниевый завод TSMC.



Источник: KaiKuTek

Радиолокационное решение миллиметрового диапазона 60 ГГц от KaiKuTek


В настоящее время около 30 сотрудников KaiKuTek работают в Инкубационном центре проектирования ИС компании Nankang (NKIC, г. Тайбэй), который был создан промышленным бюро Министерства экономики Тайваня и управляется специалистами Научно-исследовательского института промышленных технологий Тайваня (ITRI). Отмечается, что, поскольку Google оснащает Pixel 4 функцией управления жестами, крупным производителям мобильных телефонов также придется добавить подобные функции в следующее поколение своей продукции, чтобы оставаться конкурентоспособными. Соответственно, решение KaiKuTek будет привлекать все большее внимание.

Специалисты KaiKuTek утверждают, что за два года им удалось разработать технологию распознавания жестов, которая по крайней мере соответствует по своим возможностям решению корпорации Google, если не превосходит его. Отмечается, что последняя версия Google для мобильной операционной системы Android Q (бета-версия доступна для загрузки) также включает поддержку функций управления жестами, которые, вероятно, помогут ускорить внедрение технологии распознавания жестов, что приведет к еще большему спросу на подобные функции. Вероятно, мобильный телефон станет для потребителей лучшим инструментом для ознакомления с этим новым HMI. Люди, обладающие опытом использования сенсорных интерфейсов благодаря играм, таким как Angry Birds, окажутся наиболее подготовленными к использованию нового HMI. Когда потребители привыкнут использовать жесты на мобильных телефонах, они смогут расширить применение этого HMI на другие приложения, включая автомобили, игровые приставки, умные дома и т. д.


Зачем нужна технология распознавания жестов?

Возникает вопрос: насколько высока реальная потребность в распознавании жестов в качестве HMI?

На данный момент сенсорный (касательный) интерфейс практически заменил все механические кнопки, а голосовое управление используется для различных функций, включая ответ на входящие вызовы, переключение света, воспроизведение музыки и поиск информации в Интернете. Есть ли явное преимущество у технологии управления жестами? Отметим, что ее нельзя назвать полной заменой сенсорного управления. Использование сенсорного интерфейса для открытия приложений и ответа на вызовы на мобильном телефоне – ​это интуитивно понятный способ управления этими приложениями. Однако во время игры с использованием сенсорного интерфейса тень от пальцев может помешать видеть происходящее на экране. Кроме того, экран влияет на плавность работы, а ограничивать размер экрана при вводе текста в программе обмена мгновенными сообщениями неудобно.

Если же взять умные часы и другие носимые устройства, у которых экраны значительно меньше, чем экраны мобильного телефона, то ограничения сенсорной технологии становятся еще заметнее. Именно там, где сенсорные интерфейсы не могут быть использованы в полной мере, управление жестами имеет преимущество.

Что касается голосового управления, то, хотя оно уже обеспечивает удобство громкой связи, его реальное использование все еще не лишено недостатков. Независимо от того, где находятся пользователи, могут возникать помехи от шума окружающей среды, влияющие на точность. Конфиденциальность также может представлять большую проблему – ​не только когда речь идет о публичных выступлениях, но и в случаях, когда команды должны передаваться в «облако» для обработки.

Отличительная черта 60-ГГц миллиметрового диапазона – ​относительно малая дальность распространения сигнала. Разработчики KaiKuTek превратили этот недостаток в преимущество. Благодаря малой дальности и использованию направленной антенны не возникает взаимных помех с другими приборами, находящимися поблизости.

На реальном дисплее решение KaiKuTek может распознавать тонкие движения запястья, а также движения пальцев. В плане чувствительности задержка практически отсутствует, поскольку процессы распознавания не выполняются на главном процессоре мобильного телефона – ​это область процессора ИИ, благодаря чему разработка KaiKuTek позволяет значительно сэкономить заряд мобильного телефон. Решение KaiKuTek – ​это не только периферийные вычисления, но и вычисления на датчике. Специалисты фирмы полагают, что все рабочие функции можно перевести на управление жестами.


Стратегия диверсификации рынка

Учитывая различные потребности приложений в управлении жестами, KaiKuTek планирует предоставлять индивидуальные решения, которые будут разрабатываться совместно с клиентами. В ближайшем будущем компания намерена начать предлагать обучение распознавания жестов как услугу. Например, разработчики игр могут быть заинтересованы в том, чтобы система распознавала жесты, характерные для их игр, а разработчик программного обеспечения может даже захотеть поддержать способность своих клиентов настраивать жесты.

В ходе подготовки к появлению следующего поколения смартфонов KaiKuTek также рассматривает возможность выпуска аппаратного ключа, позволяющего мобильным телефонам, ноутбукам и другим устройствам, не имеющим встроенного радиолокатора миллиметрового диапазона, поддерживать распознавание жестов, а разработчикам ПО – ​формировать собственные наборы инструментальных средств приложений распознавания жестов.

Специалисты KaiKuTek отмечают, что разработка распознавания жестов – ​непростое дело, требующее опыта. Соответственно, другие фирмы не смогут в ближайшее время легко скопировать их решение. Кроме того, они уверены в перспективности применения технологии 60-ГГц миллиметровых волн [3].


Facial Recognition Market by Component (Software, Tools, and Services), Application Area (Emotion Recognition, Attendance Tracking and Monitoring, Access Control, Law Enforcement), Vertical, and Region – ​Global Forecast to 2024. Markets and Markets Research Private Ltd.: https://www.marketsandmarkets.com/Market-Reports/facial-recognition-market‑995.html?gclid=EAIaIQobChMIvvKKlbf95AIVEamaCh0h6w15EAAYASAAEgKEaPD_BwE

Motion Sensor Market by Motion Technology (IR, Ultrasonic, Microwave, Dual Technology, & Tomographic), Application (Consumer Electronics, Automotive, Aerospace & Defense, Healthcare, & Industrial), and Geography – ​Global Forecast to 2025. Markets and Markets Research Private Ltd.: https://www.marketsandmarkets.com/Market-Reports/Motion-Sensor-Market

Cheng Judith. Taiwan Startup Challenges Google in Gesture Recognition. EE Times magazine, September 22, 2019: https://www.eetimes.com/document.asp?doc_id=1335123


ЧИТАЙТЕ ТАКЖЕ

Выпуск 24/25 (6748/6749) от 23 декабря 2021 г. г.
Выпуск 24/25 (6748/6749) от 23 декабря 2021 г. г.