Интернет и СМИ
00:13, 29 октября 2021

Лицом к лицу. Как технологии распознавания лиц сделают мир безопаснее и изменят жизнь человечества?

Как технологии распознавания лиц сделают мир безопаснее и изменят жизнь человечества
Алексей Глинкин (Редактор отдела «Интернет и СМИ»)

Убийц и грабителей ловят за считаные секунды; чтобы поставить диагноз, врачу можно просто сфотографировать пациента; студентам больше не нужно сдавать экзамены — умные камеры в аудиториях сами определят, кто недостаточно хорошо изучил материал. Такое будущее пророчат человечеству создатели систем распознавания лиц — специальных камер, которые уже сегодня встречаются почти во всех сферах жизни. С их помощью можно отслеживать преступников, бесконтактно расплачиваться в магазинах и проходить через турникеты в метро. Какие возможности биометрия даст бизнесу, медицине, образованию и как с помощью технологии распознавания лиц мир станет безопаснее и удобнее — «Лента.ру» разбиралась в рамках проекта «КиберРеальность».

Все распознается в сравнении

Начало 1960-х годов. Несколько человек сидят за столом и измеряют линейкой лица на распечатанных фотографиях. Их интересует ширина рта, высота лба и характеристики других черт лица: эти данные нужны, чтобы помочь слабым компьютерам научиться распознавать лица. Если сегодня для обучения искусственного интеллекта достаточно загрузить в него миллионы фотографий, то у американских ученых Вуди Бледсо, Хелен Чен Вульф и Чарльза Биссона такой возможности попросту не было.

На заре создания технологии распознавания лиц процесс обучения программы длился долго. Чтобы ускорить его, ученые обзавелись специальным электронным графическим планшетом — одним из первых в своем роде. С его помощью Бледсо определял координаты черт лица — это в разы сокращало время обучения системы.

Разработанный в 60-е алгоритм действительно умел определять человека по фотографии, однако технология была далека от совершенства: машину легко могла сбить с толку улыбка или признаки старения.

Все изменилось, когда наработками ученых заинтересовались американские власти. В 1967 году они предложили Бледсо и инженеру-исследователю Питеру Харту разработать систему, с помощью которой полицейские могли бы быстрее сверять фото потенциальных преступников со снимками в своей базе данных. В итоге ученые создали две программы, которые уже тогда в разы превосходили человека по скорости: машина справлялась за три минуты с задачей, на которую у полицейского уходило шесть часов. Правда, широкая общественность узнала о достижениях Бледсо и Харта лишь недавно — до 2005 года информация об их исследовании была засекречена.

Позже японцу Такео Канадэ удалось вычеркнуть из процесса человеческое вмешательство и автоматизировать распознавание лиц, а исследователи Майкл Кирби и Лоуренс Сирович помогли программе справиться с идентификацией человека на разных фотографиях независимо от положения головы и масштабов изображения. Вскоре американцы Мэтью Турк и Алекс Пентланд усовершенствовали этот алгоритм, совместив его с технологией распознавания лиц. С момента появления первых таких систем прошло 60 лет, и технология шагнула намного дальше, чем это можно было представить.

Преступная разгруппировка

2017 год. В не самом криминальном регионе Великобритании — Южном Уэльсе — произошло не самое громкое преступление, но его раскрытие стало вехой в истории распознавания лиц. Оборудованный камерой фургон засек преступника, лицо которого находилось в базе данных правоохранителей. Его арест стал первым случаем задержания преступника благодаря системе распознавания лиц.

Прошло несколько лет, и уже мало кого удивляет, что с помощью этой технологии можно искать правонарушителей внутри страны, защищать границы государств и даже предотвращать теракты. В той же Великобритании для проверки посетителей массовых мероприятий используют камеры с умными алгоритмами: рядом со входом устанавливают специально оборудованный фургон с датчиками на крыше. Они сканируют лица проходящих людей и сверяют полученные снимки с базой данных преступников и правонарушителей. Как только система замечает в толпе человека из базы, она быстро оповещает об этом полицейских. Столицу Великобритании Лондон вообще называют рекордсменом по количеству камер наружного наблюдения: в 2019 году их было более 420 тысяч.

Немало умных камер и в США. 19 из 24 правительственных агентств США так или иначе уже используют систему распознавания лиц. Например, в министерствах энергетики и обороны применяют систему под названием TacID Guard Dog. Она позволяет определять, кто именно посещал стратегически важные объекты. А министерство внутренней безопасности использует специальную систему для распознавания людей на границах между штатами. ФБР в своих расследованиях нередко опирается на данные, полученные с помощью подобных камер.

В будущем власти США планируют внедрять технологии распознавания лиц практически во все сферы жизни, а желающие скрыться от умных алгоритмов создают специальные карты, на которых отмечают, где появились новые устройства

Рекордсменом по количеству камер, оснащенных умными алгоритмами, стал Китай. В крупных городах страны они развешаны примерно через каждые 100 метров. Считается, что в Поднебесной расположена почти половина всех умных камер мира — около 400 миллионов. Технологию используют не только для поиска преступников, но и для сбора информации, влияющей на социальный рейтинг китайцев, — пока проект работает только в паре пилотных регионов, но если власти признают эксперимент успешным, к нему присоединятся и другие города.

Железнодорожные вокзалы, аэропорты, туристические достопримечательности, выставочные комплексы, парки и офисные здания — камеры в Китае установлены буквально на каждом шагу. Нарушителям порядка не удастся скрыться от правосудия нигде, даже в общественном туалете.

Тем не менее настоящий прорыв в системах распознавания лиц произошел не в далеком Пекине, а в Москве. Все началось с того, что выпускник факультета вычислительной математики и кибернетики МГУ Артем Кухаренко создал приложение для распознавания пород собак. Друзья показали его работу потенциальному инвестору, после чего было решено не ограничиваться собаками, а нацелиться на более перспективный рынок — распознавание человеческих лиц.

Кухаренко основал компанию NtechLab, которая разработала уникальный алгоритм распознавания лиц на основе самообучающихся нейронных сетей. Желая проверить свой уровень, команда отправила алгоритм на престижный конкурс The MegaFace Benchmark в Вашингтонский университет. Неожиданно для всех решение NtechLab признали лучшим, россияне обошли даже такой гигант, как Google. Кухаренко и его команда столкнулись с небывалым ажиотажем: алгоритмом заинтересовались все — инвесторы, потенциальные клиенты, журналисты.

Чтобы показать, на что способен их алгоритм, в 2016 году Кухаренко сделал доступным приложение FindFace для пользователей «ВКонтакте». Оно за секунды находило человека по одной-единственной фотографии в многомиллионной базе пользователей. Более того, алгоритм распознавал его возраст, пол и эмоции. Это еще больше подогрело интерес к NtechLab.

Сейчас технология NtechLab признана Национальным институтом стандартов и технологий США лучшей в мире. Ее преимущество состоит в том, что на поиск по базе данных у программы уходит меньше секунды: за это время искусственный интеллект успевает сверить изображение с миллиардом лиц.

В отрасли долго гадали, кому достанется уникальное решение российских разработчиков. В 2017 году стало известно, что технология взята на вооружение властями Москвы: решение NtechLab по распознаванию лиц внедрили в городскую систему видеонаблюдения. Тогда сеть состояла из 160 тысяч видеокамер — ими были оборудованы 95 процентов подъездов жилых домов города.

13,5
миллиона
— столько камер видеонаблюдения, по подсчетам TelecomDaily, было в России в 2020 году. На каждую тысячу россиян приходится почти 100 камер наблюдения

В будущем систему распознавания лиц установят на уличные камеры в каждом российском городе. Глава МВД России Владимир Колокольцев считает, что эффективно бороться с преступностью можно только с использованием высоких технологий. Внедрение алгоритма уже дало плоды: во время тестирования в Татарстане система помогла полицейским Альметьевска задержать 11 человек. Куда масштабнее оказались результаты работы программы во время чемпионата мира по футболу в 2018 году: тогда она позволила задержать более 180 человек, внесенных в базы правонарушителей.

Несколько сотен граждан, находившихся в федеральном розыске, поймали благодаря камерам в московском метро. Всего за полгода, начиная с сентября 2020-го, система помогла обнаружить 800 преступников. Полицейские получали уведомление о подозрительных людях в подземке всего через три секунды после того, как камеры их опознавали.

В будущем ловить преступников станет еще удобнее. Уже существуют специальные очки со встроенными умными камерами, которые разработала китайская компания LLVision Technology Co. Когда владелец очков смотрит на человека, алгоритмы сверяют лицо его визави с базой данных — на обработку требуется около двух минут. Новинка уже помогает полиции: если очки замечают разыскиваемых преступников, правоохранители моментально получают уведомление. Только за полторы недели тестирования устройства очки помогли задержать более 30 нарушителей.

Похожую технологию придумали и в России. Московские полицейские еще с 2019 года тестируют портативные камеры-видеорегистраторы с функцией распознавания лиц от NtechLab. Устройства умеют опознавать людей на дистанции от 3,5 до 4,5 метра. В департаменте информационных технологий Москвы добавляют, что взяли на вооружение и идею с очками. Разрабатывать программу будет NtechLab, поэтому российский аналог потратит на проверку личности секунду, а не несколько минут.

«Просто подари мне один только взгляд»

Когда-то технологии распознавания лиц были засекреченным правительственным проектом, а сегодня их можно встретить во множестве бытовых сфер. Камеры, позволяющие платить с помощью лица, есть в банках, магазинах и ресторанах. Тем, кто пользуется биометрической идентификацией, больше не нужно запоминать пин-коды, показывать документы и прикасаться к грязным поверхностям — последнее стало особенно актуально во время пандемии.

Первой систему оплаты «по лицу» во время пандемии протестировала сеть супермаркетов «Лента». Вскоре технологию решила внедрить и в торговых точках X5 Group. Теперь платить взглядом можно в 150 супермаркетах «Перекрестка» и «Пятерочки».

Расплатиться лицом можно и в ресторанах. Например, в сети быстрого питания KFC, которая запустила в России проект «Ресторан будущего». Чтобы получить заказ, клиенту достаточно посмотреть в камеру. Правда, предварительно нужно зарегистрироваться в специальном приложении и сделать селфи — именно с ним будет сравниваться лицо посетителя. В Китае подобные терминалы уже не удивляют местных жителей — магазины и рестораны крупных городов давно принимают оплату взглядом.

От необходимости помнить пин-коды избавились и клиенты некоторых российских банков. В 2019 году системы распознавания лиц от российской компании VisionLabs начали использоваться в банкоматах Сбера и «Тинькофф». Пилотный проект, связанный с биометрической идентификацией, запустил и банк ВТБ.

К гадалке не ходи

Будущее уже наступило, считают ведущие аналитики в области распознавания лиц. «Глубина проникновения технологии в разных отраслях настолько велика, что трудно представить, где она не применяется или существуют какие-то ограничения по ее использованию», — рассказывает Владимир Борисов, директор департамента решений на базе искусственного интеллекта компании Oberon, одного из крупнейших в России IT-поставщиков для ретейла.

Биометрическая идентификация по лицу уже применяется практически во всех отраслях, соглашается директор по продуктам NtechLab Денис Гришин. Однако системам распознавания лиц еще предстоит завоевать многие сферы. К примеру, умными камерами уже заинтересовались продуктовые магазины: алгоритмы помогают им защищаться от краж и контролировать недобросовестных сотрудников. Для этого используются специальные системы, которые оповещают охрану, если видят человека из черного списка. Гришин уверяет, что использование технологии способно ежегодно уменьшать денежные потери магазина на два-три процента.

Кроме того, по его словам, распознавание лиц может служить альтернативой пластиковой карте лояльности. Магазины будут узнавать VIP-клиентов не в момент оплаты, а уже на входе.

В планах российских властей — внедрить системы распознавания лиц в школах. Камеры сделают так, что учителя и ученики смогут войти на территорию только после того, как подтвердят свою личность, посмотрев в объектив. Если предложение о внедрении лицевой биометрии примут, первое время система будет работать только в тех школах, где родители учеников и учителя дадут на это согласие.

Продвинутые алгоритмы могут даже считывать эмоции учеников и определять степень их заинтересованности на занятиях. Такие камеры уже плотно вошли в систему образования Китая. Технологию еще в 2016 году разработал китайский профессор Вэй Сяоюн. В китайском Ханчжоу используют специальную систему, алгоритмы которой помогают следить за успеваемостью и посещаемостью учащихся, а также анализируют поведение детей. «Система достаточно продвинутая для того, чтобы уловить едва различимые выражения лиц школьников. Ее можно использовать для анализа поведения всего класса», — оценил один из руководителей местной школы.

Открой рот и посмотри в камеру

Медик Омар Абдул-Рахман догадывался, что его трехлетний пациент может страдать серьезным генетическим заболеванием. Семья мальчика не могла потратить тысячи долларов на различные тесты, поэтому врач предложил загрузить его фотографию в приложение Face2Gene и проверить результат. Программа поставила ребенку диагноз синдром Мовата-Вильсона, который позже подтвердился специальным анализом. Алгоритм позволил родителям пациента избежать огромных расходов, а медикам — сразу же начать лечение, не тратя время на длительную диагностику.

Некоторые болезни система распознавания лиц научилась определять лучше настоящих врачей. Согласно исследованию, опубликованному в журнале Natural в 2019 году, алгоритм глубокого обучения DeepGestalt, на котором работает медицинское приложение Face2Gene, превосходит медиков в диагностике синдрома Нунана — редкой врожденной патологии. Алгоритм делал правильный выбор в девяти случаях из десяти.

В основе приложение Face2Gene — нейросеть, поэтому сервис непрерывно улучшает сам себя: чем больше в него загружают фотографий, тем лучше алгоритм обучается. В базе Face2Gene сотни тысяч фото, благодаря которым приложение постоянно совершенствуется и ставит диагнозы точнее

«Это похоже на поиск в Google. Такое сравнение не выглядит надуманным благодаря большому количеству правильно поставленных диагнозов и простоте использования приложения», — сказала соавтор исследования Карен Грипп.

Системой распознавания лиц пользуется и Московский международный онкологический центр: здесь внедрили разработку VisionLabs, созданную в партнерстве с NWA Digital. Алгоритмы идентифицируют посетителей и сотрудников по биометрическим данным и помогают с навигацией по территории объекта. По словам гендиректора VisionLabs Дмитрия Маркова, система прокладывает для пациента маршрут и дает интерактивные подсказки, которые помогают не заблудиться.

В скором времени медицину ждет еще одно новшество, обещает Денис Гришин из NtechLab: у врачей появятся специальные компактные устройства, которые будут распознавать лица пациентов и показывать специалистам их медицинские карты с историями болезни и диагнозами.

Город-сказка, город-мечта

Разработки в области распознавания лиц уже зарекомендовали себя в разных сферах. Но что будет, если объединить их хотя бы в пределах одного города? Получится умный мегаполис будущего — место, в котором жители чувствуют себя в безопасности. Убийцы, грабители и насильники не могут затеряться в толпе — полицейские отследят их передвижение. Нетрезвые водители не садятся за руль, потому что встроенная в автомобиль камера реагирует на изменение лица и не позволит запустить двигатель. Потерявшиеся люди и животные не исчезают бесследно, а само понятие «несчастный случай» превратится в анахронизм. В прошлом останутся паспорта и прочие удостоверения — зачем они нужны, если подтвердить личность можно с помощью лица?

Эксперты уверены: сделать мир таким смогут системы распознавания лиц. По словам Владимира Борисова из Oberon, именно с их помощью город будущего станет более безопасным. Примером того, как умные технологии меняют жизнь, он назвал уже привычные уличные видеокамеры, которые распознают преступников и немедленно оповещают об их действиях полицию.

Алгоритмы можно использовать и на дорогах. Камеры смогут собирать данные, благодаря которым дорожное движение станет более безопасным. К примеру, умные системы определят места, в которых люди перебегают дорогу, и там появятся пешеходные переходы, «лежачие полицейские», островки безопасности или ограничение скорости — это поможет предотвратить множество трагедий.

Распознавание лиц в будущем сможет выручать и в других чрезвычайных ситуациях, добавляет гендиректор VisionLabs Марков. Умные камеры придут на помощь, если человеку, потерявшему документы, нужно срочно подтвердить личность. Кроме того, биометрическая идентификация облегчит жизнь в бытовом плане: удостоверения личности, ключи и транспортные карты попросту станут не нужны.

Системы распознавания лиц помогут справиться и с другими непредвиденными ситуациями, отмечает Гришин из NtechLab. Например, если на многолюдном мероприятии — например, концерте — кому-то станет плохо или начнется давка, умный алгоритм моментально среагирует и вызовет помощь.

Без права на ошибку

В то же время многие скептики не до конца доверяют современным алгоритмам. Они уверены, что камеру легко обмануть — достаточно замаскироваться, чтобы остаться незамеченным. Их беспокоят возможные ошибки — что, если система примет одного человека за другого?

Однако специалисты считают опасения неоправданными. Еще три года назад очки или кепка снижали точность распознавания всего на три процента, отмечает основатель NtechLab Артем Кухаренко. Современные системы распознавания лиц почти невозможно обмануть, соглашается с ним Владимир Борисов из Oberon.

«В стандартный функционал включено распознавание человека в маске и очках. На основе этого строятся определенные алгоритмы работы таких систем», — объясняет он.

Директор по продуктам NtechLab Денис Гришин добавляет, что на миллион распознаваний приходится всего одна ошибка. При этом неточности заключаются в том, что система скорее пропустит разыскиваемого, чем сработает положительно в отношении кого-то другого.

Для идентификации по лицу алгоритм использует несколько нейронных сетей. Одна из них детектирует лицо на фотографии или на видео, другая — извлекает биометрический шаблон, а прочие работают с атрибутами (пол, возраст, очки, борода и прочее). По таким признакам можно осуществлять быстрый поиск в базах данных, например — найти все лица в очках. За каждый из атрибутов отвечает конкретная нейронная сеть, причем все они работают параллельно.

Процессы распознавания лиц обычного и замаскировавшегося человека практически не отличаются, подтверждает глава VisionLabs Марков. Система видит лицо, находит ключевые точки и формирует дескриптор, то есть биометрический шаблон. При этом макияж или головной убор абсолютно не мешают алгоритму. Изменить или закрыть сразу все точки, которые использует для своей работы алгоритм, попросту невозможно.

***
Системам распознавания лиц еще только предстоит стать для людей обыденностью вроде интернета, хотя первые эксперименты в обеих областях начались почти параллельно. С момента, когда американцу Бледсо приходилось линейкой замерять лица, до появления умных систем распознавания прошло немало времени — 60 лет. Людям еще предстояло изобрести мощные компьютеры и скоростные каналы связи, чтобы эта технология заработала. Но когда умные камеры стали реальностью, человечество в короткий срок превратило их в инструмент, который способен решать многие насущные проблемы.

Чтобы оценить масштабы того, как технология меняет мир, не нужны прогнозы футурологов: разработчики систем распознавания лиц уже добились многого. Умные камеры проникли практически во все сферы частной, предпринимательской и государственной жизни. И это неудивительно: биометрическая идентификация делает жизнь не только проще, но и безопаснее.

< Назад в рубрику