В ноябре прошло главное событие года, посвященное машинному обучению и искусственному интеллекту — Sberbank Data Science Day. Это мероприятие стало крупнейшим на территории России, СНГ и Восточной Европы, на нем выступили ведущие эксперты в области исследования данных, а кульминацией стало награждение финалистов соревнования по интеллектуальному анализу данных с применением передовых математических методов и алгоритмов с призовым фондом в два миллиона рублей. «Лента.ру» рассказывает зачем проводить подобные мероприятия и как о нем отзываются участники.
До того, как подвести итоги и собрать более 2000 посетителей на Sberbank Data Science Day было проведено соревнование по интеллектуальному анализу данных Sberbank Data Science Journey, в течение которого организаторы получили около семи тысяч решений от участников из 21 страны, при это 688 из них было вполне работоспособными вопросно-ответными системами готовыми к использованию в прикладных задачах. Главной темой мероприятия стали диалоговые системы на базе машинного обучения и технологий искусственного интеллекта, которые смогут естественно отвечать на вопросы по написанному тексту.
Первый заместитель председателя правления Сбербанка Лев Хасис отметил, что по сравнению с прошлым годом количество заявок на мероприятие выросло с 1179 до 3424. Общий объем полученных решений составляет 10 терабайт. Вместе с этим, в прошлом году, в задаче анализа карточных транзакций поведения клиентов (данные были обезличены и модифицированы), принимали участие представители всего трех стран. Призовой фонд составил два миллиона рублей, что также выделяет это соревнование на фоне остальных.
«В этом году мы сконцентрировались на системах искусственного интеллекта в области работы с естественной речью это понимание смыслов и так называемые диалоговые агенты», — добавил Хасис.
Но зачем вообще проводить подобные масштабные мероприятия с приглашением именитых ученых? Такие встречи играют на руку молодым талантливым специалистам, которые, после окончания университета,могут определиться с правильным выбором.. В случае со Sberbank Data Science Journey, победители соревнования сразу же получили предложения о работе в Сбербанке, так как компания постоянно пытается привлекать молодых разработчиков, интересующихся тематикой анализа данных, машинного обучения и искусственного интеллекта.
По условиям конкурса, требовалось решить две задачи разной степени сложности — определить релевантность вопроса и построить вопрос-ответную систему. Для решения первой задачи было отправлено 5,5 тысяч решений от 290 участников. Победителем стал Александр Желубенков за что в качестве приза получил 200 тысяч рублей
Вторая задача была гораздо сложнее. По словам руководителя академии технологии данных Корпоративного университета и управляющего директора Центра развития компетенций по исследованию данных Сбербанка Андрея Чертока, главная идея заключалась в создании русскоязычного аналога SQuAD (Stanford Question Answering Dataset), с целью обучения диалоговых агентов. Другими словами, нужно было собрать набор русскоязычных текстов на свободную и банковскую тематику с примерами вопросов. Участники соревнований должны были разработать алгоритмы, которые, проанализировав предоставленный текст, могли бы естественным образом отвечать на вопросы по «прочитанному» материалу.
«Задача состояла в построении вопросно-ответной системы. Мы создали русскоязычный Dataset, чтобы тренировать такие системы», — добавил Черток. В общей сложности свои решения подготовили 120 участников и было отправлено 1348 решений.
Главного приза Sberbank Data Science Contest в размере одного миллиона рублей удостоился Дмитрий Умеренков. Первые попытки применить нейронные сети для анализа текста он начал в феврале этого года, и отсутствие стереотипов в этой области знаний позволило ему нестандартно подойти к решению задачи. Интереснее то, что по словам Дмитрия проблемы распознавания текста он начал изучать лишь в сентябре.
Также отметил, что несмотря на сложность второй задачи, в ней гораздо проще занять первое место: «Для того чтобы решить задачу А, нужно обладать знаниями, которые накапливались три-четыре года. Что касается задачи B, то все решения, которые в ней используются, это все наработки нынешнего года. Чтобы влиться в эту проблемную область, нужно существенно меньше времени. Она может быть сложнее, но она физически меньше».
Говоря о перспективах, которые ждут призеров, можно обратиться к прошлогодним примерам. Так, победитель SDSJ в 2016 году Дмитрий Афанасьев начал работу в проекте iPavlov, созданному благодаря совместной работе НТИ, Сбербанка и МФТИ. Руководитель проекта Михаил Бурцев во время своего выступления на Sberbank Data Science Day отметил, что практически во всех областях человеческой деятельности происходит революция, связанная с обработкой разнородных данных.
«В ближайшем будущем большинство систем машинного распознавания образов станут совместимы с обработкой 3D/4D-данных. Анализ движений человека, выражений лиц, обработка медицинских данных таких как КТ или МРТ, размещение полок в магазинах розничной торговли или складах, обработка данных дистанционного зондирования Земли и тому подобное — всё это требует передовых методов обработки 3D/4D данных», — заключил Бурцев.
Важной частью Sberbank Data Science Day было выступление экспертов. Так, в один день выступили Нэйт Кушнер из MIT и Microsoft, Александр Тужилин из Нью-Йоркского университета, профессор факультета компьютерных наук НИУ ВШЭ Дмитрий Ветров и другие специалисты. Немаловажной частью стала и панельная дискуссия, на которой поднималась тема перспективы использования ИИ и того, как технологии изменят наше будущее.
При этом на встрече обсуждали не только пространные темы, вроде какие профессии вымрут в ближайшее время и как должно осуществляться госрегулирование искуственного интеллекта, но и более прикладные вещи. К примеру, активная дискуссия поднялась во время разговора о беспилотных автомобилях и сроках их появления в России. Руководитель Prisma Labs Алексей Моисеенков выразил надежду, что массово они появятся в течение пяти-десяти лет и все зависит лишь от автопроизводителей, а не конкретной страны: «Я знаю большое количество компаний, которые не просто верят в это, а уже запускают. Никто 11-12 лет назад не подозревал, что начнется массовый выпуск телефонов с сенсорным экраном и также рассуждали, что это наступит лишь через 10-15 лет. Здесь примерно также».
«Безусловно нужно учитывать региональный аспект. Тот же стиль вождения в Калифорнии и Москве разный. Но более важный аспект — это рост инфраструктуры. Без соответствующей инфраструктуры в городах автономные автомобили не будут распространены. Технически задача уже во многих частных случаях решена, а у нас нет инфраструктуры. Ее развитие не должно отставать от развития автономных автомобилей», — отметил руководитель VisionLabs Александр Ханин.
Подобного мнения придерживаются руководитель Rubble Никита Блинов и основатель Ntech Lab Артем Кукаренко. Они подчеркнули, что людям свойственно переоценивать краткосрочные перспективы и недооценивать средне- и долгосрочные перспективы. Таким образом, уже сейчас компании запускают беспилотные такси. При этом серьезных проблем с тем, что многие люди из-за этого могут лишиться работы возникнуть не должно, считают участники дискуссии.
***
Data Science Day — далеко не обычный хакатон или встреча клуба по интересам. Это важнейшее мероприятие для молодых специалистов. Даже если участнику не удалось одержать победу в соревновании, он получает огромное количество знаний и проявляет себя перед потенциальным работодателем. Таких конкурсантов на SDSJ отмечают эксклюзивными зелеными худи с символикой мероприятия.
Особенно ценны выступления экспертов, которые рассказывают о всех нюансах отрасли и делятся опытом в решении сложных задач. А с учетом популярности ИИ и его повсеместном применении, нужда в толковых «технарях» растет небывалыми темпами. Посему и популярность подобных конференций будет увеличиваться.
«Чтобы привлечь в нашу команду лучших, мы работаем с ведущими вузами страны, проводим хакатоны, вкладываемся в развитие академической и прикладной науки. Мы открыты к обмену знаниями и опытом», — заключил старший вице-президент Сбербанка Александр Ведяхин.