Американская компания Netflix, предоставляющая услуги видеопроката, назвала победителя в конкурсе по улучшению алгоритмов рекомендательной системы. Приз в миллион долларов достался международной команде BellKor’s Pragmatic Chaos. Учредители конкурса остались так довольны его результатами, что уже объявили о начале следующего. Об этом пишет The New York Times.
Узнайте больше в полной версии ➞Компания Netflix является крупнейшим видеопрокатчиком в США, предоставляя услуги 10 миллионам американцев. Клиенты заказывают диски с фильмами через веб-сайт компании и получают их по почте, а также могут смотреть передачи онлайн. Чтобы увеличить объем заказов, Netflix применяет рекомендательную систему Cinematch. Эта система предлагает клиентам новые фильмы, основываясь на их мнении об уже просмотренных.
В 2006 году Netflix объявил о начале конкурса с призовым фондом в миллион долларов. Победитель должен был улучшить качество предсказаний Cinematch как минимум на 10 процентов. Для этого участникам конкурса предложили набор данных из 100 миллионов оценок, которые пол-миллиона пользователей Netflix выставили почти 20 тысячам кинофильмов. На основе этих данных составлялись рекомендации, которые сравнивались с реальными оценками новых фильмов, выставленными зрителями позже.
За три года конкурса в нем участвовало более 40 тысяч команд из 186 стран мира. Но преодолеть 10-процентный барьер смогли только две команды - BellKor's Pragmatic Chaos из семи участников и Ensemble, состоящая из 30 человек. Их показатели оказались практически равны (на 10,6 процента лучше Cinematch), и победителя определила 20-минутная разница во времени подачи итоговых результатов.
В состав команды-победителя BellKor’s Pragmatic Chaos входят семь человек - специалисты по статистике, искусственному интеллекту и компьютерные инженеры из США, Австрии, Канады и Израиля. Лидер команды, исследователь из AT&T Крис Волински (Chris Volinsky), считает, что конкурс показал эффективность совместной работы. Выиграть позволило только смешение различных статистических методов и технологий машинного обучения, которые предлагали различные участники команды, говорит Крис.
Компания Netflix довольна результатами конкурса и уже объявила о начале следующего. На этот раз соревнующимся предложат расширенный набор данных - 100 миллионов записей о клиентах компании, включая возраст, пол, место жительства и данные о предыдущих заказах. В отличие от первого конкурса, конкретной цели не названо. Команда, лидирующая по качеству рекомендаций через 6 месяцев, получит 500 тысяч долларов, а лидер по прошествии 18 месяцев - другие 500 тысяч.