13 сентября в Москве пройдет пятая международная конференция Big Data Conference, на которой соберется более 350 участников, включая технических специалистов, представителей бизнеса и молодых ученых. В рамках мероприятия будут обсуждаться все главные тренды и достижения в сфере работы с «большими данными». «Лента.ру» рассказывает о мероприятии и о том, как искусственные интеллекты управляют нашими жизнями.
С самого начала стоит объяснить, что же такое Big Data, или же «большие данные», потому что за последние годы об этом говорят практически все. Формальное определение — это огромные объемы структурированных или неструктурированных данных и их значительного многообразия. При этом четкого определения, когда обычные «данные» становятся «большими», не существует. Условно, «большими данными» называют поток свыше 100 гигабайт в день. Отличным примером больших данных является информация, поступаемая с Большого адронного коллайдера.
Но сейчас под «большими данными» понимают и различные инструменты для обработки этого массива информации. В структурированном виде эта информация позволяет решать огромное количество научных и бизнес-задач. Собственно, это понятие и появилось, когда в сети ежедневно начало появляться гигантское количество информации и стало возможно эту информацию обрабатывать (хотя способы обработки были известны гораздо раньше).
Этот социально-экономический феномен затрагивает практически каждого жителя Земли. Буквально все, с чем работает человек, собирает о нем информацию: соцсети, смартфоны, поисковики, магазины, терминалы и многое другое, о чем вы даже не догадываетесь. По данным аналитиков, в 2015 году глобальное количество данных превысило 6,5 зеттабайта (6 500 000 000 000 гигабайт), когда в 2003 году их было всего 5 эксабайт (в 1 300 раз меньше). К 2020 году это количество увеличится до 40-44 зеттабайтов, а к 2025 — в 10 раз больше. При этом большую их часть будут генерировать уже предприятия, а не пользователи.
Магазины одежды используют сложные компьютерные предсказательные программы, чтобы с точностью, превосходящей все попытки мерчандайзеров, определить, какие именно товары будут пользоваться спросом в каждой конкретной точке продаж, существенно снижая расходы на складские запасы и на логистику. Супермаркеты с точностью 95 процентов знают, что купит каждый из покупателей при походе в магазин, и их задача, заставить покупать больше. Правительство города не только знает, где и когда будет пик заболеваемости ОРВИ или пик рождаемости, но и с высокой точностью может предсказать, кто и как будет голосовать на выборах. Множество программ, предсказывающих поведение по имеющимся большим данным, становятся неотъемлемой частью мира вокруг.
Несмотря на то что о Big Data много говорят, мало кто понимает, как это работает. Тем не менее, все больше людей осваивают технологии анализа данных, работают над конкретными кейсами и приносят ощутимую пользу бизнесу. Именно для них организуются профильные конференции, где встречаются люди из совершенно разных сфер, чтобы поделиться своим опытом. На Big Data Conference, организаторами которой являются Global Innovation Labs и Rusbase, в пятый раз пройдет демонстрация лучших российских практик по анализу больших данных. Отмечается, что показаны будут только те кейсы, которые раньше нигде не публиковались и впервые прозвучат для широкой публики.
Конференция разделена на три блока: Бизнес, Технологии и Наука. Таким образом тем, кто хочет узнать лишь об исследованиях и технических подробностях новых методов анализа, не придется слушать о бизнес-кейсах. Либо же, наоборот, слушатель может узнать о результатах внедрения технологий на предприятие, не вникая в технические подробности. В рамках бизнес-трека выступят предприниматели, менеджеры по развитию, CDO и маркетологи. В техническом блоке специалисты и data scientisits поделятся опытом создания воспроизводимых технических решений для реализации тех или иных бизнес-задач. На научном треке с докладами выступят ученые, чьи исследования будут опубликованы в Journal of Physics.
Всего запланировано 45 выступлений, по 15 на каждый из блоков. Среди участников бизнес-трека выступят Евгений Виноградов из Яндекса, ведущий специалист по развитию торговой сети «Лента» Алексей Большухин, Виталий Сагинов из МТС, директор отдела разработки World Class Давид Мелкумян и другие. На техническом треке — Андрей Созыкин из банка «Точка», Олег Катрышев из Driveback, глава DataData Михаил Богданов, Data Scientistв Газпром нефть Алексей Кожевин и другие.
Вместе с этим, на конференции пройдет финал Чемпионата по большим данным с датасетами от партнеров мероприятия. Всего на выбор будет две задачи (хотя можно решить и обе). В одной из них нужно выявить геометрию коронарных сосудов по снимкам МРТ. Участникам чемпионата будет представлено около 700 неразмеченных и 30 размеченных имиджей МРТ с изображениями сердца. Датасет представляет из себя 30-кадровые МРТ видеоролики в формате DICOM. Претендовать на призовой фонд в 100 тысяч рублей смогут только те, кто наряду с размеченными изображениями предоставит аннотированный исходный код модели на языке Python, не использующий проприетарных компонентов на условиях, определяемых MIT License, и ссылки на внешние источники данных и библиотеки, использованные при составлении модели.
В рамках решения второй задачи участникам нужно определить игровое событие в спортивных трансляциях. Для победы требуется создать метод автоматического определения игровых событий в трансляциях футбольных матчей, а также определить тип и время события относительно начала матча. Участникам чемпионата будут представлены записи трансляций футбольных матчей с аудиодорожкой и набор данных, которые описывают произошедшие во время игры события, зафиксированные людьми. Условия для победы аналогичны первой задаче, но призовой фонд составляет уже 500 тысяч рублей, и всего может быть три победителя.
Big Data Conference пройдет 13 сентября 2018 года в Москве в Loft Hall #3. Билеты доступны на сайте.