Ученые МГУ объявили о планах обучить нейронную сеть определять правильность идентификации растений, а также создать «Атлас флоры России» и «Чеклист флоры России». Работа будет проведена в рамках проекта «Ноев ковчег», предусматривающего создание цифрового гербария. Об этом сообщается в статье, опубликованной в журнале Taxon.
Коллекция Гербария МГУ насчитывает свыше миллиона образцов растений. В 2015-м началась работа по ее оцифровке, и за три года в электронный вид было переведено 900 тысяч записей, включающих в себя изображение самого растения, а также тексты оригинальных этикеток и географические координаты мест сбора растений. При этом используются алгоритмы, определяющие место сбора растения, сопоставляющие имя ботаника с датой обнаружения растения или группирующие растения по текстовому описанию места на этикетке.
«В ближайшем будущем благодаря технологиям машинного обучения и нейронным сетям мы получим возможность автоматически проверять правильность идентификации коллекций сухих растений. Технологии машинного обучения будут основаны на уже созданных и верифицированных библиотеках с изображениями сухих растений», — говорит автор статьи, ведущий научный сотрудник биологического факультета МГУ Алексей Серегин.
Собранная в рамках проекта база данных гербарных образцов поможет при создании «Атласа флоры России» и «Чеклиста флоры России». Атлас будет содержать сведения о распространении растений на территории страны, для него нужны данные и других российских гербариев, в том числе тех, которые пока не оцифрованы. «Чеклист флоры России» представляет собой стандартный перечень всех видов российской флоры, его можно составить на основе «Цифрового гербария МГУ» уже через два-три года. Оба проекта важны для документации и научного анализа разнообразия растений России и сохранения редких видов.