Российские исследователи представили работы по обработке языка на EACL 2026: Бизнес: Экономика: Lenta.ru

В Марокко проходит международная конференция по компьютерной лингвистике EACL 2026. Исследователи Сбера из команды SberAI вместе с коллегами представляют на форуме несколько научных работ.

Узнайте больше в полной версии ➞

Одна из них — мультимодальный бенчмарк MERA Multi. Научная работа Multimodal Evaluation of Russian-language Architectures решает задачу с отсутствием методов оценки ИИ в доменах изображений, видео и аудио, учитывающих культурные особенности страны. Проект создан Альянсом в сфере ИИ, в котором также приняли участие специалисты Института AIRI, НИУ ВШЭ, Сколтеха, РТУ МИРЭА и «Т-Технологий».

Также ученые создали первый динамический RAG-бенчмарк для русского языка на основе свежих новостей. Система автоматически формирует граф знаний из актуальных данных, строит вопросно-ответные пары и тем самым исключает человеческий фактор из процесса проверки.

Кроме того, в работе From Standard Transformers to Modern LLMs: Bringing Dialogue Models, RAG, and Agents to the Classroom ученые предложили обновленный курс по трансформерным моделям. В него включены RAG (генерация с поиском), автономные агенты, мультимодальные диалоговые модели. Курс дает практические навыки работы с ИИ-помощником ГигаЧат и знакомит студентов с российскими бенчмарками, такими как MERA, DRAGOn и LIBRA. Статья написана исследователями Сбера совместно с учеными НИУ ВШЭ, Сколтеха и Института AIRI.

Еще одна научная работа, авторами которой стали исследователи SberAI, посвящена безопасности данных. В статье FiMMIA: scaling semantic perturbation-based membership inference across modalities представлен модульный фреймворк, который детектирует утечки данных в мультимодальных больших языковых моделях.

< Назад в рубрику