В России запустили новую версию бенчмарка больших языковых моделей

Альянс в сфере ИИ представил новую версию бенчмарка MERA

Альянс в сфере искусственного интеллекта представил новую версию бенчмарка MERA: в нее вошли динамический лидерборд, обновленная кодовая база замеров, более совершенная система промптов и улучшенные датасеты, поддержка API, а также замеры десятков новых моделей, включая созданные OpenAI. Об этом говорится в сообщении на официальном сайте альянса.

Обновленная версия бенчмарка включает в себя 15 основных задач, из которых строится рейтинг, и восемь открытых публичных датасетов.

MERA (Multimodal Evaluation for Russian-language Architectures) — это независимый открытый бенчмарк для оценки фундаментальных моделей русского языка, совместно разработанный на площадке альянса в сфере искусственного интеллекта исследователями от индустрии — командами Сбера и MTS AI, а также академическими партнерами Skoltech AI и НИУ ВШЭ.

С момента релиза первой версии бенчмарка им воспользовались десятки разработчиков моделей, отправивших свыше 1000 сабмитов. Совершенствование MERA стало возможно благодаря комментариям пользователей и обратной связи от участников NLP-сообщества. Дальнейшее развитие MERA предусматривает появление в нем задач для оценки распознавания изображений, аудио- и видеоматериалов.

В России запустили новую версию бенчмарка больших языковых моделей

Минобороны России сделало заявление после атаки ВСУ на регион в 1500 километрах от Украины

Назван размер средней пенсии в России

Врач развеяла миф о кофе натощак

Власти Ленобласти высказались о разливе нефти в Финском заливе

Российский бизнесмен решил сжечь подчиненного вместе с семьей

В Израиле заявили о риске усиления Ирана из-за одного решения Трампа

США сняли санкции с преемника Мадуро

Роднина рассказала о разнице между россиянами и американцами

Давшая ВС России преимущество у Константиновки внезапность повергла в шок командование ВСУ

Истребитель США не смог перехватить иранский БПЛА и попал на видео