«Яндекс» разработал решение для бизнеса по снижению стоимости внедрения ИИ

«Яндекс» разработал решение для экономии на внедрении нейросетей до восьми раз

Фото: Екатерина Якель / «Лента.ру»

Команда Yandex Research совместно с исследователями из Института науки и технологий Австрии (ISTA) и Научно-технологического университета имени короля Абдаллы в Саудовской Аравии (KAUST) разработала и опубликовала новые методы сжатия больших языковых моделей. Как отмечается, они помогут бизнесу сократить расходы на вычислительные ресурсы до восьми раз.

Решение компании включает два инструмента. Первый позволяет получить уменьшенную до восьми раз нейросеть. Второй инструмент исправляет ошибки, которые возникают в процессе сжатия большой языковой модели.

Новые методы сжатия нейросетей уже доступны для применения. Специалисты также могут скачать уже сжатые с помощью новых методов популярные модели с открытым исходным кодом. Кроме того, исследователи Yandex Research выложили обучающие материалы, которые помогут разработчикам дообучить уменьшенные нейросети под свои сценарии.

Научная статья Yandex Research о методе сжатия AQLM была включена в программу конференции ICML. Статья была подготовлена совместно с исследователями из Института науки и технологий Австрии (ISTA) и экспертами ИИ-стартапа Neural Magic.

Лента добра деактивирована.
Добро пожаловать в реальный мир.
Бонусы за ваши реакции на Lenta.ru
Как это работает?
Читайте
Погружайтесь в увлекательные статьи, новости и материалы на Lenta.ru
Оценивайте
Выражайте свои эмоции к материалам с помощью реакций
Получайте бонусы
Накапливайте их и обменивайте на скидки до 99%
Узнать больше