Среди больших языковых моделей искусственного интеллекта GigaChat от Сбера находится в одной весовой категории с китайской DeepSeek. Об этом в интервью изданию «Коммерсантъ» рассказал первый заместитель председателя правления Сбербанка Александр Ведяхин.
Узнайте больше в полной версии ➞«Мы, конечно, протестировали модель DeepSeek и сравнили ее с моделью GigaChat. DeepSeek превзошла нашу модель по некоторым тестам (но не всем), но мы определенно находимся в одной весовой категории среди больших языковых моделей, — заявил топ-менеджер. — Мы также ограничены в объеме вычислительных ресурсов и, следуя подходу китайских коллег, намерены сфокусироваться на оптимизации процесса обучения моделей, стремясь получать лучшие метрики с меньшими затратами».
По словам Александра Ведяхина, появление DeepSeek — «большой плюс для всего рынка, эта модель лучше подавляющего большинства аналогов с открытым кодом, и это очень круто».
«Появление такой модели на рынке подчеркивает важность развития открытых решений. Сбер и сам уже давно и активно публикует различные модели генеративного искусственного интеллекта. В открытый доступ выложены все модели линейки Kandinsky, базовая модель GigaChat Lite, семейство акустических моделей для русского языка GigaAM, которые находятся "под капотом" нашего сервиса GigaChat», — добавил Александр Ведяхин.