Сбер открыл доступ к Giga-Embeddings и Kandinsky Video Lite

Сбер выложил в открытый доступ модели Giga Embeddings и Kandinsky Video Lite

Фото: Екатерина Якель / «Лента.ру»

Сбер предоставил открытый доступ к обновлённой модели для создания векторных представлений текста Giga-Embeddings и к модели генерации видео Kandinsky Video Lite. Обе разработки распространяются по открытой лицензии, допускающей свободное использование в коммерческих проектах любого масштаба. Об этом сообщил старший вице-президент, руководитель блока «Технологическое развитие» Сбербанка Андрей Белевцев на мероприятии «День ИИ» в Сколково.

«Научная команда Сбера активно публикует различные модели генеративного искусственного интеллекта», — сказал Андрей Белевцев. Он отметил, что в открытом доступе уже представлены модели линейки Kandinsky и семейство акустических моделей для русского языка GigaAM, которые используются в сервисе GigaChat. По его словам, предоставление бизнесу и разработчикам новых инструментов ускоряет исследования и развитие продуктов мирового уровня, а также укрепляет позиции России в технологической сфере.

Kandinsky Video Lite создаёт короткие видеоролики длительностью до десяти секунд по текстовому запросу и содержит около двух миллиардов параметров. По внутренним тестам разработчика, модель по совокупному качеству превосходит более крупные решения, включая Wan 2.1 14B, Wan 2.2 5B и оригинальную Sora, а по визуальному качеству сопоставима с Wan 2.2 A14B, которая больше Kandinsky в тринадцать–четырнадцать раз. При обучении уделялось внимание пониманию отечественного культурного контекста: был сформирован специальный датасет из более чем миллиона изображений и видео, значительная часть которого отбиралась в несколько этапов командой художников и дизайнеров. Также доступна ускоренная версия Kandinsky Video Lite Flash, работающая примерно в шесть раз быстрее базовой.

Giga-Embeddings преобразует текстовую информацию в векторные представления и, по данным Сбера, занимает первое место в общем зачёте бенчмарка ruMTEB с результатом 74.1. Модель предназначена для построения RAG-систем, повышения качества поиска по документам, аналитики данных и автоматизированной поддержки пользователей на актуальной информации.

Модели уже доступны для свободного использования на ведущих платформах. Kandinsky Video Lite размещена на Hugging Face, GitVerse и GitHub. Giga-Embeddings опубликована на Hugging Face и GitVerse.

Лента добра деактивирована.
Добро пожаловать в реальный мир.