Модель Kandinsky 5.0 Video Pro заняла первое место среди всех open-source решений на платформе LMArena от исследователей из Калифорнийского университета в Беркли.
Узнайте больше в полной версии ➞Как отметили в Сбере, это означает, что любой разработчик может свободно использовать ее код. Продукт демонстрирует высочайшее качество, сохраняя философию open-source.
Эксперты LMArena поставили модель Pro от Сбера в один ряд с флагманскими продуктами мировых лидеров. Впереди только закрытые модели Veo 3.1 и Veo 3 (Google DeepMind), Sora 2 (OpenAI), Wan 2.5 (Alibaba) и KlingAI (Kling 2.6, Kling 2.5). Kandinsky демонстрирует паритет с решениями Ray 3 от Luma AI и Hailuo 2.3 от MiniMax. Kandinsky 5.0 Video Pro генерирует до 10 секунд HD-видео в 24 fps.
Kandinsky 5.0 Video Lite — компактная модель на два миллиарда параметров. При этом Lite работает лучше первой версии знаменитой Sora от OpenAI. Kandinsky 5.0 Video Lite хорошо знает российский культурный код, нативно понимает запросы как на русском, так и на английском языках и генерирует надписи на латинице и кириллице.
Научное сообщество также высоко оценило работу специалистов Сбера. Подробный технический отчет о разработке Kandinsky 5.0 был опубликован 19 ноября в ходе международной конференции AI Journey («Путешествие в мир искусственного интеллекта»). Документ сразу возглавил рейтинг Daily Papers на Hugging Face. Сначала он стал лучшим за день, затем за неделю, а потом и за весь месяц.
На AI Journey Сбер также выложил в открытый доступ все модели генерации изображений и видео новой линейки Kandinsky 5.0 — Video Pro, Video Lite и Image Lite — собственные продвинутые нейросети, нативно понимающие промпты на русском языке, знающие русскую культуру и умеющие писать кириллический текст на изображениях и видео, а также модели для сжатия визуальных данных K-VAE 1.0, необходимые для обучения моделей генерации визуального контента.
LMArena работает как открытый турнир. На Video Arena пользователи напрямую сравнивают результаты разных нейросетей, генерирующих видео. На основе миллионов таких сравнений система формирует честный и прозрачный рейтинг генеративных моделей.