Российская нейросеть OmniFusion вышла на первое место в HuggingFace

Нейросеть OmniFusion заняла первое место на международном портале разработчиков

Григорий Шугаев (Редактор)

Институт искусственного интеллекта AIRI представил открытую версию модели OmniFusion – OmniFusion 1.1. также сразу технический репорт со статьей модели вышел на первое место в разделе Daily trending papers на HuggingFace.

Первая в России мультимодальная языковая модель, способная поддерживать визуальный диалог и отвечать на вопросы пользователей по картинкам, теперь поддерживает русский язык. Open-source-код для обучения и веса доступны к использованию и могут быть применены в том числе при разработке коммерческих продуктов.

OmniFusion — это передовая мультимодальная модель искусственного интеллекта, предназначенная для расширения возможностей традиционных систем обработки языка за счет интеграции дополнительных модальностей данных, например, изображений, а в перспективе –– аудио, 3D- и видеоконтента.

Модель распознает и описывает изображения. С ее помощью можно объяснить, что изображено на фото, узнать рецепт для приготовления блюда по фотографии ингредиентов, проанализировать карту помещения или узнать, как собрать устройство по фото отдельных его частей. Модель также умеет распознавать текст и решать задачи. Например, с её помощью можно решить логические задачи, написанный на доске математический пример или распознать формулу, а также получить их представления в формате LaTeX.

Спектр возможностей широкий: уже сейчас модель может проанализировать медицинское изображение и указать на нем какую-то проблему. Разумеется, для того чтобы подобная модель помогала ставить диагнозы, ее необходимо дополнительно обучать на профильных датасетах с привлечением экспертов из медицины.

В основе архитектуры модели лежит методика совмещения предварительно обученной большой языковой модели и ее «глаз» –– визуальных энкодеров, которые позволяют кодировать информацию на изображении в числовой вектор, называемый эмбеддингом. Обучением OmniFusion занимается научная группа FusionBrain Института AIRI при участии ученых из Sber AI и SberDevices.

Российская нейросеть OmniFusion вышла на первое место в HuggingFace

Применили дискомбобулятор. Раскрыто секретное оружие США, использовавшееся при похищении Мадуро

Завершились «самые закрытые» переговоры России, Украины и США. Журналисты рассказали, что там происходило

Раскрыты варианты обогатиться после завершения СВО

В России раскрыли планы Трампа на Гренландию

Москвичей попросили не лизать качели

На фон дер Ляйен обрушилась волна критики из-за Зеленского

Названы самые популярные имена детей в новых регионах России

В МИД рассказали о возвращении России и США к нормальности

В США назвали катастрофические последствия помощи Украине

Предсказаны последствия «нервного срыва» Зеленского в Давосе