Сбер сообщил о запуске отдельного приложения для работы с речевыми технологиями — SaluteSpeech App. Приложение доступно для популярных операционных систем, оно включает в себя возможности GigaChat API, программного интерфейса доступа к сервису GigaChat.
Узнайте больше в полной версии ➞В SaluteSpeech App два раздела, каждый из которых соответствует своей технологии. Раздел «Распознавание» предназначен для текстовой расшифровки встреч, звонков, интервью и любых других голосовых файлов. Раздел «Синтез», наоборот, позволяет озвучить текст, настраивая паузы и ударения, и дает возможность скачать готовый аудиофайл на свое устройство. Синтезировать текст можно разными голосами из семи общедоступных вариантов на русском и английском языках.
Пользователь может загрузить короткие тезисы и попросить нейросетевую модель на их базе подготовить необходимый текст для последующего синтеза. Например, написать сказку по заданной теме, затем озвучить ее, чтобы полученный аудиофайл включать ребенку в машине или перед сном. Также с помощью GigaChat API в приложении SaluteSpeech App можно сделать короткую выжимку протокола встречи, аналитического отчета или любого другого текста, а затем озвучить полученный материал.
Новое приложение будет доступно всем без оплаты. Для начала работы с SaluteSpeech App необходимо скачать приложение. Внутри приложения перейти по ссылке для создания проекта SaluteSpeech и GigaChat, далее перенести свои авторизационные данные из соответствующего проекта в приложение SaluteSpeech App.