Социальная сеть «ВКонтакте» открыла пользователям доступ к уникальным технологиям распознавания речи, которая используется для расшифровки голосовых сообщений. Об этом стало известно из пресс-релиза соцсети.
Технология распознавания речи Automatic Speech Recognition (ASR) позволяет переводить сказанное голосом в текст. Теперь эта функция станет доступной для разработчиков для ее использования в инди-проектах.
В ASR существует две модели распознавания голоса: нейтральная и спонтанная. Первая подходит для разборчивой речи, вторая — для более обыденной, со сленгом и ненормативной лексикой. Соцсеть отмечает, что ее нейросети умеют удалять из расшифровки шумы и паузы, а также распознает даже отдельный звук «ъ».
«Каждый месяц пользователи ВКонтакте отправляют более двух миллиардов голосовых — это миллионы часов аудио, которые обрабатывают наши нейросети. Применение технологии ограничено только вашей фантазией: можете сделать игру с голосовым управлением или с помощью чат-бота наконец добавить распознавание голосовых в какой-нибудь сторонний мессенджер», — заявил СТО «ВКонтакте» Александр Тоболь.
Ранее «ВКонтакте» представила еще одну часть глобального обновления — новый дизайн личного профиля. В новом профиле упор сделан на индивидуальность, в нем легко можно будет демонстрировать свои увлечения и хобби, делиться творчеством. Также сформировать комфортное виртуальное пространство для общения и самовыражения помогут инструменты соцсети, включая аватары vmoji.