«Яндекс» разработал собственную технологию распознавания речи

Российская интернет-компания «Яндекс» в среду, 2 октября, представила собственную технологию мобильного голосового поиска. Технология получила название Yandex SpeechKit; она работает на Android и iOS и «понимает» только запросы на русском языке.

Руководитель проекта Yandex SpeechKit Денис Филиппов рассказал «Ленте.ру», что разработка «Яндекса» правильно распознает 84 процента слов в запросах общей тематики и 94 процента слов — в географических запросах (например, названия населенных пунктов и улиц). Среднее время ожидания ответа от системы составляет 1,1 секунды.

В своей работе Yandex SpeechKit опирается на акустические и языковые модели, составленные «Яндексом». Чтобы получить акустические модели, потребовалось записать и разметить 300 часов мужской, женской и детской речи. Языковые модели формировали на основе поисковых запросов и специально подготовленных текстов.

«Яндекс» начиная со 2 октября использует Yandex SpeechKit в собственных мобильных сервисах. Кроме того, компания «поделится» технологией со сторонними разработчиками. Необходимая документация и дистрибутивы доступны на ресурсе «Яндекс.Технологии». SpeechKit можно использовать бесплатно, если количество запросов в программе не превышает 10 тысяч в день.

Распознавать русскую устную речь на мобильных устройствах умеют и продукты других компаний — в частности, технология компании Nuance и созданный Google интерфейс Android Speech API. Последний, однако, работает только на платформе Android.