Благодаря сервису «VK Видео» россиянам стало еще удобнее смотреть видео. Команда специалистов в 10 раз увеличила объем видео с субтитрами и повысила точность обработки расшифровки речи, рассказали «Ленте.ру» в пресс-службе соцсети.
Теперь речь говорящего оформляется в текстовые субтитры в виде предложений со знаками препинания и заглавными буквами. При этом аудиопоток из видео проходит несколько этапов обработки. В первую очередь нейросеть убирает посторонние звуки, выделяет речь и преобразует ее в слова, а другие модели превращают расшифровку в текст. В финале получившийся текст синхронизируется с аудиодорожкой.
Отмечается, что AI-модель, занимающаяся этой работой, допускает на 30 процентов ошибок меньше, чем аналогичные модели генерации субтитров в других сервисах.
Такая технология будет особенно удобна людям с нарушениями слуха, а также когда пользователь не может просматривать ролики со звуком по каким-либо причинам, подчеркнули в пресс-службе компании.