Корпорация Google объявила о покупке проекта reCAPTCHA для оцифровки старых книг силами пользователей. Об этом в официальном блоге корпорации сообщили менеджер по продуктам Google Уилл Кэткарт (Will Cathcart) и Луис вон Ан (Luis von Ahn), один из создателей reCAPTCHA.
Узнайте больше в полной версии ➞Разработанный в университете Карнеги-Меллон бесплатный сервис reCAPTCHA комбинирует защиту от автоматических регистраций и распределенное распознавание текстов старых печатных изданий. Создатели утверждают, что сервис распознает около 200 миллионов слов ежедневно, защищая от автоматических регистраций более ста тысяч сайтов во всем мире.
Посетителю предлагается ввести в текстовое поле два изображенных на рисунке слова. Одно из этих слов известно заранее, а второе программа не смогла распознать при сканировании старой книги. Если первое слово введено правильно - считается, что второе тоже прочитано верно. Для надежности каждое слово проверяется несколько раз.
Сервис reCAPTCHA поможет Google улучшить защиту своих сервисов от спама. Но что более важно, он позволит компании быстрее реализовать ее проекты Google Books и Google News Archive Search по переводу текстов старых печатных изданий в цифровую форму.