А разгадка одна

Компьютер научился расшифровывать капчу

Некоторое время назад компания Vicarious заявила, что научила компьютер разгадывать 90 процентов тестов CAPTCHA (по-русски просто «капча»). Капча — хорошо известный всем «тест на человечность», изображение, информацию в котором способен распознать лишь пользователь из плоти и крови. Обычный вид капчи — несколько букв и цифр в искаженном виде, размещенные на неоднородном фоне, чтобы предотвратить считывание компьютером.

Капчу правильно назвать обратным тестом Тьюринга. В обычном тесте человек должен определить, с роботом он разговаривает или с другим человеком. Здесь же робот пытается определить, где человек, а где нет.

Разгадывать капчу приходится много кому. Спамерам прохождение теста на человечность необходимо для регистрации множества ящиков, каждый из которых будет закрыт после отсылки нескольких сотен писем. Киберсквоттерам иногда преодоление капчи может пригодиться для парковки пакетов доменов. Мелким воришкам — для выдергивания по кусочку чужих баз данных.

В итоге разгадывание капчи — это многомиллионный бизнес, в котором заняты тысячи жителей Индии, Китая и многих других стран. Тамошние пользователи приспособились проходить тесты за небольшую плату. Специальные биржи по продаже рутинных заданий (например, Amazon Mechanical Turk) предлагают купить десятки разгаданных капч за несколько центов.

Иногда за разгадку капчи вообще никому и ничего не приходится платить. Ведь главное — мотивировать исполнителя. Толпы мотивированных граждан безо всякого «Турка» разгадывают чужие капчи, регистрируясь на порносайтах. В общем, если очень нужно, то серийная расшифровка капчи не представляет особой проблемы.

Алгоритм, разработанный Vicarious, справляется только с латинскими буквами, причем — контринтуитивно — внесение шума на качество распознавания не влияет. Единственное, что способно сломать алгоритм — фон в шахматную клетку. Но шахматной клетки нет ни у Google, ни у Yahoo!, ни у PayPal, чьи капчи, судя по ролику изобретателей, пали под натиском чудо-программы. Про компанию написали крупные научные журналы, что придало ее заявлению веса, а вечной паранойе специалистов по безопасности — оснований.

В Vicarious, специализирующейся на разработках в сфере искусственного интеллекта, особенно упирают на слова «тест Тьюринга» (хоть и обратный, как говорилось выше), поскольку надеются, что их технология способна на нечто большее, чем взлом капчи.

Заметим на полях, что и без помощи людей машинные алгоритмы достигли значительного прогресса в разгадке искаженных символов. Любой, кто регистрировал ящик на «гугле», с содроганием вспоминает тамошнюю длинную капчу, которую и человек-то угадает хорошо если на третий-пятый раз.

Но разгадка тайны конкретной капчи — одно, а вера в универсальность алгоритма — совсем иное. Многие ученые сомневаются в работоспособности решения Vicarious. Их скепсис понятен. Капча является частным случаем распознавания символов вообще. Тот, кто заявляет, будто умеет разгадывать 90 процентов капч, фактически утверждает, что умеет распознавать 90 процентов алфавитно-цифровых символов, понятных человеку. В этом смысле попытка решить капчу — амбициозная задача. И тот, кто с ней справится, облагодетельствует не только науку, но и культуру.

Например, Vicarious утверждает, что справилась с изображениями проекта Google reCAPTCHA. Тот использует людей не только для того, чтобы разгадать капчу, но и для расшифровки тех частей рукописи, перед которыми компьютеры оказываются бессильны.

Обычно reCAPTCHA выглядит как структура из двух слов. Одно представляет собой обычную капчу, которую необходимо разгадать. Другое — надпись, значения которой компьютер не знает. На этом месте можно написать все, что угодно — и этот вариант признают правильным. Расчет на то, что вместе со сгенерированным пользователь правильно разгадает и непонятное слово.

Так люди, сами того не подозревая, помогают слово за словом оцифровывать книги со шрифтом плохого качества и распознавать номера домов на фотографиях, сделанных автомобилями с картографическим оборудованием. Человеческому мозгу в формате капчи есть еще множество применений, так что в том случае, если Vicarious правы, наша жизнь существенно изменится — универсальные распознаватели автоматизируют области, которые до сих пор невозможно было автоматизировать.

К счастью или к сожалению, но искусственный разум Vicarious далек от идеала. В видеоролике, где разгадывается reCAPTCHA, отчетливо видно, что читать вывески с номерами домов у системы не получается.

Надо думать, и не получится — универсального читателя бесконечно сложно создать. Но и разработка подобного алгоритма ни к чему хорошему не приведет. Дело в том, что способность читать то, что тебе дают, не свидетельствует о наличии разума. Скорее даже наоборот.