Думаю многие в повседневной жизни сталкивались с CAPTCHA (капчей). Когда оставляли комментарий на сайте ли получали ссылку на файлообменнике. В общем, каждый раз, когда вас просили отстоять свое гордое звание именоваться человеком. CAPTCHA (от англ. «Completely Automated Public Turing test to tell Computers and Humans Apart») – полностью автоматизированный публичный тест Тьюринга для различия компьютеров и людей, говорит нам Википедия. Сам термин появился в 2000 году. Капчи бываю разные. Простые:
Сложные:
И даже такие (попытайтесь найти все символами с кошками):
Но сегодня я бы хотел рассказать про проект reCAPTCHA. Это система распознавания людей, разработанная в американском Университете Карнеги-Меллона в Питтсбурге. Замечательный образец инженерной мысли и сочетания полезного с, хм…, полезным. смайлик. Выглядит эта система примерно так:
[ad#ad-1]
Сам институт занимается “оцифровыванием” текстов, то есть переводом из бумажного вида в электронный. Естественно, что алгоритмы не совершенны и порой машина не может распознать то или иное слово. “Так почему бы это не сделать людям?” – решили разработчики системы reCAPTCHA. И второе слово с картинки, есть не что иное, как не распознанный машиной кусок текста!
Таким образом, система работает следующим образов: генерируется первое слово, а второе является нерасшифрованным словом из текста. Пользователь вводит в поле оба слова. Система проверят первое, а значение второго считает всегда верным. В итоге каждый пользователь не только подтверждает что он человек, но и помогает в оцифровке архивов. Если три пользователя одинаково опознают нерасшифрованное слово, то машина добавит его в финальный вариант. При подобной реализации процент распознавания текста становится равным 99%
В университете посчитали, что в день системами CAPTCHA пользуются около 200 миллионов раз. Если исходить из расчета – 10 секунд на слово, то получается, что человечество “теряет” около 500 тысяч часов печатного времени. Ученые решили употребить его для оцифровки книжных и газетных архивов. Работа программы была протестирована на архивах газеты The New York Times. reCAPTCHA успешно перевела в “цифру” ее подшивку за 1908 год. Сейчас система оцифровывает книги из архива Internet Archive.
Увидеть подобную капчу и поучаствовать в системе можно, например, на сайту LiveJournal. Там система помогает подтверждать, что комментарий написан человеком. Я сам испытал оргазм мозга от такой лаконичной идеи использования человеческого труда. Честь и хвала разработчикам!