CAPTCHA (рус. ‒ капча) ‒ тест, применяемый интернет-сайтами для выявления к какому типу относится объект, желающий совершить действия – программа или человек. Происходит от заглавных букв словосочетания Completely Automated Public Turing test to tell Computers and Humans Apart, что переводится, как «полностью автоматизированный публичный тест Тьюринга для определения машины или человека». Использование капчи стало распространяться в начале 2000-х годов, когда массовыми стали случаи регистрации на форумах, хостингах и других интернет-сервисах не реальных людей, а программ-роботов.
Порядок прохождения проверки
При регистрации, совершении покупок либо других действий, пользователю в специальном окне предлагается ввести слова или случайные комбинации букв, не несущих смысловой нагрузки. Часто, символы имеют искаженное отображение, зашумлены различными цветами, линиями и другими графическими элементами. При этом, некоторые «капчи» требуют различия строчных и прописных букв.
Польза применения
Положительный эффект от использования этой службы представляется в отсечении роботов, пытающихся зарегистрироваться на том или ином сайте. Целью такой регистрации может быть, как распространение рекламной информации, так и действия, несущие вред сайту и его владельцу. В системах электронного банкинга использование капчи есть желательным (часто – обязательным) элементом при проведении любого вида платежей.
Уязвимости
Недостаточная защита текста для капчи и постоянное совершенствование алгоритмов распознавания приводят к неэффективной работе данной службы. При неполноценной базе данных слов и фраз, компьютерная программа может «угадать» капчу простым перебором.
Re-captcha
Проект re-captcha, изобретенный учеными университета Карнеги-Мелона, предназначен для помощи в распознавании текстов, оцифрованных библиотеками, а также для распознавания названий улиц и адресов зданий на снимках, сделанных Google Street View. При использовании технологии re-captcha, пользователю предлагается ввести название двух слов. При этом, одно из слов уже является OCR-распознанным и служит для проверки, а другое является неизвестной лексемой, которая после ввода вносится в базу слов. Таким образом, производится распознавание множества оцифрованных текстов пользователями интернета, что несет большой социальный эффект для общества.