Почему не работает капча. Капча — что это такое, где и когда CAPTCHA применяется в интернете

Приветствую вас, дорогие друзья! Все мы являемся активными пользователями социальных сетей – одни используют их для общения и поиска информации, другие же пытаются использовать эти площадки для заработка . Однако, вне зависимости от того, какие цели преследует каждый из нас, заходя в соцсеть, всем нам так или иначе да приходится сталкиваться с такой неприятной вещью как капча. Согласитесь, иногда этот набор символов настолько мешает работать, что хочется все бросить и просто закрыть браузер. Сегодня мы поговорим о том, как убрать капчу и избавить тем самым себя от необходимости тратить время на расшифровку кодов.

Капча: что это?

Итак, капча – это ни что иное, как специальная картинка, содержащая проверочный код для определения того, кто именно пытается совершить определенное действие в сети, — человек или робот. Чаще всего расшифровать код предлагают в тех случаях, когда происходит многократное выполнение одного и того же запроса на сервисе. К примеру, поисковики вроде Яндекса или Гугла регулярно предлагают нам расшифровать captcha, когда мы задаем им одни и те же вопросы. Нельзя назвать капчу редким гостем и в среде скриптов: парсеров, кликеров, постеров и так далее.

Главная задача captcha – предотвращение автоматического действия роботов . Чтобы отсеять ботов, сервисы предлагают пользователям разгадать код, зашифрованный в витиеватом рисунке. Справиться с поставленной целью способны лишь реальные пользователи, боты, увы, делать это не умеют. Именно поэтому при работе со скриптами капча становится настоящей проблемой, не позволяющей взаимодействовать с большим объемом данных. Однако, не стоит отчаиваться и опускать руки. Всякая проблема разрешима , и ввод captcha – не исключение.

Почему появляется captcha?

Как известно, для того, чтобы избавиться от болезни, нужно знать причину ее возникновения. Это правило работает и в случае с капчей: чтобы избавиться от постоянно всплывающих окон с зашифрованным кодом, нам необходимо понять, почему система так рьяно пытается проверить нас на «человечность».

Все дело в том, что одинаковые действия , выполняемые одно за другим, вызывают у сайтов подозрения. А потому они стремятся отсеять среди них те, что выполняются роботами.

К примеру, ваша попытка разослать своим друзья сообщения, содержащие одну и ту же информацию, расценивается социальной сетью как спам-рассылка. Именно поэтому вконтакте требует от нас выполнить распознавание капчи и подтвердить, что данное действие было выполнено живым человеком. В том случае, если распространение сообщений не прекратится, то система может даже временно заблокировать ваш аккаунт.

Приходится сталкиваться с всплывающими окнами и в тех случаях, когда система защиты соцсети решает проверить, используете ли вы какие-либо запрещенные или продвижения собственной страницы. В данном случае речь идет о специальных софтинах, которые могут производить автоматическую накрутку лайков, рассылку приглашений в друзья и так далее. К числу таких программ относятся и популярные и sobot , которые активно используются для создания популярных сообществ и пабликов. Только представьте себе, какой бы помойкой стал вконтакте, если бы не отсеивал взлом, рекламу и рассылку спама!

Раскрути страницы и паблики VK с помощью Brobot

Учимся убирать captcha

Уверен, что большинство из вас сейчас серьезно озадачились тем, как обойти капчу вконтакте. К сожалению, проигнорировать ввод кода на сегодняшний день невозможно . Технологии, осуществляющие защиту сервиса посредством расшифровки набора символов, — обязательная мера безопасности социальной сети, которую вы не можете скрыть или просто убрать.

Все, что вы можете сделать для того, чтобы сократить частоту встреч с навязчивым кодом, — это предоставить вконтакте максимальную информацию о себе, заполнив соответствующие поля в анкете пользователя. Чем более «человеческой» будет ваша страница, тем реже вам придется производить распознавание captcha. Позаботьтесь о том, чтобы ваша страница в социальной сети была привязана к электронной почте и к реальному номеру мобильного.

Настройка профиля вк

Чтобы обезопасить себя от возможного взлома страницы вконтакте, я бы рекомендовал вам посетить вкладку «Безопасность », которая находится в разделе «Мои настройки ». Здесь вы сможете подключить наиболее сильную и надежную систему защиты, в виде смс-кодов подтверждения, приходящих на указанный вами мобильный телефон. Кроме того, хочу обратить ваше внимание на поле «История активности ».


В случае, если ваш аккаунт окажется в руках мошенников, то вы узнаете об этом, проверив «Историю активности ». Если в перечне адресов вы обнаружите сторонние IP и браузеры, которыми вы никогда не пользовались, это значит, что ваш аккаунт был взломан и, вполне вероятно, был использован для спам-рассылки. Чтобы исправить сложившуюся ситуацию, вам следует «Завершить все сеансы » кроме текущего, в котором вы находитесь, а затем изменить пароль доступа к своему профилю.


Что же касается того, как убрать капчу совсем, то здесь вам не остается ничего другого как разгадать зашифрованный набор символом и ввести его в специальное поле, расположенное рядом с картинкой. Согласитесь, что далеко не всегда у нас есть возможность в режиме реального времени распознавать captcha. Особенно проблематично это в случаях, когда мы запускаем скрипт и выполняем работу большими объемами. Как только поисковики заметят множественные запросы, мы тут же начнем разбираться с капчами, выскакивающими снова и снова.

Такая проблема очень близка вебмастерам и тем, кто ведет активную работу с постерами, спамерами и прочими автоматизированными программами. Чтобы избавиться от назойливых кодов, которые мешают вашей работе, вы можете воспользоваться помощью сервисов распознавания капч.

Популярные сервисы автоматического распознавания капчи

Сегодня в интернете можно найти множество сайтов, которые предлагают свои услуги по вводу капчи за деньги. Одними из наиболее популярных в сегменте рунета являются сервисы rucaptcha и anti-captcha. Предлагаю более детально разобрать каждый из них:

  1. anti-captcha – многие знают этот сайт как антигейт капча. Сервис стабильно работает на протяжении целых 10 лет. Здесь за автоввод капчи приходится платить в долларах . Каждая тысяча разгаданных кодов обойдется вам в 40 центов. О том, как работать с этим сайтом, узнаете немного позже
  2. rucaptcha – популярный сервис, где разгадывание капчи производится вручную. С его помощью вы можете обеспечить автоматический ввод капчи на своих проектах. Чтобы это сделать, необходимо иметь специальный ключ, который будет поступать через сервис к реальным людям, работающим на сайте, для его последующего распознавания. Стоимость такой услуги составляет всего-навсего 40 рублей за каждую разгаданную тысячу картинок. Принцип работы сервиса довольно прост: реальные люди регистрируются на сайте и обеспечивают себя . То есть, в течение суток на сайт приходят все новые и новые заказы на расшифровку кодов, а обычные пользователи интернета разгадывают их и получают за это денежное вознаграждение

Используй топовый сервис anti-captcha

Расшифровываем капчи с anti-captcha.com: инструкция по работе с сервисом

Чтобы раз и навсегда избавить себя от надоедливых всплывающих картинок с зашифрованными символами, просто воспользуйтесь следующей инструкцией по работе с сервисом анти-капчи:


В каких случаях не обойтись без ключей обхода капчи?

Многие пользователи запрещенных программ наивно полагают, что им не нужно пользоваться сервисами для распознавания капчи. Тем не менее, существует ряд программ, эксплуатация который будет просто невозможной без распознавания captcha. К числу таковых можно смело отнести:


Как можно заработать на распознавании captcha?

Многим новичкам интересно, насколько реально заработать на вводе капчи. Могу сказать, что здесь все зависит от того, сколько времени будет уделяться расшифровке кодов. По большому счету, работу на сервисах антикапчи нельзя назвать основным видом деятельности. Даже если вы весь день проведете за компьютером, будете непрерывно расшифровывать одну капчу за другой, то максимум, что вам удастся заработать, — это 2-3 доллара. Согласитесь, это совсем не те деньги, на которые вы сможете прожить целый месяц. Однако, вы вполне можете использовать эту деятельность в качестве подработки . Тех денег, что вы заработаете, вполне хватит для оплаты интернета или пополнения счета мобильного.

Беспроигрышным вариантом увеличения заработка на сайтах по распознаванию капчи станет участие в партнерских программах сервисов. Если вы имеете опыт в продвижении реферальных ссылок, то вы вполне можете сделать площадки антикапчи источником получения пассивного дохода . Все, что от вас требуется, - привлечь к работе на сервисах новых пользователей, которые будут расшифровывать коды, и получать свои реферские отчисления. Более детальную информацию о том, как происходит заработок на партнерских программах, вы можете узнать в моей отдельной статье.

Очень часто в интернете можно услышать такое слово как капча. Некоторые пользователи жалуются, что не могут ввести капчу, а мы даже не можем понять, о чем это они. Прочитав эту статью Вы узнаете что такое капча .

На самом деле, даже не зная что означает слово капча, каждый из нас встречается с ней постоянно. Капча - это защитный код в виде изображения. Чаще всего на сайтах нужно вводить капчу во время регистрации, отправки комментария. Или к примеру если мы сделаем несколько однотипных действий в социальной сети Вконтакте, то нас попросят ввести капчу.


Разобравшись, что такое капча, давайте ответим на следующий вопрос, зачем нужна капча ? Если капча – это мера защиты, тогда от кого или чего она защищает? Как мы знаем, в интернете уже очень много программ самого разного назначения. Некоторые из этих программ помогают автоматизировать различные действия на сайтах. К примеру: оставлять спам комментарии на сайтах, добавлять друзей Вконтакте, быстро раскрутить твиттер аккаунт.

На самом деле автоматизировать можно практически любое действие человека на сайте. Но программы еще не научились считывать текст с картинок и именно поэтому на многих сайтах стали использовать капчу, в том числе и на этом. Если Вы захотите оставить комментарий к данной статье, то Вам нужно будет ввести капчу, к счастью очень легкую. То есть капча нужна для того, чтобы защитить сайт от рассылки различного спама программами.

Виды капчи

Капчи бывают самые разнообразные. Давайте разберем самые популярные виды капчи :

Есть еще множество разновидностей капчи, мы же с Вами рассмотрели самые распространенные, которые можно чаще всего встретить на сайтах сегодня.

Помогает ли капча в защите от спама?

На вопрос, помогает ли капча в защите от спама, ответ однозначный – капча помогает и во много раз уменьшает количество спама на сайтах. Однако не на 100%. Сейчас существуют сайты, на которых люди вручную разгадывают капчи и получают за это деньги. Программе же только остается отослать изображение капчи им и получить готовый ответ.

Это не означает, что капча утратила свою актуальность. Эти сервисы, по ручному распознанию капчи, платные. Хоть это и стоит недорого, но не все хотят платить за свои удобства и за эффективную работу. А от программ, которым не помогает человек в разгадывании капчи, она помогает хорошо.

И сложность капчи не играет особо важной роли. Так как если капчу не сможет разгадать человек, зарабатывающий на вводе капчи, то ее и не сможет ввести Ваш целевой посетитель, который не сможет ввести капчу для регистрации или отправки комментария. И если Вы читали эту статью, чтобы разобраться нужно ли ставить капчу на своем сайте, то обязательно поставьте ее, но не сильно сложную, так как в этом случае она принесет больше вреда, чем пользы.

Где заработать на вводе капчи?

Если Вы заинтересовались возможностью заработать на вводе капчи , тогда Вы сможете узнать подробно об этом способе заработка на этом же сайте: сайты для заработка на капче .

Если в двух словах, то Вам нужно выбрать место (сайт), где зарабатывать на капче и зарегистрироваться там. Далее Вам будут присылать картинки с капчей и полем для ввода. И за ввод капч Вы будете зарабатывать деньги. Это очень

Для некоторых удивительным является процесс запроса ввести капчу, но на самом деле это нормальное явление для пространства интернет. Дело в том, что капча - это еще один способ защитить всю систему, ресурс от нападения различного рода роботов.

    • Когда нужно вводить защитный код?
    • Какие бывают виды капчи?
    • Ввод капчей как дополнительный заработок
    • Инструкция по заработку на капчах

Когда именно необходимо вводить капчи, что собой представляет такая защита, узнаем прямо сейчас.

Очень часто код просят ввести при регистрации на различных сайтах. Это и понятно, в данном случае проверка на «человечность» превыше всего, потому как владельцу данного ресурса, роботы в системе вообще не нужны. Значит так, капча запрашивается достаточно часто в том случае, если вы несколько раз подряд в интернете производите одно и то же действие, то есть повторяете его. Это может быть что угодно, комментарии к фото, постам и т.д., также рассылка сообщений сразу нескольким друзьям.

В последнем случае, система, наверняка, попросит вас убедить ее в том, что вы не являетесь автоматической программой, которая хочет разослать всем вашим друзьям спамы. По этой причине в социальных сетях также не разрешается звать более 50 друзей в день, чтобы убедится в том, что вы не собираете тысячи автоматически для своих собственных целей, просто для раскрутки или же очередного спама.

Когда нужно вводить защитный код?

Запрос ввести капчу может быть выдан в разных ситуациях и случаях. Он выглядит таким образом: высвечивается новое окно, в котором картинка расположена сверху. Снизу же, данные которые необходимо разгадать и ввести в пустую графу, под самой картинкой.

На это обычно у среднестатистического пользователя уходит не более нескольких секунд, так что времени много данная процедура у вас не займет.

Когда высвечивается данный запрос, не нужно стараться его закрыть, потому, как данная процедура может быть бесполезной - есть большая вероятность, что при последующем действии, программа опять запросит ввод кода, для убеждения в том, что вы являетесь «живым» пользователем, а не автоматической программой.

До недавних пор такая система защиты действительно была действенной. Но сегодня усовершенствуются не только способы и методы защиты, но антизащитные программы тоже развиваются полным ходом, обновляются, усовершенствуются.

Теперь, если вы не хотите постоянно вводить капчу, за вас это может сделать программа , которую можно скачать бесплатно и на различных серверах. Также программы такого типа есть и платные. Они предназначены для тех, кто постоянно борется с капчами, к тому же, в больших количествах. Для обычного пользователя достаточно будет скачать обычный вариант бесплатной программы, которая автоматически будет распознавать коды при запросах, и вам не придется их разгадывать самостоятельно.

Какие бывают виды капчи?

На сегодняшний день существует несколько видов капч , с самыми обычными и простыми, знаком, наверное, каждый пользователь, пространства интернет. Итак, простые капчи - это когда необходимо разгадать символы (русские или английские) или же цифры в искаженном виде.

Случается так, что на капче выбивается сочетание всех перечисленных выше символов. Еще это может быть арифметический пример, который вам необходимо будет решить, чтобы автоматически программа зачла вас за человека, а не робота. Эти примеры могут быть разной степени сложности, но чаще всего, попадаются очень легкие примеры в одно действие, по типу: 1+1 или же 2-1 и т.д. Самыми необычными капчами являются рисунки, расположены неправильно. Когда просят ввести такую капчу, необходимо просто выставить изображение в правильном направлении. Когда вы увидите такого рода код, вам сразу станет понятно, что делать и куда нажимать.

Капча - это остаточно интересный вид защиты. Согласитесь, чего только не найдешь в этом интернете, как не ухищряются программы защиты, чтобы их методы были действенными. Нужно отдать должное разработчикам тех капч, на которые сегодня еще нет взламывающих программ, потому что такая защита действительно может называться надежной. Но на этот счет тоже были придуманы некоторые ухищрения. Какие именно. Узнаете сейчас.

Ввод капчей как дополнительный заработок

Оказывается, сегодня в интернете можно зарабатывать не только написанием статей, продажей товаров и созданием сайтов, ввод капч также является прибыльным делом. Обычно именно с такого вида заработка начинают новички, ведь для такой работы не требуется ни опыт, ни знания, ни дополнительные умения, в этом деле все проще некуда.

Итак, если вас привлек такой вид заработка, тогда смотрите подробную инструкцию с чего начинать и как зарабатывать со временем на этом деле еще больше денег.

Смотрите видео - Как заработать на вводе капчи:

Инструкция по заработку на капчах

Для того чтобы начать зарабатывать предложенным путем нужно следовать представленной инструкции, чтобы не возникало лишних вопросов и проблем.

  1. Зарегистрироваться на сервисе, который специализируется именно на этой сфере. Выбрать можно любой из предложенных, желательно пользоваться самыми популярными среди пользователей интернета.
  2. После регистрации сазу можно преступать к работе, но при этом не забывайте о том, что у вас должен быть свой счет в интернет пространстве, куда вам будут начисляться денежные средства за проделанную вами работу.
  3. Нажимаете на кнопку - «старт» или же «начинай зарабатывать» и вперед, за доходом. Денежные средства будут начисляться на счет автоматически, после каждого ввода капчи.

Если вы более-менее активно пользуетесь интернетом в повседневной работе, то наверняка знаете о такой неприятной штуке, какой является капча. Порой она настолько мешает в работе, что люди нередко просто перестают посещать те сайты, хозяева которых уделяют ей излишне много внимания.

Что это такое?

Кстати, а что такое капча? Представьте, что вы зашли на какой-нибудь популярный файлообменник. Чтобы скачать файл в бесплатном режиме, вам придется ввести в специальное поле некий набор символов (зачастую бессмысленных), который следует брать с рисунка напротив.

Задача осложняется тем, что символы эти порой совершенно невозможно разобрать, так как их сознательно делают нечитаемыми.

Для чего она нужна?

Разобравшись с тем, что такое капча, было бы неплохо поговорить о ее конкретном назначении. Для чего же нужно городить такой огород, усложняя отправку комментариев или скачивание файлов?

Да, были такие времена, когда о капче вообще никто не знал. Появилась она сравнительно недавно. Произошло это в тот же период, когда на просторах Рунета расплодилась масса ботов, при помощи которых предприимчивые граждане оставляли в комментариях объявления рекламного характера, бесплатно скачивали файлы и творили прочие безобразия.

Конечно, на многих ресурсах за порядком следили администраторы, но в большинстве сервисов для ведения блогов нагрузка на них оказалась такая, что они банально перестали справляться. Вот тогда пользователи и узнали о том, что такое капча! Знакомство оказалось достаточно неприятным.

Если говорить совсем точно, то сама технология первоначально была создана в 2000 году. Изначально она предназначалась только лишь для определения «человечности» вашего собеседника в интернете: тогда ни одна программа для капчи (для ее распознавания, точнее) просто не была создана.

В чем же ее недостаток?

Если вы внимательно прочитали первую часть статьи, то о большинстве негативных факторов использования капчи сможете догадаться самостоятельно. Во-первых, пользователи в большинстве своем действуют в состоянии некоего порыва. Проще говоря, когда вы видите какой-то интересный пост в том же ЖЖ, то хотите его сразу же прокомментировать.

Вот только перед вами встает неудобоваримая капча, причем большая часть символов настолько неразборчива, что на их разгадывание может уйти не один день. Как вы думаете, будет ли пользователь заниматься столь неблагодарным делом?

Нет, конечно же! Он просто уйдет на другой сайт. Таким образом, если вы стремитесь обезопасить свой ресурс от любителей оставлять спам в комментариях, советуем слишком сильно не усердствовать.

Если вы слишком увлечетесь капчей, быстро растеряете многих активных пользователей. Нет пользователей - нет денег от рекламы. Кроме того, большая часть нормальных ресурсов автоматом распознает спам в комментариях, так что смысла в дополнительной защите чаще всего нет никакого.

Практически то же самое можно сказать и о сайтах для обмена файлами. Конечно, понять их создателей можно: предлагая всем и безвозмездно скачивать интересующую информацию, они просто упустят прибыль.

Но на эту же ситуацию можно посмотреть с прямо противоположной стороны: если сайт предлагает вам возможность бесплатно получить файл, он легко наберет огромную аудиторию, которая быстро окупит все издержки за счет привлечения рекламодателей. Кстати, именно так действует отечественный iFolder, создатели которого на бедность точно пожаловаться не могут.

Так что, даже с точки зрения получения прибыли, сама идея капчи не выглядит столь уж привлекательной.

Что же делать?

А как убрать капчу, реально ли вообще это сделать? Здесь ситуация достаточно неоднозначная. Дело в том, что на многих сайтах, которые используют такой тип защиты от спама, капчу прочитать с первого раза удается далеко не каждому пользователю, не говоря уже о каких-то приложениях.

Простые варианты можно распознать при помощи небольшой утилиты Screenshot Reader, которая входит в состав программного пакета ABBYY FineReader. Но читает она только самые простые формы капчи, которые сможет без особого труда опознать любой нормальный пользователь. Кроме того, сам процесс не получится автоматизировать, так как для распознавания необходимо вручную выделять интересующий вас диапазон.

Ввод капчи

Если особого выбора у вас нет, то придется заниматься этим неблагодарным делом вручную. Какие советы можно дать? Во-первых, старайтесь делать это быстрее: на многих сайтах стоит счетчик, который сбрасывает значение, если вы не можете ввести его в течение пары минут.

Кроме того, ошибки при написании символов нередко случаются в том случае, когда в вашем браузере отключены JavaScript. Не забывайте также о необходимости Cookie, так как они помогут сайту вас «узнавать», избавляя от постоянного прохождения надоевшей защиты.

Наконец, обращайте внимание на то, что написано на главной странице сайта. Как правило, капча для сайта бывает подробно описана в пояснительной записке или отдельной статье. Отличный пример - файлообменный сервис Rapidshare, который в свое время вводил уникальную капчу.

Ее символы были легко различимы, не использовалось никаких технологий размытия или поляризации, которые бы затрудняли работу программ для ее распознавания. В чем же был секрет?

А он заключался в том, что на тех буквах и цифрах, которые нужно было вводить в соответствующее поле, сидели котики. Сколько в свое время было сказано нелицеприятных слов в адрес создателей такой системы! В конце концов, от нее отказались под давлением пользовательской общественности.

Покупаем «противоядие»

Другой вариант - связаться с нормальным программистом (или группой, что еще лучше), дабы тот сделал утилиту для распознавания капчи на каком-то конкретном сайте. Увы, но универсальных решений не существует хотя бы потому, что на каждом ресурсе защита уникальна. Какие-то типовые решения встречаются очень редко.

Особый интерес в этом ключе представляют разработки компании CMS Bitrix, которая распространяет действительно эффективные программы, которые справляются с капчей на большинстве популярных сайтов. Разработчики утверждают, что эффективность их творения находится в пределах 95 %. В зависимости от типа защиты, ее сложности и конкретного сайта, разработка методов ее защиты может обойтись вам в пару тысяч долларов, а то и больше.

Кроме того, на некоторых ресурсах есть настолько изощренная защита, что ее и человеку-то разгадать непросто!

Можно ли заработать на ее вводе?

Новички часто интересуются, можно ли как-то зарабатывать на вводе защитных символов. И это неудивительно, ведь в интернете полно объявлений о наборе групп людей, которые будут получать какие-то деньги, выполняя распознавание капчи. Стоит ли связываться с этим?

На наш взгляд (быть может, довольно субъективный), заниматься этим делом не стоит. Вы потратите огромное количество нервов, сил и трафика. А оплата такого «легкого заработка» просто поражает: просидев целый день возле компьютера, с маниакальным упорством занимаясь вбиванием капчи, вы заработаете максимум пару долларов. А оно вам надо? Наверняка нет.

Универсальный выход

Если говорить о файлообменниках, то в случае регулярной закачки вами файлов единственным надежным выходом из ситуации является покупка платного аккаунта. Как правило, его стоимость вполне адекватна. Купив такой абонемент, вы получите возможность быстро и без неудобств скачивать любые объемы информации.

Как убрать капчу с вашего блога?

Надеемся, что вы сделали правильные выводы, прочитав большую часть нашей статьи. А потому рассмотрим, как убрать ввод капчи на популярном сервисе Blogger от небезызвестной Сделать это совсем несложно, а радости посетителям своего сайта вы доставите немало.

Сначала заходим в «Редактор» вашей странички. В левой колонке выбираете пункт «Настройки». В нем есть раздел «Сообщения и комментарии». В поле «Использовать проверку по слову» поставьте значение «нет», после чего капча при вводе сообщений требоваться не будет.

Что делать, если не получается правильно ее ввести?

Бывает, что программа для ввода капчи или сам сайт (если вы вводите значения вручную) постоянно выдают ошибку. В чем может быть причина?

Прежде всего, нужно успокоиться. Как правило, в правой части любой капчи есть изогнутая стрелка. Нажав на нее, вы обновите тот набор символов, который нужно ввести для доступа на сайт. Воспользовавшись ею, можно изменить совершенно нечитаемый набор. К сожалению, нечитаемость букв встречается очень часто. Так, порой совершенно неразличима разница между буквами "Q" и "G".

Наконец, на многих сайтах можно избежать ввода защитных символов, если просто зарегистрироваться на нем. Попробуйте и этот способ.

Вот что такое капча!

Есть разные способы для обхода CAPTCHA, которыми защищены сайты. Во-первых, существуют специальные сервисы, которые используют дешевый ручной труд и буквально за $1 предлагают решить 1000 капч. В качестве альтернативы можно попробовать написать интеллектуальную систему, которая по определенным алгоритмам будет сама выполнять распознавание. Последнее теперь можно реализовать с помощью специальной утилиты.

Решить CAPTCHA

Распознавание CAPTCHA - задача чаще всего нетривиальная. На изображение необходимо накладывать массу различных фильтров, чтобы убрать искажения и помехи, которыми разработчики желают укрепить стойкость защиты. Зачастую приходится реализовывать обучаемую систему на основе нейронные сетей (это, к слову, не так сложно, как может показаться), чтобы добиться приемлемого результата по автоматизированному решению капч. Чтобы понять, о чем я говорю, лучше поднять архив и прочитать замечательные статьи «Взлом CAPTCHA: теория и практика. Разбираемся, как ломают капчи» и «Подсмотрим и распознаем. Взлом Captcha-фильтров» из #135 и #126 номеров соответственно. Сегодня же я хочу рассказать тебе о разработке TesserCap, которую автор называет универсальной решалкой CAPTCHA. Любопытная штука, как ни крути.

Первый взгляд на TesserCap

Что сделал автор программы? Он посмотрел, как обычно подходят к проблеме автоматизированного решения CAPTCHA и попробовал обобщить этот опыт в одном инструменте. Автор заметил, что для удаления шумов с изображения, то есть решения самой сложной задачи при распознавании капч, чаще всего применяются одни и те же фильтры. Получается, что если реализовать удобный инструмент, позволяющий без сложных математических преобразований накладывать фильтры на изображения, и совместить его с OCR-системой для распознавания текста, то можно получить вполне работоспособную программу. Это, собственно, и сделал Гурсев Сингх Калра из компании McAfee. Зачем это было нужно? Автор утилиты решил таким образом проверить, насколько безопасны капчи крупных ресурсов. Для тестирования были выбраны те интернет-сайты, которые являются самыми посещаемыми по версии известного сервиса статистики . Кандидатами на участие в тестировании стали такие монстры, как Wikipedia, eBay, а также провайдер капч reCaptcha.

Если рассматривать в общих чертах принцип функционирования программы, то он достаточно прост. Исходная капча поступает в систему предварительной обработки изображений, очищающей капчу от всяких шумов и искажений и по конвейеру передающей полученное изображение OCR-системе, которая старается распознать текст на нем. TesserCap имеет интерактивный графический интерфейс и обладает следующими свойствами:

  1. Имеет универсальную систему предварительной обработки изображений, которую можно настроить для каждой отдельной капчи.
  2. Включает в себя систему распознавания Tesseract , которая извлекает текст из предварительно проанализированного и подготовленного CAPTCHA-изображения.
  3. Поддерживает использование различных кодировок в системе распознавания.

Думаю, общий смысл понятен, поэтому предлагаю посмотреть, как это выглядит. Универсальность утилиты не могла не привести к усложнению ее интерфейса, поэтому окно программы может ввести в небольшой ступор. Так что, перед тем как переходить непосредственно к распознаванию капч, предлагаю разобраться с ее интерфейсом и заложенным функционалом.


Предварительная обработка изображений и извлечение
текста из капчи

About

Мы не могли не сказать хотя бы пары слов об авторе замечательной утилиты TesserCap. Его зовут Гурсев Сингх Калра. Он работает главным консультантом в подразделении профессиональных услуг Foundstone, которое входит в состав компании McAfee. Гурсев выступал на таких конференциях, как ToorCon, NullCon и ClubHack. Является автором инструментов TesserCap и SSLSmart. Помимо этого, разработал несколько инструментов для внутренних нужд компании. Любимые языки программирования - Ruby, Ruby on Rails и C#. Подразделение профессиональных услуг Foundstone®, в котором он трудится, предлагает организациям экспертные услуги и обучение, обеспечивает постоянную и действенную защиту их активов от самых серьезных угроз. Команда подразделения профессиональных услуг состоит из признанных экспертов в области безопасности и разработчиков, имеющих богатый опыт сотрудничества с международными корпорациями и государственными

Интерфейс. Вкладка Main

После запуска программы перед нами предстает окно с тремя вкладками: Main, Options, Image Preprocessing. Основная вкладка содержит элементы управления, которые используются для запуска и остановки теста CAPTCHA-изображения, формирования статистики теста (сколько отгадано, а сколько нет), навигации и выбора изображения для предварительной обработки. В поле для ввода URL-адреса (элемент управления № 1) должен быть указан точный URL-адрес, который веб-приложение использует для извлечения капч. URL-адрес можно получить следующим образом: кликнуть в правой части CAPTCHA-изображения, скопировать или просмотреть код страницы и извлечь URL-адрес из атрибута src тега изображения ..сайт/common/rateit/captcha.asp?. Рядом со строкой адреса находится элемент, задающий количество капч, которые нужно загрузить для тестирования. Так как приложение может одновременно показывать только 12 изображений, в нем предусмотрены элементы управления для постраничного пролистывания загруженных капч. Таким образом, при масштабном тестировании мы сможем пролистывать загруженные капчи и просматривать результаты их распознавания. Кнопки Start и Stop запускают и останавливают тестирование соответственно. После тестирования нужно оценить результаты распознавания изображений, отметив каждый из них как корректный или некорректный. Ну и последняя, наиболее значимая функция служит для передачи любого изображения в систему предварительной обработки, в которой задается фильтр, удаляющий с изображения шумы и искажения. Чтобы передать картинку в систему предварительной обработки, надо щелкнуть на требуемом изображении правой кнопкой мыши и в контекстном меню выбрать пункт Send To Image Preprocessor.

Интерфейс. Вкладка Options

Вкладка опций содержит различные элементы управления для конфигурирования TesserCap. Здесь можно выбрать OCR-систему, задать параметры веб-прокси, включить переадресацию и предварительную обработку изображений, добавить пользовательские HTTP-заголовки, а также указать диапазон символов для системы распознавания: цифры, буквы в нижнем регистре, буквы в верхнем регистре, специальные символы.

Теперь о каждой опции поподробней. Прежде всего, можно выбрать OCR-систему. По умолчанию доступна только одна - Tesseract-ORC, так что заморачиваться с выбором тут не придется. Еще одна очень интересная возможность программы - выбор диапазона символов. Возьмем, например, капчу с сайт - видно, что она не содержит ни одной буквы, а состоит только из цифр. Так зачем нам лишние символы, которые только увеличат вероятность некорректного распознавания?. Но что если выбрать Upper Case? Сможет ли программа распознать капчу, состоящую из заглавных букв любого языка? Нет, не сможет. Программа берет список символов, используемых для распознавания, из конфигурационных файлов, находящихся в \Program Files\Foundstone Free Tools\TesserCap 1.0\tessdata\configs. Поясню на примере: если мы выбрали опции Numerics и Lower Case, то программа обратится к файлу lowernumeric, начинающемуся с параметра tesseditchar whitelist. За ним следует список символов, которые будут использоваться для решения капчи. По умолчанию в файлах содержатся только буквы латинского алфавита, так что для распознавания кириллицы надо заменить или дополнить список символов.

Теперь немного о том, для чего нужно поле Http Request Headers. Например, на некоторых веб-сайтах нужно залогиниться, для того чтобы увидеть капчу. Чтобы TesserCap смогла получить доступ к капче, программе необходимо передать в запросе HTTP такие заголовки, как Accept, Cookie и Referrer и т. д. Используя веб-прокси (Fiddler, Burp, Charles, WebScarab, Paros и т. д.), можно перехватить посылаемые заголовки запроса и ввести их в поле ввода Http Request Headers. Еще одна опция, которая наверняка пригодится, - это Follow Redirects. Дело в том, что TesserCap по умолчанию не следует переадресации. Если тестовый URL-адрес должен следовать переадресации для получения изображения, нужно выбрать эту опцию.

Ну и осталась последняя опция, включающая/отключающая механизм предварительной обработки изображений, который мы рассмотрим далее. По умолчанию предварительная обработка изображений отключена. Пользователи сначала настраивают фильтры предварительной обработки изображений согласно тестируемым CAPTCHA-изображениям и затем активируют этот модуль. Все CAPTCHA-изображения, загружаемые после включения опции Enable Image Preprocessing, проходят предварительную обработку и уже затем передаются в OCR-систему Tesseract для извлечения текста.

Интерфейс. Вкладка Image Preprocessing

Ну вот мы и добрались до самой интересной вкладки. Именно тут настраиваются фильтры для удаления с капч различных шумов и размытий, которые стараются максимально усложнить задачу системе распознавания. Процесс настройки универсального фильтра предельно прост и состоит из девяти этапов. На каждом этапе предварительной обработки изображения его изменения отображаются. Кроме того, на странице имеется компонент проверки, который позволяет оценить правильность распознавания капчи при наложенном фильтре. Рассмотрим подробно каждый этап.

Этап 1. Инверсия цвета

На данном этапе инвертируются цвета пикселей для CAPTCHA-изображений. Код, представленный ниже, демонстрирует, как это происходит:

For(each pixel in CAPTCHA) { if (invertRed is true) new red = 255 – current red if (invertBlue is true) new blue = 255 – current blue if (invertGreen is true) new green = 255 – current green }

Инверсия одного или нескольких цветов часто открывает новые возможности для проверки тестируемого CAPTCHA-изображения.

Этап 2. Изменение цвета

На данном шаге можно изменить цветовые компоненты для всех пикселей изображения. Каждое числовое поле может содержать 257 (от  1 до 255) возможных значений. Для RGB-компонентов каждого пикселя в зависимости от значения в поле выполняются следующие действия:

  1. Если значение равно -1, соответствующий цветовой компонент не меняется.
  2. Если значение не равно -1, все найденные компоненты указанного цвета (красный, зеленый или синий) меняются в соответствии с введенным в поля значением. Значение 0 удаляет компонент, значение 255 устанавливает его максимальную интенсивность и т. д.

Этап 3. Градация серого (Шкала яркости)

На третьем этапе все изображения конвертируются в изображения в градациях серого. Это единственный обязательный этап преобразования изображений, который нельзя пропустить. В зависимости от выбранной кнопки выполняется одно из следующих действий, связанных с цветовой составляющей каждого пикселя:

  1. Average -> (Red + Green + Blue)/3.
  2. Human -> (0.21 * Red + 0.71 * Green + 0.07 * Blue).
  3. Average of minimum and maximum color components -> (Minimum (Red + Green + Blue) + Maximum (Red + Green + Blue))/2.
  4. Minimum -> Minimum (Red + Green + Blue).
  5. Maximum -> Maximum (Red + Green + Blue).

В зависимости от интенсивности и распределения цветовой составляющей CAPTCHA любой из этих фильтров может улучшить извлекаемое изображение для дальнейшей обработки.


Этап 4. Сглаживание и резкость

Чтобы усложнить извлечение текста из CAPTCHA-изображений, в них добавляют шум в форме однопиксельных или многопиксельных точек, посторонних линий и пространственных искажений. При сглаживании изображения возрастает случайный шум, для устранения которого потом используются фильтры Bucket или Cutoff. В числовом поле Passes следует указать, сколько раз нужно применить соответствующую маску изображения перед переходом на следующий этап. Давай рассмотрим компоненты фильтра для сглаживания и повышения резкости. Доступны два типа масок изображения:

  1. Фиксированные маски. По умолчанию TesserCap имеет шесть наиболее популярных масок изображения. Эти маски могут сглаживать изображение или повышать резкость (преобразование Лапласа). Изменения отображаются сразу же после выбора маски с помощью соответствующих кнопок.
  2. Пользовательские маски изображения. Пользователь также может настроить пользовательские маски обработки изображений, вводя значения в числовые поля и нажимая кнопку Save Mask. если сумма коэффициентов в этих окошках меньше нуля, выдается ошибка и маска не применяется. При выборе фиксированной маски кнопку Save Mask использовать не требуется.

Этап 5. Вводим оттенки серого

На этом этапе обработки изображения его пиксели могут быть окрашены в широкий диапазон оттенков серого. Этот фильтр отображает распределение градаций серого в 20 бакетах (bucket)/диапазонах. Процент пикселей, окрашенных в оттенки серого в диапазоне от 0 до 12, указан в бакете (bucket) 0, процент пикселей, окрашенных в оттенки серого в диапазоне от 13 до 25, - в бакете (bucket) 1 и т. д. Пользователь может выбрать одно из следующих действий для каждого диапазона значений, соответствующих оттенкам серого:

  1. Оставить без изменения (Leave As Is).
  2. Заменить белым (White).
  3. Заменить черным (Black).

Благодаря этим опциям можно контролировать различные диапазоны оттенков серого, а также сокращать/удалять шум путем, меняя оттенки серого в сторону белого или черного.

Этап 6. Настройка отсечения (cutoff)

Этот фильтр строит график зависимости значения уровня серого от частоты встречаемости и предлагает выбрать отсечение. Принцип работы отсекающего фильтра показан ниже в псевдокоде:

If (pixel’s grayscale value <= Cutoff) pixel grayscale value = (0 OR 255) -> в зависимости, от того какая опция выбрана (<= или => : Set Every Pixel with value <=/=> Threshold to 0. Remaining to 255)

График показывает подробное распределение пикселей CAPTCHA по цветам и помогает удалить помехи с помощью отсечения значений уровня серого.

Этап 7: Обтесывание (chopping)

После применения сглаживающего, отсекающего, bucket- и других фильтров CAPTCHA-изображения все еще могут быть зашумлены однопиксельными или многопиксельными точками, посторонними линиями и пространственными искажениями. Принцип работы фильтра обтесывания заключается в следующем: если количество смежных пикселей, окрашенных в данный оттенок серого, меньше величины в числовом поле, фильтр обтесывания присваивает им значение 0 (черный) или 255 (белый) по выбору пользователя. При этом CAPTCHA анализируется как в горизонтальном, так и в вертикальном направлении.

Этап 8: Изменение ширины границы

Как утверждает автор утилиты, в ходе первоначальных исследований и разработки TesserCap он неоднократно отмечал, что, когда CAPTCHA-изображения имеют толстую граничную линию и ее цвет отличается от основного фона CAPTCHA, некоторые системы OCR не могут распознать текст. Данный фильтр предназначен для обработки граничных линий и их изменения. Граничные линии с шириной, которая указана в числовом поле, окрашиваются в черный или белый по выбору пользователя.

Этап 9: Инверсия серого оттенка

Этот фильтр проходит каждый пиксель и заменяет его значение уровня серого новым, как показано ниже в псевдокоде. Инверсия серого проводится для подгонки изображения под цветовые настройки OCR-системы.

For(each pixel in CAPTCHA) new grayscale value = 255 – current grayscale value

Этап 10: Проверка распознавания капчи

Цель данного этапа - передать предварительно обработанное CAPTCHA-изображение OCR-системе для распознавания. Кнопка Solve берет изображение после фильтра инверсии серого, отправляет в OCR-систему для извлечения текста и отображает возвращенный текст в графическом интерфейсе. Если распознанный текст совпадает с текстом на капче, значит, мы правильно задали фильтр для предварительной обработки. Теперь можно перейти на вкладку опций и включить опцию предварительной обработки (Enable Image Preprocessing) для обработки всех последующих загруженных капч.

Распознаем капчи

Ну что ж, пожалуй, мы рассмотрели все опции этой утилиты, и теперь неплохо было бы протестировать какую-нибудь капчу на прочность..


Результат анализа капчи сайт с предварительной
обработкой изображений. Судя по результатам, фильтр
подобрать не удалось

Итак, запускаем утилиту и идем на сайт журнала. Видим список свежих новостей, заходим в первую попавшуюся и пролистываем до места, где можно оставить свой комментарий. Ага, коммент так просто не добавить (еще бы, а то бы давно уже всё заспамили) - нужно вводить капчу. Ну что ж, проверим, можно ли это автоматизировать. Копируем URL картинки и вставляем его в адресную строку TesserCap. Указываем, что нужно загрузить 12 капч, и нажимаем Start. Программа послушно загрузила 12 картинок и попыталась их распознать. К сожалению, все капчи оказались либо не распознаны, о чем свидетельствует надпись -Failed- под ними, либо распознаны неправильно. В общем, неудивительно, так как посторонние шумы и искажения не были удалены. Этим мы сейчас и займемся. Жмем правой кнопкой мыши на одну из 12 загруженных картинок и отправляем ее в систему предварительной обработки (Send To Image Preprocessor). Внимательно рассмотрев все 12 капч, видим, что они содержат только цифры, поэтому идем на вкладку опций и указываем, что распознавать нужно только цифры (Character Set = Numerics). Теперь можно переходить на вкладку Image Preprocessing для настройки фильтров. Сразу скажу, что поигравшись с первыми тремя фильтрами («Инверсия цвета», «Изменение цвета», «Градация серого») я не увидел никакого положительного эффекта, поэтому оставил там всё по дефолту. Я выбрал маску Smooth Mask 2 и установил количество проходов равным одному. Фильтр Grayscale buckets я пропустил и перешел сразу к настройке отсечения. Выбрал значение 154 и указал, что те пиксели, которых меньше, нужно установить в 0, а те, которых больше, в 255. Чтобы избавиться от оставшихся точек, включил chopping и изменил ширину границы до 10. Последний фильтр включать не было смысла, поэтому я сразу нажал на Solve.

На капче у меня было число 714945, но программа распознала его как 711435. Это, как видишь, совершенно неверно. В конечном итоге, как я ни бился, нормально распознать капчу у меня так и не получилось. Пришлось экспериментировать с pastebin.com, которые без проблем удалось распознать. Но если ты окажешься усидчивее и терпеливее и сумеешь получить корректное распознавание капч с сайт, то сразу заходи на вкладку опций и включай предварительную обработку изображений (Enable Image Preprocessing). Затем переходи на Main и, кликнув на Start, загружай свежую порцию капч, которые теперь будут предварительно обрабатываться твоим фильтром. После того, как программа отработает, отметь корректно/некорректно распознанные капчи (кнопки Mark as Correct/Mark as InCorrect). С этого момента можно посматривать сводную статистику по распознаванию с помощью Show Statistics. В общем-то, это своеобразный отчет о защищенности той или иной CAPTCHA. Если стоит вопрос о выборе того или другого решения, то с помощью TesserCap вполне можно провести свое собственное тестирование.

Результат проверки CAPTCHA на популярных сайтах

Веб-сайт и доля распознанных капч:

  • Wikipedia > 20–30 %
  • Ebay > 20–30 %
  • reddit.com > 20–30 %
  • CNBC > 50 %
  • foodnetwork.com > 80–90 %
  • dailymail.co.uk > 30 %
  • megaupload.com > 80 %
  • pastebin.com > 70–80 %
  • cavenue.com > 80 %

Заключение

CAPTCHA-изображения являются одним из самых эффективных механизмов по защите веб-приложений от автоматизированного заполнения форм. Однако слабые капчи смогут защитить от случайных роботов и не устоят перед целенаправленными попытками их решить. Как и криптографические алгоритмы, CAPTCHA-изображения, тщательно протестированные и обеспечивающие высокий уровень безопасности, являются самым лучшим способом защиты. На основе статистики, которую привел автор программы, я выбрал для своих проектов reCaptcha и буду рекомендовать ее всем своим друзьям - она оказалось самой стойкой из протестированных. В любом случае не стоит забывать, что в Сети есть немало сервисов, которые предлагают полуавтоматизированное решение CAPTCHA. Через специальный API ты передаешь сервису изображение, а тот через непродолжительное время возвращает решение. Решает капчу реальный человек (например, из Китая), получая за это свою копеечку. Тут уже никакой защиты нет. 🙂

Статьи по теме: