Гостевая статья
Машинное обучение (machine learning, МО) теперь стало больше, чем модным словом. Учитывая огромный диапазон задач, которые, например, решает машинное обучение на Python (питон), вопрос обхода капчи — лишь очередная трудность. Рассматривая возможности свёрточных нейронных сетей, мы обнаружили большой потенциал в решении этой проблемы. Пока что пользователей не устраивают текущие показатели точности. Но давайте же подробно разберемся, какие инструменты у нас есть для решения этой проблемы и какие из них наиболее эффективны.
Термин “капча” больше не является новым в Интернет-сообществе. Эта надоедливая проверка “на человечность” присутствует на множестве сайтов. Аббревиатура CAPTCHA означает в переводе “полностью автоматизированный публичный тест Тьюринга, отличающий компьютеры от людей”. Капчу можно представить, как компьютерную программу, разработанную для отделения человека и машины, чтобы предотвратить любой вид нежелательной деятельности на веб-сайтах. Предположение, которое лежит в основе концепции капчи, состоит в том, что только человек способен пройти этот тест, а боты или автоматизированные скрипты потерпят неудачу.
Начать следует с того, что люди используют автоматическое решение капчи для различных целей, некоторые из которых являются противоправными, тогда как другие — совершенно безобидными. Спамеры используют решение капчи для массового получения адресов электронной почты пользователей, чтобы иметь возможность слать как можно больше спама. Безобидными же примерами являются случаи как, например, когда к вам присоединился новый клиент или деловой партнер и ему необходим доступ к вашему интерфейсу прикладного программирования (API), который не может быть предоставлен без предварительного прохождения капчи в связи с какой-либо проблемой безопасности или для защиты от взлома системы. Таким образом, у нас остается только обходить капчу с использованием автоматических скриптов.
Существуют различные типы капч: текстовая, на основе изображений, ReCaptcha, математическая капча. Их решение может иногда вызывать трудности, так как используемые в капчах и в ReCaptcha технологии становятся все умнее — речь идет о регулярных обновлениях.
Популярные методы, доступные пользователям для решения как обычных капч, так и ReCaptcha:
Далее мы рассмотрим эффективность каждого из методов.
Хотя метод OCR и является экономически выгодным, когда речь идет о решении большого количества простых капч, он всё же примитивен, как чайник и не обеспечивает требуемой точности. Решения на основе системы оптического распознавания символов стали редкостью после выхода Google ReCaptcha V3. Таким образом, боты с поддержкой OCR не созданы для того, чтобы решать капчи, используемые такими титанами, как Google, Facebook или Twitter — это потребует более совершенных методов.
Решения на основе оптического распознавания символов корректно распознают 1 из 3 простых капч.
Давайте посмотрим, как работают решения на основе машинного обучения:
Несмотря на то, что МО — усовершенствованный вариант OCR, это всё ещё несовершенная технология, где учителем изначально выступает человек. Точность этого способа намного лучше, чем решение любых текстовых капч методом OCR. Но и у этого решения есть множество недостатков, к тому же он решает только определенный вид капч, тогда как Google продолжает обновлять свой алгоритм генерации ReCaptcha, а Яндекс усложняет графические капчи. Последнее обновление, которое затронуло широкий круг пользователей, вероятно, самое лучшее в истории обновлений ReCaptcha: обычные пользователи ничего не почувствовали, тогда как автоматизированные решения либо вообще перестали работать, либо начали работать очень медленно.
При построении модели она была обучена в 10⁴ итерациях с правильными и случайными примерами и с 10⁵ тестовых изображений, и вот как она работала со средней точностью ~ 60%:
Таким образом, если ваш случай требует решения одного типа капч с довольно простой сложностью, то вы можете эффективно использовать такую обученную модель МО. Это решение работает лучше, чем OCR, но все же необходимо преодолеть немало барьеров, чтобы добиться удовлетворительной точности.
Онлайн-сервисы по распознаванию капч являются пока наилучшим решением проблемы. Идя в ногу со всеми обновлениями ReCaptcha от Google, они обеспечивают безупречную точность до 99%.
На сегодняшний день, по результатам проведённых исследований и разработок, существует множество недостатков в решениях на основе OCR и МО. Они могут решать только самые простые капчи и то без существенной точности. В этой связи, вот некоторые преимущества онлайн-сервисов:
Определившись с выбором метода решения капч, стоит более детально рассмотреть варианты онлайн-сервисов. Самые продвинутые из них обеспечивают высокую точность решений, поддержку API для автоматизации и быструю скорость. Они представлены такими сервисами, как RuCaptcha, Imagetyperz, CaptchaSniper и др.
RuCaptcha — один из лучших сервисов, с которым я сталкивался. Высокие скорость и точность, сервис доступен 24/7.
Преимущества RuCaptcha среди аналогичных сервисов:
Сверточные нейронные сети (CNN) научились обходить простейшие типы капч, что ведёт капчи к их дальнейшему активному развитию. Искусственный интеллект нейронных сетей (ANN), в свою очередь, пытается соответствовать этим изменениям, а капчи вновь становятся более сложными — и эта гонка никогда не закончится. Вот почему в данном вопросе человек пока что побеждает машину и онлайн-сервисы по решению капч, в которых задействованы люди-работники, будут опережать программные решения.
Краткий перевод: https://vuejs.org/guide/components/v-model.html Основное использование v-model используется для реализации двусторонней привязки в компоненте. Начиная с Vue…
Сегодня мы рады объявить о выпуске Vue 3.4 «🏀 Slam Dunk»! Этот выпуск включает в…
Vue.js — это универсальный и адаптируемый фреймворк. Благодаря своей отличительной архитектуре и системе реактивности Vue…
Недавно, у меня истек сертификат и пришлось заказывать новый и затем устанавливать на хостинг с…
Каким бы ни было ваше мнение о JavaScript, но всем известно, что работа с датами…
Все, кто следит за последними событиями в мире адаптивного дизайна, согласятся, что введение контейнерных запросов…
View Comments
Я использую капчу от Google и очень довольна. Капча эффективно помогает от спама, но я с вами согласна эта гонка никогда не закончится, поэтому нужно использовать последние версии капчи.