웹페이지 자동화를 위한 캡차(CAPTCHA) 우회 서비스

우리는 반복적으로 웹 페이지에 데이터를 입력하거나 수집하는 일이 있습니다.
학습을 위한 정보 수집일 수도 있고 회사 업무 생산성을 위해 사람을 대신하는 봇을 만들게 됩니다.

그러나 웹 페이지 관리자 입장에서 봇은 골칫거리입니다.
봇은 아주 빠른 속도로 다양한 요청이 가능하기 때문에 서버 부하나 불필요한 데이터를 만들기 때문에 사람과 봇을 구분하기 위한 방법으로 캡차(Captcha)를 추가합니다.

이 글은 캡차를 간략하게 소개하고 우회 서비스 3개를 추천합니다.

캡차(Captcha)란 무엇입니까?

CAPTCHA는 "Completely Automated Public Turing test to tell Computers and Humans Apart"의 약자로 사람만이 인지 가능한 문자 혹은 그림 해독하게 하여 사람과 컴퓨터 구별하는 것입니다.


초기에는 문자를 변형한 이미지를 해독하는 형태로 시작하여 최근에는 체크박스에 클릭하는 단순한 형태로 진화하였습니다.

동작 원리 및 자세한 정보가 궁금하다면 아래 문서를 참고하세요.

캡차(Captcha) 우회하는 방법은 있습니까?

방어 기술이 있다면 공격하는 기술도 항상 존재합니다.
공격 기술에는 크게 2가지로 나눠지고 있는데 첫 번째는 OCR(Optical Character Recognition)를 이용하는 방식이고 두 번째는 사람이 직접 해결해주는 방법이 있습니다.

OCR 방식은 문자 기반에서는 빠른 처리 속도로 해결이 가능했으나 현재 진화한 캡차 기술을 대응이 불가능한 상태입니다.
그래서 기술적으로 해결이 불가능한 캡차는 사람이 개입하는 방식의 서비스가 존재합니다.

개발자 혹은 사용자는 API 혹은 브라우저에 확장 프로그램을 설치로 간단하게 사용이 가능하며 이벤트가 발생하면 서비스 제공 업체가 고용한 사람들이 대응하는 프로세스입니다.

사람이 개입하기 때문에 응답 속도 지연과 성공률, 비용 산정 방식을 비교하여 선택하면 됩니다.

캡차 우회 서비스

많은 서비스 업체 중에 일부를 소개하며 더 많은 업체를 찾고 싶다면 "captcha solving service" 키워드로 검색을 추천합니다.

🔗 2Captcha


1,000개의 요청에 최소 $0.5 USD부터 시작되는 요금이며 실패 요청은 제외됩니다.

API 샘플과 문서화가 잘되어 있으며 처리 상태는 응답 속도와 대응이 가능한 인력 통계를 수치와 그래프로 상세하게 홈페이지에서 제공합니다.

API를 지원하는 언어는 Python, PHP, JavaScript, Go, C#, Ruby입니다.
우회가 가능한 캡차는 간단한 텍스트부터 reCaptcha V3까지 총 11개의 유형을 지원하고 있습니다.

다른 서비스와 다른 점은 2Captcha를 이용한 서비스 목록도 제공하고 있습니다.

🔗 Death by Captcha


1,000개의 요청에 대해 $1.39 USD부터 시작되는 요금이며 골드 회원은 $0.99로 시작한다고 합니다.

처리 상태는 간략하게 텍스트로 최근 1분의 정보만 제공합니다.

API를 지원하는 언어는 Python, PHP, Java, Node.js 등을 지원합니다.
우회가 가능한 캡차는 간단한 텍스트부터 reCaptcha V3를 지원하며 러시아어 혹은 중국어 지원도 가능하다고 합니다.

🔗 Anti-CAPTCHA


1,000개의 요청에 최소 $0.5 USD부터 시작하며 2007년부터 서비스를 시작하여 99.99% 가동하고 있다고 합니다.

문서화도 잘되어있으며 메인화면에 진행 처리 상태를 시각적으로 재미있게 표시하고 있습니다.

API를 지원하는 언어는 Python, PHP, JavaScript, Go, C#, Ruby, Java를 지원합니다.

결론

캡차 우회 서비스가 24시간 대응하려면 많은 인력을 확보가 필요합니다.
그래서 각 홈페이지에서는 인력을 모집하는 페이지를 운영하고 있습니다.

우회를 권장하는 것은 아니지만 봇을 이용한 반복 작업을 자동화가 필요한 경우가 있습니다.
그리고 봇을 차단하기 위한 캡차 적용이 의미 없는 기능도 아닙니다.
사람이 확인 후 응답하는 과정에서 지연 시간과 실패 가능성 등이 있기 때문에 의미 있는 기능입니다.