版本比较

密钥

  • 该行被添加。
  • 该行被删除。
  • 格式已经改变。
说明

本篇介绍供思路参考,文内介绍的参考DEMO:requestsselenium

ReCAPTCHA 介绍

可能大家还没听说过什么是 ReCAPTCHA,可能由于某些原因,这个在国内出现不多,不过想必大家应该多多少少见过或用过。它长这个样子:

...

其实上文所介绍的仅仅是 ReCAPTCHA 的一种形式,是 V2 的显式版本,另外其 V2 版本还有隐式版本,隐式版本在校验的时候不会再显式地出现验证页面,它是通过 JavaScript 将和提交按钮进行绑定,在提交表单的时候会自动完成校验。除了 V2 版本,Google 又推出了最新的 V3 版本,reCAPTCHA V3 会为根据用户的行为来计算一个分数,这个分数代表了用户可能为机器人的概率,最后通过概率来判断校验是否可以通过。其安全性更高、体验更好。

体验

那哪里可以体验到 ReCAPTCHA 呢?我们可以打开这个网站:https://www.google.com/recaptcha/api2/demo,建议科学上网,同时用匿名窗口打开,这样的话测试不会受到历史 Cookies 的干扰,如图所示:

...

当然靠人工是能解的,但对于爬虫来说肯定不行啊,那怎么自动化解呢?

接下来我们就来介绍一个简单好用的平台。

解决方案

本次我们介绍的一个 ReCAPTCHA 破解服务叫做 YesCaptcha,主页是 https://yescaptcha.com/,它现在同时可以支持 V2 和 V3版本的破解。

...

它有两个关键的 API,一个是创建服务任务,另一个是查询任务状态,API 如下:

API 文档可以参考这里:NoCaptchaTaskProxyless : reCaptcha V2 协议接口

...

代码块
6Le-wvkSAAAAAPBMRTvw0Q4Muexq9bi0DJwx_mJ-

好,万事俱备了,只差代码了!

开工

我们就用最简单 requests 来实现下吧,首先把常量定义一下:

...