...
属性 | 类型 | 必须 | 说明 | ||||||
---|---|---|---|---|---|---|---|---|---|
type | string | 是 | CloudFlareTaskS2
| ||||||
websiteURL | string | 是 | 网页地址,需要识别的地址。 | ||||||
userAgent | string | 否 | 自定义Ua值 仅CloudFlareTaskS2类型支持 | ||||||
waitLoad | Bool | 否 | 是否必须等待页面加载完成(如果你需要完整内容) | ||||||
requiredCookies | List | 否 | 可以要求获取指定Cookies名称,默认为 可以指定多个,但不是一定能获取到 | ||||||
blockImage | Bool | 否 | 是否关闭图片加载,用于节省流量 | ||||||
proxy | String | 是 | 代理地址,支持以下格式:
注意:如果需要权限,请将以下地址加入白名单:
注意:CF盾对代理要求较高,请使用国际代理,如果报ERROR_CAPTCHA_UNSOLVABLE错误,请更换代理再试一下,也可以联系我们测试是否能过(绝大部份情况都能过) 注意:不要使用本地代理(127.0.0.1、localhost、192.168.x.x、172.0.x.x),本地代理只有你自己电脑才能访问,服务器访问不了! | ||||||
postData | Dict | 否 | 如果添加此字段,请求将会以Post的方式发送,如:
|
请求示例
代码块 | ||
---|---|---|
| ||
{ "clientKey": "cc9c18d3e263515c2c072b36a7125eecc078618f", "task": { "type": "CloudFlareTaskS2", "websiteURL": "https://nowsecure.nlin", "proxy": "http://JN3wWChA:Dsg7ckfv@45.91.239.47:62930", //请用你自己的代理,这个只是演示 "waitLoad": false, // 是否需要等待加载完成(如果你需要完整内容就写true,会增加识别时间) "requiredCookies": ["cf_clearance"] // 可以要求获取指定Cookies名称,可不填,不一定能获取到 } } |
响应示例
代码块 |
---|
{ "errorId": 0, "errorCode": "", "errorDescription": "", "taskId": "61138bb6-19fb-11ec-a9c8-0242ac110006" // 请记录此ID } |
...
代码块 | ||
---|---|---|
| ||
from curl_cffi import requests proxies = { 'http': "http://127.0.0.1:10911", 'https': "http://127.0.0.1:10911", } # 正常情况是这样的 response = requests.get("https://apkpure.com/", proxies=proxies) print("请求响应:", response.status_code) print("网页标题:", response.text[:63]) # 返回: # 请求响应: 403 # 网页标题: <!DOCTYPE html><html lang="en-US"><head><title>Just a moment... # 使用 curl_cffi.requests请求 # impersonate参数指定了模拟Chrome浏览器的指纹 response = requests.get( "https://apkpure.com/", proxies=proxies, impersonate="chrome110") print("请求响应:", response.status_code) print("网页标题:", response.text[:63]) # 返回: # 请求响应: 200 # 网页标题: <!DOCTYPE html><html lang="en"><head><title>Download APK on And |
测试DEMO
View file | ||
---|---|---|
|
代码块 |
---|
import requests import time import re # 创建任务创建任务函数 def create_task(url, proxy): data = {, client_key): """ 创建Cloudflare防护页面的任务 :param url: 目标网址 # 填您自己的密钥 :param proxy: 代理服务器地址 "clientKey": clientKey,:param client_key: 客户端密钥 :return: 创建任务的响应结果 "task"": { data = { "typeclientKey": client_key, "CloudFlareTaskS2", "task": { # 指定chrome120内核 "type": "CloudFlareTaskS2", "userAgent": "", # 指定chrome内核, 可以为空,如:"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/120126.0.0.0 Safari/537.36", "waitLoad": FalseTrue, "websiteURL": url, "proxy": proxy } } api_url = "https://api.yescaptcha.com/createTask" #response url = "http://localhost:8000/createTask" response = requests.post(api_url, json=data).json() return response # 获取结果获取任务结果函数 def get_task(task_id, client_key): url = "http://api.yescaptcha.com/getTaskResult"" data = {获取任务的执行结果 # 填您自己的密钥:param task_id: 任务ID "clientKey":param client_key: clientKey,客户端密钥 :return: 任务结果的响应结果 "taskId": task_id }""" response = requests.post(url, json=data).json() return response # 完整的请求 def get_result(*args, **kwargs): uuid = create_task(*args, **kwargs) if not uuid or not uuid.get('taskId'): return uuid print("TaskID:", uuid) for i in range(30): time.sleep(3) result = get_task(uuid.get('taskId')) if result.get('status') == 'processing': continue elif result.get('status') == 'ready': return result else: raise Exception(result) if __name__ == '__main__' api_url = "https://api.yescaptcha.com/getTaskResult" data = { "clientKey": client_key, "taskId": task_id } response = requests.post(api_url, json=data).json() return response # 完整的请求函数 def get_result(url, proxy, client_key): """ 完整的创建任务并获取结果的流程 :param url: 目标网址 :param proxy: 代理服务器地址 :param client_key: 客户端密钥 :return: 任务执行结果 """ task_response = create_task(url, proxy, client_key) if not task_response or not task_response.get('taskId'): return #task_response 填您的密钥 clientKey = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx" print("TaskID:", task_response) for _ in range(30): # 填您自己的代理,不要填本地的地址 proxy = "http://JN3wWChA:Dsg7ckfv@176.222.59.86:64048" time.sleep(3) proxies = { result 'http': proxy, = get_task(task_response.get('taskId'), client_key) 'httpsif result.get('status') == 'processing': proxy, } continue # 要访问的网址 # url = "https://apkpure.com/"elif result.get('status') == 'ready': url = "https://billetterie.psg.fr/" return #result 正常情况是这样的:使用普通requests请求 # import requests else: # response = requests.get(url, proxies=proxies) #raise print("请求响应:", response.status_codeException(result) #return print({"网页标题:status", re.search(r"<title>(.*?)</title>", response.text)[0]): "timeout"} if __name__ == '__main__': # 客户端密钥, 登陆yescaptcha.com获取 client_key = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx" # 代理服务器地址,填您自己的代理地址 # 不要填本地地址(如:http://127.0.0.1:1080,http://localhost:1080这种,这个只有你自己能用) proxy = "http://user:password@103.147.170.108:64484" proxies = { 'http': proxy, # >>> 请求响应: 403'https': proxy, #} >>> 网页标题: <title>Attention Required! | Cloudflare</title> # 目标网址 # 使用 curl_cffi.requests请求 url = "https://nowsecure.in/" # from curl_cffi import requests# 使用普通requests请求 # response = requests.get(url, proxies=proxies, impersonate="chrome110") # print("请求响应:", response.status_code) # print("网页标题:", re.search(r"<title>(.*?)</title>", response.text)[0]) if response.text # >>> 如果使用curl_cffi就可以正常请求,说明并没有开启严格的5s盾 # >>> 请求响应: 403 else print("网页标题:", response.text[:1000]) # >>> 网页标题: <title>Just a moment...</title> print("是否为CF盾:", "cf_chl" in response.text) # 使用接口返回的值来请求 # 创建任务使用接口返回的值来请求 task_result = get_result(url, proxy=proxy, client_key) if not task_result.get("solution"): print("任务失败", task_result) exit() # 获取结果 solution = task_result.get("solution") # 从solution中获取请求头和cookies headers = solution.get("request_headers") headers.update(solution.get("headers")) cookies = solution.get("headers")"cookies") print("Headers:", headers) print("HeadersCookies:", headerscookies) cookies = solution.get("cookies") # 使用curl_cffi.requests请求 print("Cookies:", cookies) # 请先安装curl_cffi库,并且是pre版本:pip install curl_cffi --pre from curl_cffi import requests # 这里也配套指定impersonate="chrome120"as curl_requests response = curl_requests.get(url, headers=headers, cookies=cookies, proxies=proxies, impersonate="chrome120") print("请求响应:", response.status_code) print("网页标题:", re.search(r"<title>(.*?)</title>", response.text))[0]) if response.text else print("网页标题:", response.text[:1000]) print("是否为CF盾:", "cf_chl" in response.text) |