
一个绕过Google谷歌验证码reCAPTCHA的方法
安全
2019-08-16 13:15
声明:该文章由作者(ksbugs)发表,转载此文章须经作者同意并请附上出处(0XUCN)及本页链接。。
在很多反向代理场景,或是爬虫中我们都会使用脚本程序提取搜索结果而不是使用谷歌镜像。但谷歌搜索(google)的反爬虫及异常流量标准会给我们带来很多麻烦,一旦出现验证码reCAPTCHA,就基本中断了数据。今天体验盒子介绍一个方法可以绕开谷歌搜索永远不出现验证码的方案。
绕开谷歌搜索验证码reCAPTCHA
Facebook 有一个调试工具。有趣的是,Google不会限制此调试程序发出的请求(列入白名单?),因此可以用来绕开Google搜索结果而不会被验证码阻止。由于涉及facebook,每个请求都必须向库提供一个 facebook 会话 Cookie
。
方案已经有了,下面只要实现它就行了,这里分享一个现成的谷歌搜索结果提取脚本,并且就是基于该方法绕开验证码的。
goop
谷歌搜索脚本,基于Python,
安装
pip install goop
或
git clone https://github.com/s0md3v/goop.git
from goop import goop page_1 = goop.search('red shoes', '<your facebook cookie>') page_2 = goop.search('red_shoes', '<your facebook cookie>', page='1') include_omitted_results = goop.search('red_shoes', '<your facebook cookie>', page='8', full=True)
使用示例
返回的数据结构
{ "0": { "url": "https://example.com", "text": "Example webpage", "summary": "This is an example webpage whose aim is to demonstrate the usage of ..." }, "1": { ...
cli.py
通过使用以下命令从终端执行谷歌搜索来演示使用情况
python cli.py <query> <number_of_pages>
至此,已经完整走过一遍绕开谷歌搜索结果验证码的流程,你可以将该方法融入到任何项目中。
但也要注意,故意绕开谷歌搜索验证码及使用facebook调试方法进行目的的操作都是不可取及不长久的。仅限用于概念验证而非非法使用。
[超站]友情链接:
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
关注数据与安全,洞悉企业级服务市场:https://www.ijiandao.com/
排名
热点
搜索指数
- 1 牢记统帅嘱托 建设一流军队 7903995
- 2 外交部评石平:数典忘祖出卖良知 7809181
- 3 被中方宣布制裁的石平是谁 7712205
- 4 一条古道 一面战旗 一个村庄 7617965
- 5 人民日报谈“禁带电话手表到学校” 7524267
- 6 网友拍的血月太抽象了 7428785
- 7 净网:女子摆拍嫁到国外贫民窟被罚 7331044
- 8 西藏一县有垃圾场现大量藏马熊觅食 7237416
- 9 开学季著名景点:“爸拿马运河” 7137227
- 10 272万网民选的军训服改良版穿上了 7048290