我们有时候访问某站的时候一出来就是验证码,但是爬虫工作者不喜欢呢,有些时候,我们可以稍微欺骗一下哪些网站,先让他们知道我们前一步骤是认为访问的,他们相信了以后我们就赶紧换人,让机器自己上 selenium有一个远程调试的功能,这个地方就很有意思了,给你指定的IP和端口号,自己连去吧 所以我们只需要“手动”打开浏览器,这里以chrome为例
做爬虫最大的困扰就是对方的反爬措施,最好不要强攻,能绕过就绕过,毕竟上网需要科学 selenium 指纹被做了记号如何破?这个时候说明对方已经检测了你的行为特征,这是一个比较严肃的问题,尤其是在破解滑动验证码的时候 大厂的技术团队还是给了我们一个更难解决的问题,就是通过 js 给 webdriver 请求响应错误信息,所以我们要做的是把这些影响科学上网的 js 代码给废掉