技术栈记录

标签：selenium

Selenium操作Firefox无界面浏览器

Selenium操作Firefox无界面浏览器

之前做爬虫的时候经常需要selenium模拟，我经常用的是Firefox和Chrome浏览器，但是在使用的时候总是会打开浏览器才能正常抓取数据，无奈之下下载了PhantomJS，但是呢PhantomJS其实官方已经放弃维护了，所以在运行程序的时候经常会被提示其已被弃用，经常会以为自己是代码出问题了。

Python 2019年04月01日

Selenium设置Chrome和PhantomJS的请求头信息

Selenium设置Chrome和PhantomJS的请求头信息

对于反爬虫来说，部分对策可以选择Selenium模拟器进行爬取，但是问题来了，如何设置请求头呢，模拟器是怎样伪装的呢？目录：一：selenium设置phantomjs请求头二：selenium设置chrome请求头三：selenium设置chrome–cookie 四：selenium设置phantomjs-图片不加载

Python 2019年04月29日

selenium登陆某宝的滑动怎么过

selenium登陆某宝的滑动怎么过

selenium登陆淘宝的滑动怎么过，确实淘宝在滑动这一块限制了很多条件没太多废话，上效果，在分析过程，上传code 由于现在大型网站对selenium工具进行检测，若检测到selenium，则判定为机器人，访问被拒绝。所以第一步是要防止被检测出为机器人，如何防止被检测到呢？当使用selenium进行自动化操作时，在chrome浏览器中的consloe中输入

爬虫 2020年06月25日

Python爬虫之selenium的检测与突破

Python爬虫之selenium的检测与突破

selenium 是一个很友好的网站调试工具，但是很多人都用来做爬虫，其实我也是用来做爬虫，毕竟好东西要共享，哈哈在做静态网页的请求的时候，普通的http/https可以很轻松的搞定，但是面对动态网页，很多内容都是通过后面的js加载出来的，如果还要用协议解决，希望你遇到的问题可以解决。在爬虫这一块，很多反爬虫对方对selenium并不是太友好

爬虫 2020年04月13日

Python爬虫之selenium半自动化处理

Python爬虫之selenium半自动化处理

我们有时候访问某站的时候一出来就是验证码，但是爬虫工作者不喜欢呢，有些时候，我们可以稍微欺骗一下哪些网站，先让他们知道我们前一步骤是认为访问的，他们相信了以后我们就赶紧换人，让机器自己上 selenium有一个远程调试的功能，这个地方就很有意思了，给你指定的IP和端口号，自己连去吧所以我们只需要“手动”打开浏览器，这里以chrome为例

爬虫 2020年04月15日