运行环境:python 3.6.0 一、关于concurrent.futures模块 Python 的标准库为我们提供了 threading 和multiprocessing 模块编写相应的多线程/多进程代码,但是当项目达到一定的规模,频繁创建/销毁进程或者线程是非常消耗资源的,这个时候我们就要编写自己的线程池/进程池,以空间换时间。但从Python3.2开始,标准库为我们提供了
运行环境:Python 3.6.0 Python 自带 pip ,可以通过 pip 安装大部分的第三方库,但是在这里还是有很大的缺陷的,因为我们要访问的第三方库的所在服务器位置在国外,通常我们下载的时候就会特别慢,那么有没有什么办法可以解决一下,当然有。 pip镜像下载 阿里云:http://mirrors.aliyun.com/pypi/simple/
运行环境: python 3.6.0 关于如何判断一个字符串是否含有中文这个问题,那么一定得知道什么是编码,计算机不会直接告诉你什么是中文,什么不是中文的,计算机只认识二进制,一切的字符在计算机中都是以二进制的形式进行存储,计算机同时也只能运行二进制。 我们平时在计算机中所见到的所有字符都是以ascii码表的形式存储的,然后对应的 adcii 以相应的方式转存为二进制,
运行环境:python3.6.0 当我们从其他地方都去一些数据并处理这些数据的时候,有的时候会出现读取到的是 unicode 编码, \u5c45\u7136\u662funicode\u7f16\u7801\uff0c\u8fd9\u53ef\u628a\u6211\u7ed9\u6025\u574f\u4e86...... 而且此时在代码的第一行声明编码(如:
对于反爬虫来说,部分对策可以选择Selenium模拟器进行爬取,但是问题来了,如何设置请求头呢,模拟器是怎样伪装的呢? 目录: 一:selenium设置phantomjs请求头 二:selenium设置chrome请求头 三:selenium设置chrome–cookie 四:selenium设置phantomjs-图片不加载