-
Python爬虫报错:(Caused by SSLError(SSLEOFError(8, ‘EOF occurred in violation of protocol (_ssl.c:1129)’)))解决
今天在写爬虫的时候遇到一个错误,即: requests.exceptions.SSLError: HTTPSConnectionPool(host='httpbin.org', port=443): Max retries exceeded with url: /get (Caused by SSLError(SSLEOFError(8, 'EOF occurred …...塵風
- 0
- 0
- 16.3k
-
PyCharm破解教程(简单长期稳定)
PyCharm破解教程(简单长期稳定)分享,本人重装系统后需要重新安装很多东西,pycharm就是其中一个,下面分享下pycharm的破解教程。如果你也想重装系统的话,可以点这里查看我分享的教程:简单快速重装windows纯净原版操作系统教程(无需U盘无需设置Bios) 注意:本文所分享的内容已经有较长时间了,具体是否可用博主已经不确定了,如果还需要使用旧版本pycharm的小伙伴可以试试,不然建…...塵風
- 0
- 0
- 3.2k
-
Python for 循环列表每次取值指定个数元素
Python中的for循环是我们非常经常使用的语句,for 循环用于迭代序列(即列表,元组,字典,集合或字符串),会将序列里面的值依次取出,有些时候我们需要循序一次取值多个元素就不行了,所以这篇文章来分享下Python for 循环每次从列表中取指定个数元素方法:我们可以使用range() 函数获取列表长度然后指定步长配合列表索引取值的方式来实现,下面是示例代码: 示例代码 range() 函数简…...塵風
- 0
- 0
- 349
-
解决python:AttributeError: ‘set’ object has no attribute ‘items’错误记录
在之前写爬虫代码的时候,我自以为认代码各方面的都没问题了,但是出现了这样一个错误: AttributeError: 'set' object has no attribute 'items' 手动苦笑不得,检查了一遍代码发现都没问题,但是运行还是出现这个错误,于是我就果断百度了下, 出现这个错误可能是我们把一组dict,用逗号相隔了 例如{“id”,id}应…...塵風
- 0
- 0
- 1.7k
-
Python如何只导出当前Python文件所需模块包依赖
Python如何只导出当前Python文件所需模块包依赖? 之前在Python虚拟环境使用文章我分享过使用pip freeze导出当前虚拟环境的模块,但是有时候我们写的脚本只需要导出单个文件或者项目目录不是整个虚拟环境的时候,就不行了; 如果只需要导出当前Python文件所需模块包依赖我们可以使用pipreqs模块,下面是pipreqs的使用方法和经验分享: 安装pipreqs库 pip inst…...塵風
- 0
- 0
- 943
-
Python 将字符串转为字典
Python 将字符串转为字典可以使用ast模块中的literal_eval方法或者是json模块、eval方法。下面分享下这三种方法的示例代码: 注:虽然上面列举了三个在Python中可以实现将字符串转为字典的方法,但是推荐使用ast模块中的literal_eval方法进行,具体的原因会在下述说明,下面是详细的代码: 通过 json 来转换 我们可以直接使用json模块中的loads函数对字符串…...塵風
- 0
- 0
- 518
-
python requests请求之timeout参数
requests请求之timeout参数 1、python 的requests请求都可以使用timeout参数。2、timeout参数可以传入一个简单的浮点数,它将请求的连接部分和读取部分设为相同的超时时间。3、timeout参数也可以传入一个包含两个简单浮点数的元组,用来分别设置请求超时时间和读取超时时间。 举例说明: 1、传入简单浮点数: import requests # 设置超时时间为1秒…...塵風
- 0
- 0
- 1k
-
Python3 sorted() 函数 – 对所有可迭代的对象进行排序操作
sorted() 函数描述 Python3 sorted() 函数是python 3 中的一个内置函数,sorted() 函数作用是可以对所有可迭代的对象进行排序操作。 PS:有时候我们需要对拿到的字典之类的数据进行排序,就可以直接使用这个函数,而不需要进行for循环这样的操作去处理啦,如果数据是列表的话,也可以使用sort()函数,具体可以看我之前的文章:python sort()函数详解。 s…...塵風
- 0
- 0
- 784
-
Python requests获取状态码
Python requests获取状态码可以通过status_code获取,例如: r = requests.get('https://httpbin.org/get') print(r.status_code) # 打印状态码 但是:requests默认不会获取301/302状态码。使用上述代码如果请求了一个被301/302跳转的URL,也会返回跳转后的状态码,如果是正常请求…...塵風
- 0
- 0
- 1.3k
-
在Python中打开文件使用utf-8-sig和utf-8的区别
今天在使用Python读取CSV文件的时候,出现了一个KeyError的错误的,这个错误提示很明显,就是没有对应的列名,但是经过检查我的CSV文件中是有对应的列名的呀,然后编码格式我也检查了,这个时候我就想先打印列名看下,打印后就看出问题了。 问题原因 假设通过Excel打开我的CSV文件,列名是:列名1、列名2... 但是打印出的结果是如下: ['\ufeff列名1', …...塵風
- 0
- 0
- 395
-
Python xlrd 报错xlrd.biffh.XLRDError: Excel xlsx file; not supported异常解决
之前我分享了:Python Excel常用操作库+使用笔记分享,有Python基础的小伙伴想学习下Python操作Excel进行自动化办公或者是进行数据保存到Excel就可以参考学习,今天来分享下Python xlrd 报错xlrd.biffh.XLRDError: Excel xlsx file; not supported…这个异常的解决办法(我猜大部分人是因为以前学习了xlrd 然后直接co…...塵風
- 0
- 0
- 603
-
Python爬虫requests参数timeout以及retrying的使用
timeout参数的使用 在某些网络情况不好或者服务器端异常的情况会出现请求慢或者请求异常的情况,这个时候我们需要给请求设置一个超时时间,而不是让程序一直在等待结果。写一个简单的例子: import .requests response = requests.get('https://www.linfengnet.com/', timeout=3) print(response…...塵風
- 0
- 0
- 951
-
fake-useragent模块报错:rror occurred during loading data. Trying to use cache server解决方法
rror occurred during loading data. Trying to use cache server报错原因: fake-useragent模块需要在线下载包含useragent信息的json文件,但是由于国内网络的特殊原因,现在如果直接使用,会出现如下报错提示: rror occurred during loading data. Trying to use cache s…...塵風
- 0
- 0
- 660
-
Python获取字典的前x个元素
Python获取字典的前*个元素我们可以使用itertools中的islice函数实现或者是sorted函数、Counter(dict).most_common()函数实现,再Python中列表实现这样的需求就很简单,我们可以直接通过切片获取,不过字典没有切片,我们就先取出所有 keys,再用拿到的key去取value,在组成一个新的字典就可以了。 注意: sorted函数、Counter(dic…...塵風
- 0
- 0
- 764
-
Python爬虫:设置随机User-Agent模块fake-useragent
Python爬虫:设置随机User-Agent模块fake-useragent介绍和使用。 模块简介 GitHub地址 https://github.com/hellysmile/fake-useragent UA数据来源 目前1.5x的版本我看GitHub介绍数据是从 https://user-agents.net/ 下载的。下面的使用的部分示例是1.2或者1.3版本新增的功…...塵風
- 0
- 0
- 2.8k
-
使用Python检查提取网站死链
网站死链会影响我们的用户体验和搜索引擎对我们站点的评分(尤其是网站存在已经被做成赌博、色情网站的链接,影响很大),但是网站运营时长长了,就难免会有这样的问题,所以我们可以考虑定期的处理下,我之前分享过一些WordPress死链、外部链接处理的文章,如果你是使用WordPress,就可以直接参考下述的文章去解决: WordPress去除文章失效链接 WordPress文章外部链接清除 WordPre…...塵風
- 0
- 0
- 289
-
百度已收录404链接自动提取软件+使用教程-免费
软件介绍 现在有非常多的网站被黑然后搜索被搜索引擎收录了色情赌博一类的垃圾信息,我们站点被黑处理完成后把这些垃圾信息链接设置为404就需要对这些已经收录的链接进行提取,然后提交到百度资源平台删除,但是对于大部分没有技术基础的小伙伴来说,都只能一个个手动去复制,这样太过于麻烦了,所有开发了这个软件分享给大家。 关于处理流程的教程,我之前也分享了相关文章,如果你有需要,也可以查看: 网站被黑,被搜索引…...塵風
- 0
- 6
- 577
-
Python列表合并的6种方法
Python列表合并的6种方法分享,下面我共列举了6中合并列表的方法,在单个或者少量(3个内?)我们可以直接使用运算符+或者+=或者extend就可以轻松的实现合并,如果列表数量太多,可以考虑使用chain,详细的介绍和示例代码大家往下看吧。 准备数据 首先我们准备三个列表作为测试学习使用数据,下面的代码中不在重复。 # 以三个全是名字元素的列表作为测试数据 name_list_1 = […...塵風
- 0
- 0
- 414
-
Python sort()函数详解 – Python列表排序函数
Python sort()函数介绍 sort()函数是Python 列表的一个方法,是python中的内置函数,sort()函数可以对列表进行就地排序。 只使用<来比较项之间的关系。如果任何比较操作失败,异常将不会被屏蔽(在排序过程中发生任何比较操作失败的异常,该异常将会被抛出,而不会被程序自动处理或忽略。) - 如果任何比较操作失败,整个排序操作将失败(并且列表可能会处于部分修改的状态)。…...塵風
- 0
- 0
- 716
-
Python requests 异常Max retries exceeded with url: 请求地址… (Caused by SSLError(SSLCertVerificationError(1, ‘[SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed: unable to get local issuer certificate (_ssl.c:1129)’)))”))}解决
今天在写爬虫的时候遇见了如下错误: Max retries exceeded with url: https://******... (Caused by SSLError(SSLCertVerificationError(1, '[SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed: unable to get …...塵風
- 0
- 0
- 428