首页 > 代码库 > [Python] - 使用chardet检查网页编码格式时发现的问题
[Python] - 使用chardet检查网页编码格式时发现的问题
最近在使用chardet检查网页编码格式时发现如下问题:
用urllib打开网页再检查编码格式和用urllib2打开网页检查编码格式结果不一样,所以urllib2打开可能导致问题,需要注意。
使用urllib2打开网页,检查编码格式:
结果如下,结果中出现了新浪网的字符编码格式为None的情况:
但如果使用urllib打开url,则不会出现检查不到编码格式的问题:
运行的结果中,所有URL的字符编码都侦测到了,结果如下:
[Python] - 使用chardet检查网页编码格式时发现的问题
声明:以上内容来自用户投稿及互联网公开渠道收集整理发布,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任,若内容有误或涉及侵权可进行投诉: 投诉/举报 工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。