首页 > 代码库 > 文件编码解读
文件编码解读
1 lines (8 sloc) 333 Bytes 2 from urllib.request import urlopen 3 from bs4 import BeautifulSoup 4 5 html = urlopen("http://en.wikipedia.org/wiki/Python_(programming_language)") 6 bsObj = BeautifulSoup(html, "html.parser") 7 content = bsObj.find("div", {"id":"mw-content-text"}).get_text() 8 content = bytes(content, "UTF-8") 9 content = content.decode("UTF-8") 10 print(content)
1 from urllib.request import urlopen 2 3 textPage = urlopen("http://www.pythonscraping.com/pages/warandpeace/chapter1.txt") 4 print(str(textPage.read(),‘utf-8‘))用字符串转换编码
文件编码解读
声明:以上内容来自用户投稿及互联网公开渠道收集整理发布,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任,若内容有误或涉及侵权可进行投诉: 投诉/举报 工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。