首页 > 代码库 > python for android : BeautifulSoup 有 bug
python for android : BeautifulSoup 有 bug
BeautifulSoup 善于网页数据分析 。可是 python for android : BeautifulSoup 有 bug ,
text = h4.a.text 仅仅能取得 None,因此我写了function: getText()
来fix this bug.
比如: 抓取CSDN极客头条内容 soup.py
import urllib2, re from BeautifulSoup import BeautifulSoup import sys reload(sys) sys.setdefaultencoding(‘utf-8‘) def getText(text): begin = text.find(‘>‘,0) if begin > -1: begin += 1 end = text.find(‘</a>‘,begin) if begin < end: return text[begin:end].strip() else: return None else: return None page = urllib2.urlopen("http://geek.csdn.net/new") soup = BeautifulSoup(page) for h4 in soup.findAll(‘h4‘): if h4.a is not None: href = http://www.mamicode.com/h4.a.get(‘href‘)>
请參考: http://www.crummy.com/software/BeautifulSoup/bs3/documentation.zh.html
python for android : BeautifulSoup 有 bug
声明:以上内容来自用户投稿及互联网公开渠道收集整理发布,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任,若内容有误或涉及侵权可进行投诉: 投诉/举报 工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。