首页 > 代码库 > beautiful soup解析有空格的class
beautiful soup解析有空格的class
用Python写一个爬虫,用BeautifulSoup解析html。
其中一个地方需要抓取下面两类标签:
<dd class="ab " >blabla1</dd>
<dd class="ab cd" >blabla2</dd>
第一类class的值的末尾有一个空格。
第二类class的值中间有一个空格,而且开头部分和第一类相同。
在css中,class的值不应该有空格,所以第一类会忽略空格,第二类会被当做多值属性。参考官方文档多值属性。
所以在处理时也不需再考虑class值中的空格。
传入参数时用列表过滤器是最方便的,如下:
soup.find_all("dd", class_= ["ab", "cd"])
beautiful soup解析有空格的class
声明:以上内容来自用户投稿及互联网公开渠道收集整理发布,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任,若内容有误或涉及侵权可进行投诉: 投诉/举报 工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。