首页 > 代码库 > 爬虫5:Beautiful Soup的css选择器
爬虫5:Beautiful Soup的css选择器
学习于:http://cuiqingcai.com/1319.html
用到的方法是 soup.select(),返回类型是 list,用 get_text() 方法来获取它的内容
(1)通过标签名查找
print soup.select(‘title‘) print soup.select(‘a‘) print soup.select(‘b‘)
(2)通过类名查找
print soup.select(‘.sister‘)
(3)通过 id 名查找
print soup.select(‘#link1‘)
(4)组合查找
#查找 p 标签中,id 等于 link1的内容 print soup.select(‘p #link1‘)
#直接子标签查找 print soup.select("head > title")
(5)属性查找
#class=“sister”的a标签 print soup.select(‘a[class="sister"]‘)
print soup.select(‘p a[href="http://example.com/elsie"]‘)
爬虫5:Beautiful Soup的css选择器
声明:以上内容来自用户投稿及互联网公开渠道收集整理发布,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任,若内容有误或涉及侵权可进行投诉: 投诉/举报 工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。