首页 > 代码库 > BeautifulSoup, 的使用

BeautifulSoup, 的使用

import bs4.BeautifulSoup
soup = BeautifulSoup(response,lxml)
print soup.prettify()#格式化输出

四大对象种类

Beautiful Soup将复杂HTML文档转换成一个复杂的树形结构,每个节点都是Python对象,所有对象可以归纳为4种:

  1.     Tag
  2.     NavigableString
  3.     BeautifulSoup
  4.     Comment
print soup.title

#获取标签的内容

 

BeautifulSoup, 的使用