首页 > 代码库 > 二 解析网页中元素

二 解析网页中元素

一 使用beautifulSoup 解析网页

 Soup = BeantifulSoup(html,‘lxml‘)

二 描述需要爬取的东西在哪?

  = Soup.select(‘???‘)

三 从标签中获得你要的信息

  <p>Something</p> 去掉标签,并放到数据容器中。

title.get_text() > Something

title.tripped_strings>获取title目录下,所有标签。

python 可以做列表》list(title.tripped_strings)

  {title = Something ; rate = 4.0}

 

二 解析网页中元素