【爬虫】beautiful soup笔记（待填坑）

2024-09-26 13:22:39 216人阅读

Beautiful Soup是一个第三方的网页解析的模块。其遵循的接口为Document Tree，将网页解析成为一个树形结构。

其使用步骤如下：

1、创建对象：根据网页的文档字符串

2、搜索节点：名称、属性、文字。

3、处理节点：

BeautifulSoup(文档字符串， ‘html.parser‘ 解析器，from_encoding=‘utf8‘)

find_all(名称，属性，文字)：可以传入字符串也可以传入正则表达式。

node.name 名称

node[‘href‘] 属性

node.get_text 文字

【爬虫】beautiful soup笔记（待填坑）

声明：以上内容来自用户投稿及互联网公开渠道收集整理发布，本网站不拥有所有权，未作人工编辑处理，也不承担相关法律责任，若内容有误或涉及侵权可进行投诉：投诉/举报工作人员会在5个工作日内联系你，一经查实，本站将立刻删除涉嫌侵权内容。

联系
我们