首页 > 代码库 > Python爬虫爬取深大信息工程学院老师个人介绍网址小实例
Python爬虫爬取深大信息工程学院老师个人介绍网址小实例
1 #-*-coding:utf-8-*- 2 3 import requests 4 5 from bs4 import BeautifulSoup 6 7 r = requests.get (‘http://cie.szu.edu.cn/szucie/index.php/category/jsfc/‘) 8 9 #返回的‘r‘是一个包含了整个HTTP协议需要的各种各样东西的对象10 11 html = r.content12 13 #获取网页源代码14 15 soup = BeautifulSoup (html , ‘html.parser‘) #html.parser是解析器16 17 #下面根据我们看到的网页提取。首先提取这部分代码的第一行,先定位到这部分代码:18 19 div_people_list = soup.find (‘div‘ , attrs = {‘class‘ : ‘col-mb-12 col-8 detail‘})20 21 #这里使用了BeautifulSoup对象的find方法,这个方法的意思是找到带有‘div‘这个标签并且参数包含"class = ‘people_list‘"的代码。如果有多个的话,find方法就取第一个22 23 a_s = div_people_list.find_all (‘a‘)24 25 #这里使用find_all方法取出所有标签为"a"的代码,返回一个列表(list)。"a"标签里的"href"参数是我们需要的老师的个人主页的信息,而标签里面的文字是老师的名字26 27 for a in a_s :28 url = a[‘href‘]29 name = a.get_text()30 print name , url
运行结果如下:
Python爬虫爬取深大信息工程学院老师个人介绍网址小实例
声明:以上内容来自用户投稿及互联网公开渠道收集整理发布,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任,若内容有误或涉及侵权可进行投诉: 投诉/举报 工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。