第一只python爬虫

2024-08-12 17:30:51 217人阅读

import urllib.requestresponse = urllib.request.urlopen("http://www.baidu.com")html = response.read()html = html.decode(‘UTF-8‘)print(html)

其中用用urllib.request 中的urlopen打开百度（一定要加http，用read方法读取html代码，用 utf—8 解码。

技术分享

其中，response对象有一个getcode()方法，可以得到HTTP状态码（200为成功

技术分享

其中baidu能够正常访问，google访问超时，其中传入的三个参数:URL，向服务器发送的数据（没有为None，也可缺省），超时时间

返回的异常最后一句，timed out

第一只python爬虫

声明：以上内容来自用户投稿及互联网公开渠道收集整理发布，本网站不拥有所有权，未作人工编辑处理，也不承担相关法律责任，若内容有误或涉及侵权可进行投诉：投诉/举报工作人员会在5个工作日内联系你，一经查实，本站将立刻删除涉嫌侵权内容。

联系
我们