python3爬取网页 - 程序员工具箱

2000万优秀解决方案库，覆盖所有编程及软件开发类，极速查询

今日已更新 2480 篇代码解决方案

热搜：

首页 > 代码库 > python3爬取网页

python3爬取网页

2024-08-16 12:35:57 219人阅读

爬虫

python3爬取网页资源方式(1.最简单：

import‘http://www.baidu.com/‘print2.通过request
1. import‘http://www.baidu.com‘print1.import urllib.request
  ‘wd‘‘python‘‘opt-webpage‘‘on‘‘ie‘‘gbk‘GET和POST请求的不同之处是POST请求通常有"副作用"
  
  ‘Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)‘‘User-Agent‘
  import urllib.request
  from urllib.error import URLError ,HTTPError
  req=urllib.request.Request(‘http://www.baidu.com‘)
  try:urllib.request.urlopen(req)
  except URLError as e:
  print(e.reason)
  HTTPError
  
  1.Openers：
  2.Handles：
  
  import urllib.request
  password_mgr=urllib.request.HTTPPasswordMgrWithDefaultRealm()
  top_level_url="http://example.com/foo/"
  password_mgr.add_password(None,top_level_url,‘why‘,‘1223‘)
  handler=urllib.request.HTTPBasicAuthHandler(password_mgr)
  opener=urllib.request.build_opener(handler)
  a_url=‘http://www.baidu.com/‘
  opener.open(a_url)
  urllib.request.install_opener(opener)
  后者包含了端口号。

python3爬取网页

声明：以上内容来自用户投稿及互联网公开渠道收集整理发布，本网站不拥有所有权，未作人工编辑处理，也不承担相关法律责任，若内容有误或涉及侵权可进行投诉：投诉/举报工作人员会在5个工作日内联系你，一经查实，本站将立刻删除涉嫌侵权内容。

联系
我们