urllib 模块使用简例

首页 > 代码库 > urllib 模块使用简例

2024-09-03 06:27:33 219人阅读

一、最简单的使用

import urllib,urllib2

response = urllib2.urlopen("https://www.baidu.com")
print response.read()

View Code

二、构造Request对象

request = urllib2.Request("https://www.baidu.com")
response = urllib2.urlopen(request)
print response.read()

View Code

三、通过POST 、GET 方式请求

　　POST

values = {‘username‘:‘test‘,‘passwrod‘:‘123‘}
data = urllib.urlencode(values)
print data    # username=test&passwrod=123
request = urllib2.Request("https://www.baidu.com",data=http://www.mamicode.com/data)
response = urllib2.urlopen(request)
print response.read()

View Code

　　GET

value =http://www.mamicode.com/ {}
value[‘username‘]=‘test‘
value[‘password‘]=‘123‘
data = urllib.urlencode(value)
url = "https://www.baidu.com"+"?"+data
print url    #   https://www.baidu.com?username=test&password=123
request = urllib2.Request(url=url)
response = urllib2.urlopen(request)
print response.read()

View Code

四、quote，进行编码

a = ‘哈哈‘
A = urllib.quote(a)
print A
B = urllib.unquote(A)
print B

View Code

　　urlencode在三中的 GET 部分已有样例

五、设置请求头 header

url = "https://www.baidu.com"
value = {"username":"test","password":"123"}
data = urllib.urlencode(value)
header = {
        "User-Agent":"Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:50.0) Gecko/20100101 Firefox/50.0",
        "Referer":"http://tieba.baidu.com/f?kw=%E4%BF%9D%E5%AE%9A&ie=utf-8&pn=50"
    }
request = urllib2.Request(url=url,data=http://www.mamicode.com/data,headers=header)
response = urllib2.urlopen(request)
print response.read()

View Code

urlopen是urllib2.OpenerDirector的一个实例，一个opener ,一个特殊的默认的opener.因此，这个opener并不能总是满足我们的需求，
这个时候，就需要我们自己构造自己的opener了。

源码摘录

_opener = None
def install_opener(opener):
    global _opener
    _opener = opener
# ————————————————————————————————————————————————
def urllopen():
    """..."""
    return opener.open(url, data, timeout)

View Code

六、设置代理

enable_proxy = True
proxy_handler = urllib2.ProxyHandler({"http" : ‘http://some-proxy.com:8080‘})
null_proxy = urllib2.ProxyHandler({})
if enable_proxy:
    opener = urllib2.build_opener(proxy_handler) #创建一个opener对象
else:
    opener = urllib2.build_opener(null_proxy)
#
urllib2.install_opener(opener)  #全局应用该opener

request = urllib2.Request("https://www.baidu.com")
response = opener.open(request)
response = urllib2.urlopen(request)
# 
print response.read()

View Code

七、操作cookie

import cookielib

#创建一个CookieJar实例来保存cookie
cookie = cookielib.CookieJar()

# 创建 Cookie 处理器
handler = urllib2.HTTPCookieProcessor(cookie)

#创建一个 opener
opener = urllib2.build_opener(handler)

# 用带有cookie 处理器的opener 来请求url
response = opener.open("https://www.baidu.com")
# 
for item in cookie:
    print item     #<Cookie BIDUPSID=25441729620BF793C1BE08CA0B43C8D4 for .baidu.com/>
    print ‘Name = ‘+item.name    #Name = BIDUPSID
    print ‘Value = http://www.mamicode.com/‘+item.value    #Value = http://www.mamicode.com/25441729620BF793C1BE08CA0B43C8D4

View Code

八、保存cookie到文件

import cookielib

filename = "/home/an/savecookie.test"
#创建一个 MozillaCookieJar 对象来保存cookie ，稍后写入对象
cookie = cookielib.MozillaCookieJar(filename)
# 创建 cookie 处理器
handle = urllib2.HTTPCookieProcessor(cookie)
#构建 handler
opener = urllib2.build_opener(handle)

response  = opener.open("http://www.baidu.com")
#保存cookie到文件
cookie.save(ignore_discard=True,ignore_expires=True)
# ignore_discard 即使cookie被丢弃也保存下来。
# ignore_expires 如果该文件中的cookie已存在，那么就覆盖

View Code

九、从文件中取出cookie并使用

import cookielib

cookie = cookielib.MozillaCookieJar()
cookie.load("/home/an/savecookie.test",ignore_expires=True,ignore_discard=True)

handler = urllib2.HTTPCookieProcessor(cookie)
opener = urllib2.build_opener(handler)

request = urllib2.Request("http://www.baidu.com")
response = opener.open(request)
print response.read()

View Code

urllib 模块使用简例

声明：以上内容来自用户投稿及互联网公开渠道收集整理发布，本网站不拥有所有权，未作人工编辑处理，也不承担相关法律责任，若内容有误或涉及侵权可进行投诉：投诉/举报工作人员会在5个工作日内联系你，一经查实，本站将立刻删除涉嫌侵权内容。

联系
我们

首页 > 代码库 > urllib 模块使用简例

urllib 模块使用简例

看完仍有疑问？有类似问题直接问程序猿