首页 > 代码库 > 爬虫+python3(网页图片)

爬虫+python3(网页图片)

 

http://www.cnblogs.com/fnng/p/3576154.html

这个是虫师的博客网站

这个知识点就是在这上面学的

我来说几个点:

1.urllib.request

技术分享

查阅文档可知,python3里的方法和python2不太一样

2.编码格式问题

技术分享

这样改就可以了

3.爬虫 在我看来无非就是爬取自己想要的东西

如何去选择自己想要的呢?

这里我想说   其实在下面这段代码里面最主要的是那个正则表达式

之后的爬虫最主要的也是你自己所写的正则表达式

推荐一个学习正则表达式的网址:http://www.oschina.net/question/12_9507?fromerr=wosLB4sn

 

 完整代码 如下:

 

技术分享

 

爬虫+python3(网页图片)