首页 > 代码库 > 抓取网页链接,并保存到本地

抓取网页链接,并保存到本地

import urllib2import urllibcontent=urllib2.urlopen("http://www.cnblogs.com/sayary/archive/2013/03/11/2952638.html").read()##print content##<a title="发布于2013-03-10 13:53"##href="http://www.cnblogs.com/sayary/archive/2013/03/10/2952640.html">href=content.find(rhref="http://www.cnblogs.com/sayary/archive)end=content.find(r.html)print hrefprint endurl=content[href+6:end+5]print urlstr2=content.find(rhref="http://www.cnblogs.com/sayary/archive,end)end2=content.find(r.html,str2)print str2print end2url2=content[str2+6:end2+5]print url2urllib.urlretrieve(url, 1.html)urllib.urlretrieve(url2, 2.html) 

 

抓取网页链接,并保存到本地