首页 > 代码库 > python下载在线阅读盗墓笔记小说的脚本

python下载在线阅读盗墓笔记小说的脚本

最近闲着没事想看小说,找到一个全是南派三叔的小说的网站,决定都下载下来看看,于是动手,在很多QQ群里高手的帮助下(本人正则表达式很烂,程序复杂的正则都是一些高手指导的),花了三四天写了一个脚本

需要 BeautifulSoup 和 requests 两个库

(我已经把注释写得尽量详细)

这个程序的执行速度很慢,求高手告诉我优化的方法!!

#-*-coding:utf8-*-

from bs4 import BeautifulSoup
import requests
import re
import os


#打开网页将所需的URL读取出来放进一个列表中
r = requests.get('http://www.nanpaisanshu.org/').content  #打开要读取的网页
content=BeautifulSoup(r).findAll('a',href=http://www.mamicode.com/re.compile(r'/Ahttp://www.nanpaisanshu.org/[a-z]+/Z')) #在网页中找到需要的信息>

有时候会显示连接失败,然后程序报错,应该判断一下  requests.get(url).status_code != 200  不过我加了以后发现运行更慢,每个页面都判断,汗,可能是因为我这里网速几K的原因才会异常




python下载在线阅读盗墓笔记小说的脚本