首页 > 代码库 > python爬虫学习记录

python爬虫学习记录

正则表达式中(.*?)是常用的匹配模式,匹配出了换行符以外的字符,是非贪婪模式,读取最少的匹配信息

在编译模式中是用re.S可以让(.*?)匹配任意字符,包括换行符。

try:

except Exception, e:

  print e

捕获所有异常并打印异常信息

dir(),查看当前对象的所有可用方法,type()查看当前对象的类型

sys.exit(),os.exit()用来退出进程,第一个常用

 

python爬虫学习记录