Python爬虫爬取一篇韩寒新浪博客

首页 > 代码库 > Python爬虫爬取一篇韩寒新浪博客

Python爬虫爬取一篇韩寒新浪博客

2024-10-10 16:25:39 214人阅读

网上看到大神对Python爬虫爬到非常多实用的信息，认为非常厉害。突然对想学Python爬虫，尽管自己没学过Python。但在网上找了一些资料看了一下，看到爬取韩寒新浪博客的视频。共三集，第一节讲爬取一篇博客，第二节讲爬取一页博客。第三集讲爬取所有博客。

看了视频。也留下了代码。

爬虫第一步：查看网页源码：

技术分享

第一篇博客的代码为蓝底的部分<a title="" target="_blank" href=http://www.mamicode.com/"http://blog.sina.com.cn/s/blog_4701280b0102eo83.html">《论电影的七个元素》——关于我对电…

对照其它博客的代码，找出公共部分“< title=‘’ ‘href=http://www.mamicode.com/’,‘.html‘

代码为：

# -*- coding : -utf-8 -*-
import urllib
str0 ='<a title="" target="_blank" href=http://www.mamicode.com/"http://blog.sina.com.cn/s/blog_4701280b0102eo83.html">《论电影的七个元素》——关于我对电…'>
执行结果：



保存的文件：

Python爬虫爬取一篇韩寒新浪博客

声明：以上内容来自用户投稿及互联网公开渠道收集整理发布，本网站不拥有所有权，未作人工编辑处理，也不承担相关法律责任，若内容有误或涉及侵权可进行投诉：投诉/举报工作人员会在5个工作日内联系你，一经查实，本站将立刻删除涉嫌侵权内容。

联系
我们

首页 > 代码库 > Python爬虫爬取一篇韩寒新浪博客

Python爬虫爬取一篇韩寒新浪博客

看完仍有疑问？有类似问题直接问程序猿