首页 > 代码库 > 读<大数据日知录:架构与算法>有感

读<大数据日知录:架构与算法>有感

前一段时间, 一个老师建议我可以学学 ‘大数据‘ ‘机器学习‘, 他说这必然是今后的热点, 学会了, 你就是香饽饽。在此之前, 我对大数据, 机器学习并没有很深的认识, 总觉得它们是那么的缥缈, 高不可攀, 也没想着深入学习。之后, 一次偶然的机会, 在csdn官方博客上看到了这样的一个活动 

  

[置顶] 话题讨论&征文--谈论大数据时我们在谈什么

于是, 从下载试读样章, 到正式读书, 开始了学习大数据的过程...


到今天, 差不多两周过去了, 马马虎虎过了一遍, 感触颇多。 下面简单评价下我看完后对这本书的认识。(ps: 在此之前, 我对大数据等完全没有概念, 接下去的言论, 只是个人的观点, 不喜勿喷)

本书前言中提到:

"从传统IT 业到互联网、互联网到移动互联网,从以智能手机和Pad 为主要终端载体的移动互联网到可穿戴设备的移动互联网,然后再到万物互联的物联网,这一定是不可违抗的发展规律和前进方向。伴随着这个趋势必然有越来越多、形态越来越丰富的超量数据不断产生,而大数据明显是由此衍生出来的明确且必然的发展趋势。 "

   -----<大数据日知录:架构与算法>


看到这, 给我一种感觉, 大数据无处不在, 大数据高贵冷艳...直到现在, 我才能确定, 它确实是这样!

读完最大的感受是有助于建立大数据技术的整体大局观

这书从大数据基本理论、各种架构组件以及算法几个角度归纳了目前常见的大数据技术,理论部分讲的还挺透彻,也包括了方方面面的技术点,真挺全面,可以当个工具书。

这本书蕴涵的的内容比较多——从大数据的存储结构、内容管理,讲到集群任务调度、分布式数据通信、流行的各类新式数据库的介绍,还有基于机器学习技术的大数据实现以及大数据挖掘应用范例等内容,既包罗万象,又深入浅出。17个章节, 17个不同内容, 虽然有所区别, 但是密切相关, 它们分别从大数据基础理论、大数据系统体系结构、大数据存储,以及包含批处理、流式计算、交互式数据分析、图数据库、并行机器学习的架构与算法以及增量计算等技术, 从不同角度描述了同一个知识--"大数据",可见作者张俊林扎实的功底。虽然我不是专业从事大数据行业的, 但是仅凭我的一些计算机知识, 也能把这本书读下来, 可见作者写作水平之高。

17章中, 我看的最认真的应该是图数据库(毕竟是样章, 最早看), 等我看完之后, 个人认为这是书中的一个亮点, (不然也不会拿来当样章), 同样的, 数据结构、集群资源管理这两章也非常不错。 就说图数据库这一章吧, 有完整的理论归纳也有具体小例子,体系感强,也好理解。喜欢这本书的另外一个理由是图文并茂, 比如在介绍TAO的跨数据中心架构的时候, 给了一张很直观的图,如下。我想这比写再多的文字描述都管用。另外, 在介绍一些知识点的时候, 总会举出很贴切的例子, 便于读者理解。比如介绍图的时候, 引入Facebook关系图来描述, 十分贴切。"Facebook是目前世界上最著名的社交网站, 如果从数据抽象的角度来看, Facebook的社交图不仅包括好友之间的关系, 还包括人与实体以及实体与实体之间的关系, 每个用户, 每个页面, 每张图片, 每个应用,每个地点以及每个评论都可以作为独立的实体......"



另外, 看的比较蛋疼的一章应该是机器学习这一章了。内容虽然非常实用,覆盖了多数常用的互联网应用,也是实际使用中的常用算法,但缺点也很明显,感觉对于初学者(就像我这样从没学习过的...)有点深,要具备一些基本的机器学习知识恐怕才能理解。  所以我想等先看一些入门书籍过后, 再来重新读读这个章节。

另外, 每个章节前面都有一小段歌词, 虽然我没看出有什么名堂, 但是感觉挺好的, 重拾好心情, 开始一个新章节的学习。

最后呢, 借用之前学习大数据看到的一段话: "大数据就是互联网发展到现今阶段的一种表象或特征而已,没有必要神话它或对它保持敬畏之心,在以云计算为代表的技术创新大幕的衬托下,这些原本很难收集和使用的数据开始容易被利用起来了,通过各行各业的不断创新,大数据会逐步为人类创造更多的价值。" 

如果, 你想从理论方面学习大数据

(理论是认知的必经途径,也是被广泛认同和传播的基线。在这里从大数据的特征定义理解行业对大数据的整体描绘和定性;从对大数据价值的探讨来深入解析大数据的珍贵所在;洞悉大数据的发展趋势;从大数据隐私这个特别而重要的视角审视人和数据之间的长久博弈)

或者, 你想从技术方面学习大数据

(技术是大数据价值体现的手段和前进的基石。在这里分别从云计算、分布式处理技术、存储技术和感知技术的发展来说明大数据从采集、处理、存储到形成结果的整个过程。)

再不然, 你想从实践方面学习大数据

(实践是大数据的最终价值体现。在这里分别从互联网的大数据,政府的大数据,企业的大数据和个人的大数据四个方面来描绘大数据已经展现的美好景象及即将实现的蓝图)。

 我都认为, <大数据日知录:架构与算法>是一本你值得一读的书,。


很庆幸,我能静下书看了这本书。

读<大数据日知录:架构与算法>有感