首页 > 代码库 > IT人的前沿技术书单:学不到老,就活不到老

IT人的前沿技术书单:学不到老,就活不到老

IT人作为这个互联网时代的弄潮儿,我们天生就处于技术浪潮的中心地带,技术的变革让我们不得不掌握终生学习的能力和多元化的知识领域,技术的浪潮时而冲天而起,时而又归于平静,但是始终在推动着人类社会向前发展。你我,在这场技术引发的世界改革浪潮中,都置身其中,我们必须时刻准备好站在浪潮之巅的准备,准备迎接技术新世界。本文为大家选取了一些有关云计算、大数据以及人工智能的书籍,我相信,你我都能够成为这个世界的改变者。


《云计算:概念、技术与架构》 —— Thomas ERL,Zaigham Mahmood,Ricardo Puttini 

技术分享《计算机科学丛书·云计算:概念、技术与架构》共包含五个部分,第一部分到第四部分主要涵盖了云计算基础、云计算机制、云计算架构以及云计算使用等内容,以云计算起源为出发点,介绍了云计算领域的基本概念。第五部分给出了案例研究结论,介绍了工业标准组织、云计算机制与特性之间的对应关系、数据中心设施、云计算新兴技术,并给出了云提供合同和云商业案例模板。云计算是利用复杂技术创新的分布式技术平台,提供了高可扩展和弹性的环境,软件企业可以以各种强大的方式远程使用该平台。软件开发人员想要成功地在云环境上构建系统、与云环境集成,甚至创建云环境,需要理解云内部的机制、架构和模型,同时还要理解由于使用基于云的服务所造成的商业和经济因素。这本书理论与实践并重,重点放在主流云计算平台和解决方案的结构和基础上。除了以技术为中心的内容以外,还包括以商业为中心的模型和标准。此外,本书提供了一些用来计算与SLA相关的服务质量的模板和公式,还给出了大量的SaaS、PaaS和IaaS交付模型。


《性能之巅:洞悉系统、企业与云计算》 —— Brendan Gregg

技术分享《性能之巅:洞悉系统、企业与云计算》基于Linux 和Solaris 系统阐述了适用于所有系统的性能理论和方法,Brendan Gregg 将业界普遍承认的性能方法、工具和指标收集于本书之中。阅读这本书,你能洞悉系统运作的方式,学习到分析和提高系统与应用程序性能的方法,这些性能方法同样适用于大型企业与云计算这类较为复杂的环境的性能分析与调优。纵观全书,作者建立了系统性能优化的体系框架,并且骨肉丰满。很明显,他不仅擅长某方面的性能优化,更是全方位的专家,加之作为DTrace主要开发者,使得本书的说服力和含金量大增。本书让我们有机会系统学习和掌握性能优化的各方面,有机会建立一种高屋建瓴的全局观,在面对复杂系统问题时再不会手足无措,或只能盲人摸象。Linux系统演化至今,基础的体系架构和关键组件并未发生多大改变,这使得这本好书即使再历经多年,价值毫无衰减,反而历久弥新。


《大数据时代:生活工作与思维的大变革》 —— Viktor Mayer-Sch?nberger, Kenneth Cukier

技术分享《大数据时代》是国外大数据研究的先河之作,本书作者维克托·迈尔·舍恩伯格被誉为“大数据商业应用第一人”,拥有在哈佛大学、牛津大学、耶鲁大学和新加坡国立大学等多个互联网研究重镇任教的经历,早在2010年就在《经济学人》上发布了长达14页对大数据应用的前瞻性研究 。维克托最具洞见之处在于,他明确指出,大数据时代最大的转变就是,放弃对因果关系的渴求,而取而代之关注相关关系。也就是说只要知道“是什么”,而不需要知道“为什么”。这就颠覆了千百年来人类的思维惯例,对人类的认知和与世界交流的方式提出了全新的挑战。《大数据时代》认为大数据的核心就是预测。大数据将为人类的生活创造前所未有的可量化的维度。大数据已经成为了新发明和新服务的源泉,而更多的改变正蓄势待发。书中展示了谷歌、微软、亚马逊、IBM、苹果、facebook、twitter、VISA等大数据先锋们最具价值的应用案例。


《爆发:大数据时代预见未来的新思维》 —— AlbertLászlóBarabási

技术分享《爆发:大数据时代预见未来的新思维》是一本颠覆《黑天鹅》的惊世之作。如果说塔勒布认为人类行为是随机的,都是小概率事件,是不可以预测的;那么全球复杂网络权威巴拉巴西则认为,人类行为93%是可以预测的,在大数据时代我们可以预测未来。作者巴拉巴西的研究是在人类生活数字化的大数据时代基础上进行的,移动电话、网络以及电子邮件使人类行为变得更加容易量化,将我们的社会变成了一个巨大的数据库。在《爆发:大数据时代预见未来的新思维》中,巴拉巴西揭开人类行为背后隐藏的模式“爆发”,提出人类日常行为模式不是随机的,而是具有“爆发性”的。爆发揭开了人类行为中令人惊讶的深层次的秩序,使得人类变得比预期中更容易预测得多。爆发模式的揭示,其影响力将与20世纪初期的物理学或者基因革命的影响力不相上下。


《利用Python进行数据分析》 —— Wes McKinney

技术分享本书作者Wes McKinney,资深数据分析专家,对各种Python库(包括NumPy、pandas、matplotlib以及IPython等)等都有深入研究,并在大量的实践中积累了丰富的经验。撰写了大量与Python数据分析相关的经典文章,被各大技术社区争相转载。开发了用于数据分析的著名开源Python库——pandas,广获用户好评。《利用Python进行数据分析》适合刚刚接触Python的分析人员以及刚刚接触科学计算的Python程序员。将IPython这个交互式Shell作为你的首要开发环境。这本书讲的是利用Python进行数据控制、处理、整理、分析等方面的具体细节和基本要点。同时,它也是利用Python进行科学计算的实用指南(专门针对数据密集型应用)。《利用Python进行数据分析》重点介绍了用于高效解决各种数据分析问题的Python语言和库,但是没有阐述如何利用Python实现具体的分析方法。


《深入浅出数据分析》 —— Michael Milton 

技术分享《深入浅出数据分析》以类似“章回小说”的活泼形式,生动地向读者展现出色的数据分析人员应知应会的技术:数据分析基本步骤、实验方法、优化方法、假设检验方法、贝叶斯统计方法、主观概率法、启发法、直方图法、回归法、误差处理、相关数据库、数据整理技巧;正文之后还介绍数据分析十大要务、R工具及ToolPak工具,在充分展现目标知识以外,为读者搭建了走向深入研究的桥梁。《深入浅出数据分析》利用Excel或0penoffice应用程序组织数据,在R应用程序中进行进一步整理,通过散点图和直方图找出有意义的模式,借助启发式算法做出结论,通过实验和假定测试预见未来,再以清楚直观的图形展示分析结果。无论你是研究新产品可行性的开发人员,还是评估广告效果的市场营销经理;无论你是向客户呈报数据的营销员,还是管理所有这些数据密集型部门及种种其他事务的个人企业家,这本书都能为你带来全面的学习体验,让你将数据转变为事业中有用的工具。


《Hadoop权威指南》 —— Tom White

技术分享《Hadoop权威指南》作者Tom White,被称之为为:数学王子&Hadoop专家。身为Apache Hadoop提交者八年之久,Apache软件基金会成员之一。全球知名云计算公司Cloudera的软件工程师。Tom拥有英国剑桥大学数学学士学位和利兹大学科学哲学硕士学位。本书通过丰富的案例学习来解释Hadoop的幕后机理,阐述了Hadoop如何解决现实生活中的具体问题。第3版覆盖Hadoop的最新动态,包括新增的MapReduce API,以及MapReduce 2及其灵活性更强的执行模型(YARN)。准备好释放数据的强大潜能了吗?借助于这本《Hadoop权威指南》,你将学习如何使用Apache Hadoop构建和维护稳定性高、伸缩性强的分布式系统。本书是为程序员写的,可帮助他们分析任何大小的数据集。本书同时也是为管理员写的,帮助他们了解如何设置和运行Hadoop集群。


《Spark快速大数据分析》 —— Holden Karau,Andy Konwinski,Patrick Wendell,Matei Zaharia

技术分享《Spark快速大数据分析》由 Spark 开发者及核心成员共同打造,讲解了网络大数据时代应运而生的、能高效迅捷地分析处理数据的工具——Spark,它带领读者快速掌握用 Spark 收集、计算、简化和保存海量数据的方法,学会交互、迭代和增量式分析,解决分区、数据本地化和自定义序列化等问题。《Spark快速大数据分析》是一本为Spark初学者准备的书,它没有过多深入实现细节,而是更多关注上层用户的具体用法。不过,本书绝不仅仅限于Spark的用法,它对Spark的核心概念和基本原理也有较为全面的介绍,让读者能够知其然且知其所以然。这本书介绍了开源集群计算系统Apache Spark,它可以加速数据分析的实现和运行。利用Spark,你可以用Python、Java以及Scala的简易API来快速操控大规模数据集。《Spark快速大数据分析》由Spark开发者编写,可以让数据科学家和工程师即刻上手。你能学到如何使用简短的代码实现复杂的并行作业,还能了解从简单的批处理作业到流处理以及机器学习等应用。


《数据算法:Hadoop/Spark大数据处理技巧 》 —— Mahmoud Parsian

技术分享《数据算法:Hadoop/Spark大数据处理技巧》介绍了很多基本设计模式、优化技术和数据挖掘及机器学习解决方案,以解决生物信息学、基因组学、统计和社交网络分析等领域的很多问题。这本书还概要介绍了MapReduce、Hadoop和Spark。这本书面向了解Java基础知识并且想使用Hadoop和Spark 开发MapReduce 算法(数据挖掘、机器学习、生物信息技术、基因组和统计领域)和解决方案的软件工程师、软件架构师、数据科学家和应用开发人员。《数据算法:Hadoop/Spark大数据处理技巧》还被称为“市面上N0.1本关于Hadoop与Spark大数据处理技巧的教程”。

 


《机器学习》 —— 周志华

技术分享本书作者周志华,南京大学计算机系教授,ACM杰出科学家,IEEE Fellow, IAPR Fellow, IET/IEE Fellow, 中国计算机学会会士。国家杰出青年科学基金获得者、长江学者特聘教授。先后担任多种SCI(E)期刊执行主编、副主编、副编辑、编委等。中国计算机学会人工智能与模式识别专业委员会主任,中国人工智能学会机器学习专业委员会主任,IEEE计算智能学会数据挖掘技术委员会副主席。可以说是人工智能界的大牛,这是少有的华人大牛之一。

机器学习是计算机科学与人工智能的重要分支领域。本书作为该领域的入门教材,在内容上尽可能涵盖机器学习基础知识的各方面.。全书共16 章,大致分为3 个部分:第1 部分介绍机器学习的基础知识;第2 部分讨论一些经典而常用的机器学习方法;第3 部分为进阶知识,内容涉及特征选择与稀疏学习、计算学习理论、半监督学习、概率图模型、规则学习以及强化学习等。

IT人的前沿技术书单:学不到老,就活不到老