首页 > 代码库 > 《大数据时代》简要笔记
《大数据时代》简要笔记
一、大数据时代处理数据理念上的三大转变
1、要全体不要抽样(不用随机的方法,而是采用所有的数据)
2、要效率不要精确(接受数据的不精准和不完美,反而可以更好的进行预测,适用于精确度不要求那么极端的任务)
3、要相关不要因果(不一定非要知道原因,只要知道结果)
二、面对新领域和新概念应有的态度
1、努力在可以应用,可以扩展的地方应用它扩展它
2、在不能应用的地方,就停下来
三、处理技术
1、谷歌的MapReduce和开源的Hadoop平台
2、数据不需要用传统的数据库表格来整齐的排列,如NoSQL
四、炒作周期 (技术成熟度曲线)(技术循环曲线)
即经过媒体和学术会议大肆宣扬以后,新技术趋势一下跌至谷底,许多数据创业公司变得岌岌可危
五、字节
太字节TB=240 拍字节PB=250 艾字节EB=260 泽字节ZB=270
六、大数据时代最重要的技术,即个性化技术
亚马逊为我们推荐想要的书,谷歌为互联网网站排序,LinkedIn猜出我们认识谁
《大数据时代》简要笔记
声明:以上内容来自用户投稿及互联网公开渠道收集整理发布,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任,若内容有误或涉及侵权可进行投诉: 投诉/举报 工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。