首页 > 代码库 > Hadoop 简介

Hadoop 简介

 一个开源的,高可靠,可扩展的分布式计算框架

技术分享

解决的问题

     1 海量数据的存储(HDFS)

     2海量数据的分析(Mapreduce)

     3 分布式资源调度 (Yarn)

应用场景

    日志分析,基于海量数据的在线应用,推荐系统,计算广告,复杂算法,网盘,搜素引擎,,,,

 

一 HDFS

       动态增加,自动备份

技术分享

二 mapreduce 

      分而治之,并行计算框架

技术分享

三 Yarn 

      CPU 内存的分配,资源调度和任务调度管理

 

技术分享

 

Hadoop 简介