spark VS mapreduce

首页 > 代码库 > spark VS mapreduce

2024-08-17 23:52:35 218人阅读

Apache Spark，一个内存数据处理的框架，现在是一个顶级Apache项目。这是Spark迈向稳定的重要一步，因为它越来越多地在下一代大数据应用中取代MapReduce。

MapReduce是有趣并且非常有用的，但现在看来Spark开始从它手中接过缰绳，成为新的Hadoop工作负载的主要处理框架。该技术在上周四迈出了十分具有意义的一步：Apache软件基金会宣布Spark现在是一个顶级项目。

因为它比MapReduce的速度更快、更容易编程，Spark已经囊括大量的用户和代码贡献者。这意味着它非常适合用于下一代大数据的应用程序，它们可能需要更低的延迟查询，实时处理或在相同的数据上的迭代计算（即，机器学习）。 Spark的创立者来自加州大学伯克利分校，并且已经创建了一家名为Databricks的公司进行商业化运作。

Spark 从技术上讲是一个独立的项目，但它总是设计用来与Hadoop分布式文件系统一起工作。它可以直接在HDFS上运行，以及通过YARN，它可以和同一群集上的MapReduce作业一起运行。事实上，Hadoop的先驱Cloudera公司现在为Spark客户提供企业级支持。

spark VS mapreduce

声明：以上内容来自用户投稿及互联网公开渠道收集整理发布，本网站不拥有所有权，未作人工编辑处理，也不承担相关法律责任，若内容有误或涉及侵权可进行投诉：投诉/举报工作人员会在5个工作日内联系你，一经查实，本站将立刻删除涉嫌侵权内容。

联系
我们

首页 > 代码库 > spark VS mapreduce

spark VS mapreduce

看完仍有疑问？有类似问题直接问程序猿