首页 > 代码库 > 分布式特性(distributed nature)

分布式特性(distributed nature)

在这章节的开始,我们曾经提到过ES能扩展到成百上千的服务器,并且能处理PT级别的数据。然而在这个教程中介绍如何使用ES的时候并没有提及到服务器。ES天生为分布式设计,他隐藏了随分布式而来的很多复杂细节。

ES的分布式在很大程度上是透明的。教程中不需要你知道有关分布式系统,sharding,cluster等或其他的分布式概念。他就是作为一个独立的节点运行在你的电脑中,假如你把教程中的例子运行在包含了100个节点的集群中,一切都和运行在你自己的电脑上是一样的。

ES努力的隐藏分布式系统的复杂细节,一些操作自动运行在引擎下,如:

1:拆分你的document到不同的,存储在独立或多个node的容器或shards里。

2:通过在你的集群中的node平衡shard,以分散index和search负荷。

3:复制每一个shard作为数据的冗余备份,避免因为硬件问题导致的数据丢失。

4:在集群中,从任意的一个node路由到包含你感兴趣的数据的其他node中去。

5:当你的cluster增长或者从新分布shard以避免node丢失时候可以无缝进行集成。

当你通过这本书,你会看到到关于ES的分布式特性补充章节。这些章节将会说明有关cluster扩展和处理故障(Life inside a Cluster),处理文档存储(Distributed document store和执行分布式搜索(Distributed search execution)的细节。

这个章节是不强制你阅读的,你即使不理解本章节中的含义也可以使用ES,但是对于全面了解ES的知识还是很有帮助的。可以很轻松的跳过本章节,在以后使用ES的时候,如果有需要可以回过头来重新看下。

 

原文:http://www.elasticsearch.org/guide/en/elasticsearch/guide/current/_distributed_nature.html