首页 > 代码库 > 分布式技术追踪 2017年第二十三期

分布式技术追踪 2017年第二十三期

分布式系统实践

1. 比较Apache Hadoop 生态系统中不同的文件格式和存储引擎的性能

http://dwz.cn/63s0D7

摘要: 这篇文章提出了在Apache Hadoop 生态系统中对比一些当前流行的数据格式和可用的存储引擎的性能:Apache Avro, Apache Parquet, Apache HBase 和 Apache Kudu 空间效率, 提取性能, 分析扫描以及随机数据查找等领域。这有助于理解它们中的每一个如何(何时)改善你的大数据工作负载的处理能力。

2. 谈谈分布式Aggregation

http://dwz.cn/64bZ6I

摘要: 在大数据SQL引擎中(大体上都是OLAP引擎),Aggregation和Join的计算性能直接影响着查询速度,本文主要介绍了笔者在使用MapReduce和Impala系统中对实现Aggregation操作的理解,最后详细介绍了Impala能够实现高速的单个DISTINCT COUNT查询的原理,希望能够能够对于读者有点帮助和启发.

微服务技术

1. 探索Kubernetes的网络原理及方案

http://dwz.cn/64wpT5

摘要: 虚拟化网络是k8s中最不容易理解的部分, 这篇文章对k8s的网络原理以及常见的解决方案进行了分析和对比, 帮助大家理解网络虚拟化技术.

2. Netflix如何在上万台机器中管理微服务?

http://dwz.cn/65aTVV

摘要: 本文主要介绍了 Netflix OSS 贡献的 Eureka,Hystrix 和 Ribbon,由于篇幅限制,其他的组件将在后续的文章中介绍, 这些开源组件和 Spring Boot/Spring Cloud 都有良好的集成,通过注解的方式配合 Properties 文件,能够解决管理大规模服务时遇到的通用问题。

高可用技术

1. 三篇文章了解 TiDB 技术内幕 —— 谈调度

http://dwz.cn/65aNfa

摘要: 分布式存储系统必须具备高可用, 这篇文章介绍了TiDB实现高可用的技术, 非常值得学习.

2. 阿里高可用的两大法宝

http://dwz.cn/65bmCH

摘要: 这篇文章介绍了阿里实施全链路压测的技术, 供大家参考.

丰富多彩的计算机世界

1. 不要再重复造轮子了,造牢固的地基吧

http://dwz.cn/63BKud

摘要: C++生态发展太缓慢了, 有几个C++程序员没有写过基础库? 这篇文章介绍了整理C++基础库的心得.

2. 代码审查关注什么:SOLID 原则

http://dwz.cn/64wEcm

摘要: SOLID是软件开发中非常重要的五个原则, 这篇文章介绍了代码审查时如何发现并解决违背这五大原则的问题.

技术分享

分布式技术追踪 2017年第二十三期