1. 传统架构

1.1. Rsync方式

说明：

在生产环境上部署rsync传输脚本并设置定时，按天或按小时将日志传输到日志收集服务器

1）优点

2）缺点

说明：

Flume是一个分布式、可靠、和高可用的海量日志聚合的系统，支持在系统中定制各类数据发送方。

采用了分层架构：分别为agent，collector和storage。其中，agent和collector均由两部分组成：source和sink，source是数据来源，sink是数据去向。

Flume使用两个组件：Master和Node，Node根据在Master shell或web中动态配置，决定其是作为Agent还是Collector。

1）优点

2）缺点

说明：

实线表示日志数据，虚线表示心跳和告警数据。

在生产服务器上增加agent数据监控服务，在日志收集服务器上部署beanstalkd队列服务，agent负责把生产服务器产生的日志实时写入到队列中去。

在日志收集服务器上部署Collector数据代理服务，负责将队列中的数据取出进行处理汇总。

Master和Collector可以部署在同一台服务器。

1）优点

2）缺点

1）引入实时流计算框架storm，更好地对大数据进行实时分析处理；

2）直接传输至HDFS，进行离线大数据计算，主要对一些日期久远的日志及不需要实时计算的日志进行统计分析。

轻量级日志收集技术方案

声明：以上内容来自用户投稿及互联网公开渠道收集整理发布，本网站不拥有所有权，未作人工编辑处理，也不承担相关法律责任，若内容有误或涉及侵权可进行投诉：投诉/举报工作人员会在5个工作日内联系你，一经查实，本站将立刻删除涉嫌侵权内容。

联系
我们