Flume特点-白红宇

Flume 特点

　　1、可靠性

当节点出现故障时，日志能够被传送到其他节点上而不会丢失。

Flume提供了三种级别的可靠性保障，从强到弱依次分别为：

　　　　(1) end-to-end（收到数据agent首先将event写到磁盘上，当数据传送成功后，再删除；如果数据发送失败，可以重新发送。），

(2) Store on failure（这也是scribe采用的策略，当数据接收方crash时，将数据写到本地，待恢复后，继续发送），

(3) Best effort（数据发送到接收方后，不会进行确认）。

2、可扩展性

Flume采用了三层架构，分别为agent，collector和storage，每一层均可以水平扩展。

其中，所有agent和collector由master统一管理，这使得系统容易监控和维护，且master允许有多个（使用ZooKeeper进行管理和负载均衡），这就避免了单点故障问题。

3、可管理性

（1）所有agent和colletor由master统一管理，这使得系统便于维护。

（2）多master情况，Flume利用ZooKeeper和gossip，保证动态配置数据的一致性。

（3）用户可以在master上查看各个数据源或者数据流执行情况，且可以对各个数据源配置和动态加载。

（4）Flume提供了web 和shell script command两种形式对数据流进行管理。

　　4、功能可扩展性

（1）用户可以根据需要添加自己的agent，collector或者storage。

（2）此外，Flume自带了很多组件，包括各种agent（file， syslog等），collector和storage（file，HDFS等）。

　　5、文档丰富，社区活跃

Flume 已经成为 Hadoop 生态系统的标配，它的文档比较丰富，社区比较活跃，方便我们学习。

本文转自大数据躺过的坑博客园博客，原文链接：http://www.cnblogs.com/zlslch/p/6116509.html，如需转载请自行联系原作者