欢迎来到尧图网

客户服务 关于我们

您的位置:首页 > 文旅 > 旅游 > 半小时速通flume-flume概述

半小时速通flume-flume概述

2025/11/10 3:35:09 来源:https://blog.csdn.net/m0_52474839/article/details/145352761  浏览:    关键词:半小时速通flume-flume概述

文章目录

  • 1.Flume概述
  • 2.Flume架构
    • 1.Agent
    • 2.Source
    • 3.Sink
    • 4.Channel
    • 5.Event

1.Flume概述

  • Flume是Cloudera提供的一个高可用,高可靠的,分布式海量数据日志采集,聚合,传输系统。基于流式架构,动态实现,上传一条采集一条。

在这里插入图片描述

  • 企业开发,flume–>kafka集群–>hdfs

  • flume动态采集—实时;若做离线业务,完全可以使用put命令

在这里插入图片描述

2.Flume架构

在这里插入图片描述

  • 三个关键组件:Source ,Channel,Sink

  • Channel做缓冲,原因是Source,Sink速度不一致。

1.Agent

  • agent是一个JVM进程,它以时间的形式将数据从源头送至目的。
  • 三个部分组成Source、Sink、Channel

2.Source

  • 内部有很多的类型,不同的类型就是对接不同的数据源的

3.Sink

  • Sink指的是传输落点;也就是将数据传输到哪

在这里插入图片描述

logger是打印到控制台,测试常用。

4.Channel

  • 做缓冲的地方;
  • Memory Channel、File Channel、Kafka Channel

在这里插入图片描述

存到内存和磁盘各有优略;安全性和速度角度考虑。

5.Event

  • Event表示将我们的数据做了一次序列化

在这里插入图片描述

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com

热搜词