Flume安装和简单使用

Miki ·

更新时间:2024-11-11

· 513 次阅读

Flume安装和简单使用Flume简介Flume安装Flume框架示例 Flume简介

来自官网
Flume is a distributed, reliable, and available service for efficiently collecting, aggregating, and moving large amounts of log data. It has a simple and flexible architecture based on streaming data flows. It is robust and fault tolerant with tunable reliability mechanisms and many failover and recovery mechanisms. It uses a simple extensible data model that allows for online analytic application.

简单来说就是一个把日志进行采集汇总传输的框架

Flume安装

安装路径：https://archive.cloudera.com/cdh5/cdh/5/flume-ng-1.6.0-cdh5.12.0.tar.gz

解压配置java环境配置Flume环境变量 Flume框架

A Flume agent is a (JVM) process
在这里插入图片描述
Flume agent 包括：Source Channel Sink

Source常用类型
avro 序列化
exec 命令行
spooling 目录
taildir
kafka Channel常用类型
memory
kafka
file Sink常用类型
hdfs
logger 控制台
avro
kafka 示例

选型1：Source:NetCat Source | Sink:Logger Sink | Channel:memory
将44444端口的数据输出到控制台

创建netcatsource.conf文件：

a1.sources = r1
a1.sinks = k1
a1.channels = c1
a1.sources.r1.type = netcat
a1.sources.r1.bind = 0.0.0.0
a1.sources.r1.port = 44444
a1.sinks.k1.type = logger
a1.channels.c1.type = memory
a1.sources.r1.channels = c1
a1.sinks.k1.channel = c1

启动flume

flume-ng agent \
--name a1 \
--conf $FLUME_HOME/conf \
--conf-file $FLUME_HOME/script/netcatsource.conf \
-Dflume.root.logger=INFO,console

启动44444
telnet localhost 44444

注意先后顺序，先启端口会报错

在这里插入图片描述

选型2：Source:exec Source | Sink:HDFS Sink | Channel:memory
监控某个文件，将数据传入HDFS

创建flume-exec-hdfs.conf文件

a1.sources = r1
a1.sinks = k1
a1.channels = c1
a1.sources.r1.type = exec
a1.sources.r1.command = tail -F /home/wzj/data/flume/data.log
a1.sources.r1.shell = /bin/sh -c
a1.sinks.k1.type = hdfs
a1.sinks.k1.hdfs.path = hdfs://hadoop001:9000/flume/tail
a1.sinks.k1.hdfs.batchSize = 10
a1.sinks.k1.hdfs.fileType = DataStream
a1.sinks.k1.hdfs.writeFormat = Text
a1.channels.c1.type = memory
a1.sources.r1.channels = c1
a1.sinks.k1.channel = c1

启动flume

flume-ng agent \
--name a1 \
--conf $FLUME_HOME/conf \
--conf-file $FLUME_HOME/script/flume-exec-hdfs.conf \
-Dflume.root.logger=INFO,console

往/home/wzj/data/flume/data.log文件中追加数据观察控制台信息和hdfs文件中的变化：
在这里插入图片描述

选型3：Source:spooldir Source | Sink:HDFS Sink | Channel:memory
监控某个文件夹，将数据传入HDFS

创建flume-spool-hdfs.conf文件

a1.sources = r1
a1.sinks = k1
a1.channels = c1
a1.sources.r1.type = spooldir
a1.sources.r1.spoolDir = /home/wzj/data/flume/spool
a1.sinks.k1.type = hdfs
a1.sinks.k1.hdfs.path = hdfs://hadoop001:9000/flume/spool/%Y%m%d%H%M
a1.sinks.k1.hdfs.batchSize = 10
a1.sinks.k1.hdfs.fileType = DataStream
a1.sinks.k1.hdfs.writeFormat = Text
a1.sinks.k1.hdfs.filePrefix = wzj-
a1.sinks.k1.hdfs.useLocalTimeStamp = true
a1.channels.c1.type = memory
a1.sources.r1.channels = c1
a1.sinks.k1.channel = c1

启动flume

flume-ng agent \
--name a1 \
--conf $FLUME_HOME/conf \
--conf-file $FLUME_HOME/script/flume-spool-hdfs.conf \
-Dflume.root.logger=INFO,console

作者：jerrfy_w

flume

1024 个赞

需要登录后方可回复, 如果你还没有账号请注册新账号

详解CSS中的flex容器与flex属性

Claire 2021-03-29

991

flume入门级

Jenny 2020-12-28

880

关于Flume的优化和高可用

Hester 2020-02-17

850

Flume部署和使用

Tabitha 2021-03-06

509

flume batchsize transactionCapacity capacity的简单理解

Dianthe 2020-06-29

848

Flume安装部署

Bonnie 2020-09-25

635

日志收集 Flume

Madge 2020-12-18

795

Flume传输Nginx日志到HDFS

Posy 2021-01-03

898

Flume简单案例

Madge 2020-12-31

749

【Kafka】（九）项目中使用 Kafka 整合 Flume

Ethel 2021-04-11

953

Flume安装和简单使用

Miki 2020-12-28

513

Flume用法

Elita 2020-01-25

700

大数据技术之Flume

Summer 2021-01-14

607

Flume使用详解（一）

Isleta 2020-03-05

809

Flume监控之Ganglia

Tamara 2021-03-04

729

Flume使用详解（二）

Welcome 2020-11-16

898

flume与hdfs集成排雷指南

Adeline 2020-07-14

611

Flume使用详解（四）

Bliss 2021-05-17

518

Flume使用详解（三）

Zarah 2020-11-21

616

Flume详解与安装部署教程

Dianne 2020-09-02

990

我要提问

致谢

帮助他人，成就自己。

人生最大成功就是伸出热情而温暖的双手，尽自己所能去帮助身边的每一个人，只要无私的奉献，就会收获到美好的生活。

1024问感谢每一位朋友的帮助和支持。

软件开发网提供编程的基础软件技术培训教程,软件开发编程实例讲解Go,Node,HTML,CSS,Javascript,Python,Java,Ruby,C,PHP,MySQL等软件开发编程语言以及数据开发的基础知识，也提供大量的软件开发在线实例、从入门到精通就在1024问。

育儿网微养生全球行美食街育儿菜谱大全海南旅游女性养狗百科星座