在一个完整的离线大数据处理系统中,除了hdfs+mapreduce+hive组成分析系统的核心之外,还需要数据采集、结果数据导出、任务调度等不可或缺的辅助系统,而这些辅助工具在hadoop生态体系中都有便捷的开源框架。
Flume安装很简单,解压好基本上就可以使用
1、下载安装包
http://archive.apache.org/dist/flume/1.8.0/2、规划安装目录
/opt/bigdata2.73、上传安装包到服务器
4、解压安装包到指定的规划目录
tar -zxvf flume-1.8.0-bin.tar.gz -C /opt/bigdata2.75、重命名解压目录
mv flume-1.8.0-bin flume-1.8.06、修改配置
进入到flume安装目录下的conf文件夹中
先重命名文件
mv flume-env.sh.template flume-env.sh修改文件,添加java环境变量
vim flume-env.shexport JAVA_HOME=/user/java/jdk1.8.0_141
vim flume-env.sh
export JAVA_HOME=/user/java/jdk1.8.0_141