因为项目需要使用到python udf 工hql调用
python 脚本中用到了第三方库解决方案:
1.将需要的环境进行打包 tar virtualenv
2.hive->add archive
python脚本中调用了本地的资源文件解决方案:
1.首先外部资源要在运行之前添加,使用命令add jar [jar file]或者add file [file]在hive中进行临时注册。
2.UDF中内部调用的文件地址直接用本地文件地址表示。例如: String filepath = "/home/dev/test/test.txt";上传至hive之后,外部文件地址只需改成String filepath = "./test.txt";即可