关于【python】【UDF】【HIVE】读取外部资源文件和第三方库的问题解决方案

Fawziya ·
更新时间:2024-09-21
· 672 次阅读

因为项目需要使用到python udf 工hql调用

python 脚本中用到了第三方库

解决方案:

1.将需要的环境进行打包 tar virtualenv

2.hive->add archive

python脚本中调用了本地的资源文件

解决方案:

1.首先外部资源要在运行之前添加,使用命令add jar [jar file]或者add file [file]在hive中进行临时注册。

2.UDF中内部调用的文件地址直接用本地文件地址表示。例如: String filepath = "/home/dev/test/test.txt";上传至hive之后,外部文件地址只需改成String filepath = "./test.txt";即可


作者:junjie20082008



hive 解决方案 源文件 Python

需要 登录 后方可回复, 如果你还没有账号请 注册新账号