pyspark读取hive数据写入到redis

Galatea ·

更新时间:2024-11-13

· 642 次阅读

1、首先把redis包引入工程，这样就不需要在集群里每台机器上安装redis客户端。
$pip install redis
$cd /usr/local/lib/python3.6/dist-packages/ 找到自己环境的路径
$zip -r redis.zip redis/*
$hdfs dfs -put redis.zip /user/data/

2、在代码里使用 addPyFile加载redis.zip


    sc = SparkContext(conf=conf)
    sc.addPyFile("hdfs:///user/data/redis.zip")

#定义一个写入redis函数
def DataToRedis(data):
    r = redis.StrictRedis(host='IP', port=6379, password='passwd')
    for i in data:
        r.set(str(i[0]), str(i[1]))

    #读取Hive数据
    sqlContext = HiveContext(sc)
    read_hive_score = sqlContext.sql("Select id,item from recom.result limit 10")
    hiveRDD_score =read_hive_score.rdd
    result_dataSet = hiveRDD_score.map(lambda x: (x['id'], x['item'])).collect()
    #调用函数
    DataToRedis(result_dataSet)
参考：

Write data to Redis from PySpark

https://www.e-learn.cn/content/wangluowenzhang/1347480

https://stackoverflow.com/questions/32274540/write-data-to-redis-from-pyspark

spark-redis

https://spark-packages.org/package/RedisLabs/spark-redis?spm=a2c6h.12873639.0.0.4d1e16a3g7Ml18

Pyspark实例-Spark On YARN将HDFS的数据写入Redis

http://www.gdjzkj.com/?m=home&c=View&a=index&aid=117

Python redis.ConnectionError() 例子

https://www.programcreek.com/python/example/36966/redis.ConnectionError

redis操作 + StrictRedis使用

https://www.cnblogs.com/szhangli/p/9979600.html


作者：levy_cui
                    
 
                

                            pyspark
                            hive
                            Redis


           
    
    

            
                
                    
                
            
            
                
    
        
            需要 登录 后方可回复, 如果你还没有账号请 注册新账号
        
    
                
            
                
                    
                        相关文章

    
        
    
    
        
            CSS 轮廓（outline）
        
        
            Mercia
            2020-02-01
        
    
    
        816
    


    
        
            vue中上传视频或图片或图片和文字一起到后端的解决方法
        
        
            Anne
            2020-10-24
        
    
    
        741
    


    
        
            golang双链表的实现代码示例
        
        
            Aurora
            2020-09-15
        
    
    
        522
    


    
        
            Redis的持久化详解
        
        
            Kamiisa
            2023-07-20
        
    
    
        630
    


    
        
            Redis中哈希结构(Dict)的实现
        
        
            Jacuqeline
            2023-07-20
        
    
    
        372
    


    
        
            redis缓存与数据库一致性的问题及解决
        
        
            Xanthe
            2023-07-20
        
    
    
        466
    


    
        
            redis使用zset实现延时队列的示例代码
        
        
            Faith
            2023-07-20
        
    
    
        1143
    


    
        
            详解Redis中地理位置功能Geospatial的应用
        
        
            Laila
            2023-07-20
        
    
    
        759
    


    
        
            SpringBoot整合Mybatis-plus和Redis实现投票功能
        
        
            Hana
            2023-07-20
        
    
    
        374
    


    
        
            Redis分布式锁的10个坑总结
        
        
            Tia
            2023-07-20
        
    
    
        1046
    


    
        
            如何保证Redis与数据库的数据一致性
        
        
            Chipo
            2023-07-20
        
    
    
        1609
    


    
        
            redis Template.opsForValue()中方法实例详解
        
        
            Meta
            2023-07-20
        
    
    
        670
    


    
        
            一篇吃透Redis缓存穿透、雪崩、击穿问题
        
        
            Jacinthe
            2023-07-20
        
    
    
        499
    


    
        
            Redis分布式缓存的安装
        
        
            Winona
            2023-07-20
        
    
    
        1325
    


    
        
            Redis高可用梳理详解
        
        
            Lillian
            2023-07-20
        
    
    
        629
    


    
        
            关于Redis持久化的深入探究
        
        
            Rochelle
            2023-07-20
        
    
    
        1927
    


    
        
            关于Redis的内存淘汰策略详解
        
        
            Wanda
            2023-07-20
        
    
    
        58
    


    
        
            Redis Lua同步锁实现源码解析
        
        
            Ophelia
            2023-07-20
        
    
    
        1716
    


    
        
            Redis BigKey的问题解决
        
        
            Rayna
            2023-07-20
        
    
    
        1553
    


    
        
            redis-copy使用6379端口无法连接到Redis服务器的问题
        
        
            Agnes
            2023-07-20
        
    
    
        1444


        
    
        
            我要提问
        
    
    
        
        
    
        致谢
        
            帮助他人，成就自己。
            人生最大成功就是伸出热情而温暖的双手，尽自己所能去帮助身边的每一个人，只要无私的奉献，就会收获到美好的生活。
            1024问感谢每一位朋友的帮助和支持。
            软件开发网提供编程的基础软件技术培训教程,软件开发编程实例讲解Go,Node,HTML,CSS,Javascript,Python,Java,Ruby,C,PHP,MySQL等软件开发编程语言以及数据开发的基础知识，也提供大量的软件开发在线实例、从入门到精通就在1024问。
        
    
    
        
            
    育儿网
    微养生
    全球行
    美食街
    育儿
    菜谱大全
    海南旅游
    女性
    养狗百科
    星座