Hive拉拉扯扯的order by,sort by,distribute by, cluster by

Jamina ·

更新时间:2024-11-10

· 566 次阅读

Hive支持两个层面的排序：

全局排序部分排序

全局排序用

order by col [ASC | DESC]

实现，效果和传统的RDMS一样，保证最后的数据全局有序。

部分排序用

sort by col [ASC | DESC]

实现，保证同一个reducer处理的数据有序，对于结果数据则表现为局部有序。

Hive对用户提供的同样是SQL，但底层实现却和传统数据库有天壤区别，底层实现默默情况下是利用了Hadoop的计算框架MapReduce，当然也支持使用Spark, Tez。鉴于此，Hive有一些自己特定，比如order by的实现需要把所有数据汇集到一个reducer中处理，如果数据量巨大，这个一步将会成为整个任务的潜在问题点，所以Hive在严格模式下（hive.mapred.mode=strict）时，使用order by必须搭配使用limit。

同时是由于Hive底层的实现机制的原因，Hive有两个相关的字句distribute by和cluster by。

distribute by

确保具有相同分区键的数据全部被分配到同一个reducer处理。

cluster by

确保具有相同分区键的数据全部被分配到同一个reducer处理，同时确保同一个reducer中的数据顺序。相当于：

disribute by col sort by col

不过分开或组合使用disribute by显得更加灵活：

sort by只负责排序，数据的划分则是随机划分到reducer distribute by和sort by可以作用于不同的列上，一个常用的情景是

disribute by col_A sort by col_A，col_B

作者：穷目楼

order by cluster BY order hive sort

1024 个赞

需要登录后方可回复, 如果你还没有账号请注册新账号

Python MySQL - mysql-connector 驱动

Odele 2020-10-21

643

vue中上传视频或图片或图片和文字一起到后端的解决方法

Anne 2020-10-24

741

Asp.net MVC中获取控制器的名称的方法

Oceana 2020-07-06

629

浅谈laravel中的关联查询with的问题

Damara 2020-08-12

763

消耗CPU资源的shell脚本

Jcinta 2021-06-17

715

js正则表达式之replace函数用法

Eirene 2021-01-02

813

Arrays.sort如何实现降序排序

Elita 2022-11-27

896

MySQL中order by排序语句的原理解析

Tani 2022-12-11

详解Go语言如何使用标准库sort对切片进行排序

Ula 2022-12-21

1905

Mybatis动态传入order by问题

Kefira 2022-12-29

992

MySQL出现this is incompatible with sql_mode=only_full_group_by错误的解决办法

Cytheria 2023-02-18

710

Redis排序命令Sort深入解析

Ipo 2023-02-26

pandas.DataFrameSeries排序的使用(sort_values，sort_index)

Crystal 2023-02-26

order by + limit分页时数据重复问题及解决方法

Pandora 2023-03-19

690

数据库之Hive概论和架构和基本操作

Bunny 2023-04-08

707

Hive数据导出详解

Kitty 2023-04-16

416

驱动程序无法通过使用安全套接字层(SSL)加密与 SQL Server 建立安全连接,错误:“The server selected protocol version TLS10 is not accepted by client

Gitana 2023-05-12

381

千万别错过的JavaScript sort方法使用指南

Maha 2023-05-12

1919

js中.sort()函数的常见用法与高级操作

Rhea 2023-05-16

1343

JS中的常见数组遍历案例详解(forEach, map, filter, sort, reduce, every)

Serafina 2023-05-18

368

我要提问

致谢

帮助他人，成就自己。

人生最大成功就是伸出热情而温暖的双手，尽自己所能去帮助身边的每一个人，只要无私的奉献，就会收获到美好的生活。

1024问感谢每一位朋友的帮助和支持。

软件开发网提供编程的基础软件技术培训教程,软件开发编程实例讲解Go,Node,HTML,CSS,Javascript,Python,Java,Ruby,C,PHP,MySQL等软件开发编程语言以及数据开发的基础知识，也提供大量的软件开发在线实例、从入门到精通就在1024问。

育儿网微养生全球行美食街育儿菜谱大全海南旅游女性养狗百科星座