Hive 排序

Felicite ·

更新时间:2024-09-21

· 640 次阅读

order by

Order By：对查询结果集执行一个全局排序，一个Reducer。ORDER BY 子句在SELECT语句的结尾。对于大数据集，order by过程会消耗很大的时间。

示例1：

在这里插入图片描述

在这里插入图片描述

示例2：

在这里插入图片描述

结果：

在这里插入图片描述

sort by

sort by：在每个reduce中对数据进行排序，也就是执行一个局部排序过程。这可以保证每个reduce输出的数据都是有序的(但并非全局有效)。这样就可以提高后面进行的全局排序的效率了。
Sort By：每个Reducer内部进行排序，对全局结果集来说不排序。

示例1：

在这里插入图片描述

在这里插入图片描述

示例2：设置mapreduce.job.reduces=1，结果和使用order by 一样
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

示例：设置mapreduce.job.reduces=2
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

distribute by

distribute by：控制 map的输出在reducer中是如何划分的。

mapreduce job 中传输的所有数据都是按照键-值对的方式进行组织的，因此hive在将用户的查询语句转换成mapreduce job时，其必须在内部使用这个功能。默认情况下，MapReduce计算框架会依据map输入的键计算相应的哈希值，然后按照得到的哈希值将键-值对均匀分发到多个reducer中去。不过不幸的是，这也是意味着当我们使用sort by 时，不同reducer的输出内容会有明显的重叠，即使每个reducer输出的数据都有序的。

Distribute By：进行分区，类似MapReduce中partition，结合sort by使用（DISTRIBUTE BY语句要写在SORT BY语句之前）。

示例1：将三个部门的数据，写到三个不同的文件中。第一个文件中按照sal进行排序。
对于distribute by进行测试，一定要分配多reduce进行处理，否则无法看到distribute by的效果。
在这里插入图片描述
结果：

示例2：按照deptno分区，在每个区中按deptno降序排序
在这里插入图片描述

cluster by

如果distribute by 语句和sort by语句涉及到列的完全相同，而且采用的是升序的方式，那么就可以用到cluster by 。

当distribute by和sort by字段相同时，可以使用cluster by方式。
即按单词分区，又按单词排序。
cluster by除了具有distribute by的功能外还兼具sort by的功能。但是排序只能是升序排序，不能指定排序规则。

示例1：按deptno分区，也按deptno排序
在这里插入图片描述
结果：

示例2：
在这里插入图片描述

作者：梁云亮

1024 个赞

需要登录后方可回复, 如果你还没有账号请注册新账号

相关文章

Highcharts 散点图

Xena 2020-07-03

780

vue中上传视频或图片或图片和文字一起到后端的解决方法

Anne 2020-10-24

741

Hive数据导出详解

Kitty 2023-04-16

416

Java实现冒泡排序示例介绍

Oria 2023-04-30

1087

Golang多线程排序实现快速高效地处理大规模数据

Nissa 2023-05-12

1756

oracle实现根据字段分组排序,取其第一条数据

Tamara 2023-05-12

1484

oracle数据库排序后如何获取第一条数据

Fawn 2023-05-12

886

Flutter list 数组排序示例解析

Halima 2023-05-12

1762

JavaScript指定字段排序方法sortFun函数

Ida 2023-05-12

1799

JavaScript中好用的数组对象排序方法分享

Tesia 2023-05-12

539

SpringBoot集成Jpa对数据进行排序、分页、条件查询和过滤操作

Bunny 2023-05-13

1840

spark中使用groupByKey进行分组排序的示例代码

Tricia 2023-05-23

1807

Python中Dataframe数据排序方法(含实例讲解)

Serafina 2023-06-02

624

hive内部表和外部表的区别详解

Rhea 2023-06-02

379

关于PostgreSQL截取某个字段中的部分内容进行排序的问题

Victoria 2023-07-17

1054

SQL查询中按多个字段排序的方法

Liana 2023-07-20

1454

排序算法之插入排序法解析

Hester 2023-07-20

301

排序算法之希尔排序法解析

Ianthe 2023-07-20

1837

react实现记录拖动排序

Jacinda 2023-07-20

1927

JavaScript将对象数组按字母顺序排序的方法详解

Winola 2023-07-20

1906

我要提问

致谢

帮助他人，成就自己。

人生最大成功就是伸出热情而温暖的双手，尽自己所能去帮助身边的每一个人，只要无私的奉献，就会收获到美好的生活。

1024问感谢每一位朋友的帮助和支持。

软件开发网提供编程的基础软件技术培训教程,软件开发编程实例讲解Go,Node,HTML,CSS,Javascript,Python,Java,Ruby,C,PHP,MySQL等软件开发编程语言以及数据开发的基础知识，也提供大量的软件开发在线实例、从入门到精通就在1024问。

育儿网微养生全球行美食街育儿菜谱大全海南旅游女性养狗百科星座