MySQL分区之HASH分区详解

Vevina ·

更新时间:2024-11-13

· 405 次阅读

介绍

一、常规HASH

二、线性HASH(LINEAR HASH)

三、分区管理

1.合并分区

2.增加分区

四、移除表的分区

总结

介绍

基于给定的分区个数，将数据分配到不同的分区，HASH分区只能针对整数进行HASH，对于非整形的字段只能通过表达式将其转换成整数。表达式可以是mysql中任意有效的函数或者表达式，对于非整形的HASH往表插入数据的过程中会多一步表达式的计算操作，所以不建议使用复杂的表达式这样会影响性能。

MYSQL支持两种HASH分区，常规HASH(HASH)和线性HASH(LINEAR HASH)。

一、常规HASH

常规hash是基于分区个数的取模（%）运算。根据余数插入到指定的分区

CREATE TABLE tbhash (
    id INT NOT NULL,
    store_id INT
)
PARTITION BY HASH(store_id)
PARTITIONS 4
;

ALTER TABLE tbhash ADD INDEX ix_store_id(store_id);

INSERT INTO tbhash() VALUES(1,100),(1,101),(2,102),(3,103),(4,104);
SELECT PARTITION_NAME,PARTITION_METHOD,PARTITION_EXPRESSION,PARTITION_DESCRIPTION,TABLE_ROWS,SUBPARTITION_NAME,SUBPARTITION_METHOD,SUBPARTITION_EXPRESSION 
FROM information_schema.PARTITIONS WHERE TABLE_SCHEMA=SCHEMA() AND TABLE_NAME='tbhash';

其中100,104对4取模是0所以这两条数据被分配到了p0分区。

2.时间类型字段

CREATE TABLE employees (
    id INT NOT NULL,
    hired DATE NOT NULL DEFAULT '1970-01-01',
)
PARTITION BY HASH( YEAR(hired) )
PARTITIONS 4;

常规hash的分区非常的简便，通过取模的方式可以让数据非常平均的分布每一个分区，但是由于分区在创建表的时候已经固定了。如果新增或者收缩分区的数据迁移比较大。

二、线性HASH(LINEAR HASH)

LINEAR HASH和HASH的唯一区别就是PARTITION BY LINEAR HASH

CREATE TABLE tblinhash (
    id INT NOT NULL,
    hired DATE NOT NULL DEFAULT '1970-01-01'
)
PARTITION BY LINEAR HASH( YEAR(hired) )
PARTITIONS 6;

线性HASH的计算原理如下：

假设分区个数num=6,N表示数据最终存储的分区

sep1:V = POWER(2, CEILING(LOG(2, num))),LOG()是计算NUM以2为底的对数，CEILING()是向上取整，POWER()是取2的次方值；如果num的值是2的倍数那么这个表达式计算出来的结果不变。

V=POWER(2，CEILING(LOG(2，6)))

V=POWER(2,3)

V=8

sep2:N=values&(V-1);&位与运算，将两个值都转换成2进行求与运算，当都为1才为1；当num是2的倍数时由于V计算出来的结果不变，这时values&(V-1)=MOD(values/num)和时间HASH取模算出的结果是一致的，这时特殊情况只有当分区是2的倍数才是这种情况。values是YEAR(hired)的值

sep3:while N>=num

sep3-1：N=N& (CEIL(V/ 2)- 1)

例如：

1.当插入的值是'2003-04-14'时

V = POWER(2, CEILING( LOG(2,6) )) = 8

N = YEAR('2003-04-14') & (8 - 1)

= 2003 & 7

(3 >= 6 is FALSE: record stored in partition #3)，N不大于num所以存储在第3分区,注意这里的3指的是P3,分区号是从P0开始。

2.当插入的值是‘1998-10-19’

V = POWER(2, CEILING( LOG(2,6) )) = 8

N = YEAR('1998-10-19') & (8-1)

= 1998 & 7

= 6

(6 >= 6 is TRUE: additional step required)，由于N>=num所以要进行第三步操作

N=N&(CEILING(8/2)-1)

=6&3

(2>=6is FALSE:recored in partition #2),由于2不大于6所以存储在第2个分区，注意这里的3指的是P2,分区号是从P0开始。

INSERT INTO tblinhash() VALUES(1,'2003-04-14'),(2,'1998-10-19');
SELECT PARTITION_NAME,PARTITION_METHOD,PARTITION_EXPRESSION,PARTITION_DESCRIPTION,TABLE_ROWS,SUBPARTITION_NAME,SUBPARTITION_METHOD,SUBPARTITION_EXPRESSION 
FROM information_schema.PARTITIONS WHERE TABLE_SCHEMA=SCHEMA() AND TABLE_NAME='tblinhash';

EXPLAIN SELECT * FROM tblinhash WHERE hired='2003-04-14';

三、分区管理

常规HASH和线性HASH的增加收缩分区的原理是一样的。增加和收缩分区后原来的数据会根据现有的分区数量重新分布。HASH分区不能删除分区，所以不能使用DROP PARTITION操作进行分区删除操作；

只能通过ALTER TABLE ... COALESCE PARTITION num来合并分区，这里的num是减去的分区数量；

可以通过ALTER TABLE ... ADD PARTITION PARTITIONS num来增加分区，这里是null是在原先基础上再增加的分区数量。

1.合并分区

减去3个分区

ALTER TABLE tblinhash COALESCE PARTITION 3;

SELECT PARTITION_NAME,PARTITION_METHOD,PARTITION_EXPRESSION,PARTITION_DESCRIPTION,TABLE_ROWS,SUBPARTITION_NAME,SUBPARTITION_METHOD,SUBPARTITION_EXPRESSION 
FROM information_schema.PARTITIONS WHERE TABLE_SCHEMA=SCHEMA() AND TABLE_NAME='tblinhash';

注意：减去两个分区后，数据根据现有的分区进行了重新的分布，以'2003-04-14'为例：POWER(2, CEILING( LOG(2,3) ))=4，2003&（4-1）=3,3>=3,3&(CEILING(3/2)-1)=1,所以现在的'2003-04-14'这条记录由原来的p3变成了p1

2.增加分区

增加4个分区

ALTER TABLE tblinhash add PARTITION partitions 4;

SELECT PARTITION_NAME,PARTITION_METHOD,PARTITION_EXPRESSION,PARTITION_DESCRIPTION,TABLE_ROWS,SUBPARTITION_NAME,SUBPARTITION_METHOD,SUBPARTITION_EXPRESSION 
FROM information_schema.PARTITIONS WHERE TABLE_SCHEMA=SCHEMA() AND TABLE_NAME='tblinhash';

当在3个分区的基础上增加4个分区后，‘2003-04-14’由原来的p1变成了p3,而另一条记录由原来的p2变成了p6

四、移除表的分区

ALTER TABLE tablename
REMOVE PARTITIONING ;

注意：使用remove移除分区是仅仅移除分区的定义，并不会删除数据和drop PARTITION不一样，后者会连同数据一起删除

分区系列文章：

RANGE分区：https://www.jb51.net/article/244269.htm

COLUMN分区：https://www.jb51.net/article/96515.htm

LIST分区：https://www.jb51.net/article/244256.htm

HASH分区：https://www.jb51.net/article/244277.htm

KEY分区：https://www.jb51.net/article/244282.htm

子分区：https://www.jb51.net/article/244294.htm

指定各分区路径：https://www.jb51.net/article/244296.htm

分区索引以及分区介绍总结：https://www.jb51.net/article/244300.htm

总结

常规HASH的数据分布更加均匀一些，也便于理解；目前还没有彻底理解为什么线性HASH在收缩和增加分区时处理的速度会更快，同时线性HASH的数据分布不均匀。

到此这篇关于MySQL分区之HASH分区的文章就介绍到这了,更多相关MySQL HASH分区内容请搜索软件开发网以前的文章或继续浏览下面的相关文章希望大家以后多多支持软件开发网！

hash Mysql

1024 个赞

需要登录后方可回复, 如果你还没有账号请注册新账号

HTML 实例

Kamaria 2021-07-24

846

SVN分支

Xandy 2020-03-26

538

一文带你搞懂MySQL的事务隔离级别

Talia 2023-07-20

334

MySQL实现主从复制的原理详解

Serafina 2023-07-20

608

MySQL死锁产生的原因和解决方法

Hazel 2023-07-20

1060

MySQL中如何给一个字段递增赋值

Ebony 2023-07-20

978

mysql中如何将时间戳转换为年月日格式进行查询

Olga 2023-07-20

1661

mysql8中如何设置sql-mode

Elizabeth 2023-07-20

1618

MySQL之同表一个字段如何赋值给另一个字段

Ianthe 2023-07-20

567

MYSQL查询时间范围内的数据示例代码

Valora 2023-07-20

665

MySQL数据库字符集修改中文UTF8(永久修改)

Phemia 2023-07-20

298

MySQL数据库node使用详解

Tia 2023-07-20

1452

MYSQL根据分组获取组内多条数据中符合条件的一条(实例详解)

Summer 2023-07-20

1622

MySQL实现查询处理JSON数据的示例详解

Fredrica 2023-07-20

859

hash和history路由模式区别示例解析

Stephenie 2023-07-20

1230

Docker部署Mysql数据库步骤详解

Maha 2023-07-21

1426

docker 容器中安装mysql服务的方法

Edie 2023-07-21

583

Android连接MySQL数据库详细教程

Bonnie 2023-07-21

533

Docker容器连接外部Mysql的几种方案

Ilona 2023-07-22

729

docker简单安装部署mysql并配置远程连接

Xylona 2023-07-22

1899

我要提问

致谢

帮助他人，成就自己。

人生最大成功就是伸出热情而温暖的双手，尽自己所能去帮助身边的每一个人，只要无私的奉献，就会收获到美好的生活。

1024问感谢每一位朋友的帮助和支持。

软件开发网提供编程的基础软件技术培训教程,软件开发编程实例讲解Go,Node,HTML,CSS,Javascript,Python,Java,Ruby,C,PHP,MySQL等软件开发编程语言以及数据开发的基础知识，也提供大量的软件开发在线实例、从入门到精通就在1024问。

育儿网微养生全球行美食街育儿菜谱大全海南旅游女性养狗百科星座