消息队列_14(Kafka如何实现高性能IO）

Iola ·

更新时间:2024-09-21

· 551 次阅读

Kafka如何实现高性能IO？ 1.使用批量消息提升服务端处理能力

kafka内部，消息都是以“批”为单位处理的。

消息在kafka中的流转：

发送端（Producer）
kafka的Producer只提供了单条返送的send()方法，并没有提供任何批量发送的接口。当调用send()方法发送一条消息之后，无论是同步还是异步发送，这条消息不会发送出去，会先缓存起来，然后选择合适的时机把缓存中的所有消息组成一批，一次性发给Broker。服务端（Broker）
不会把一批消息再还原成多条消息，再一条一条处理。在Broker整个处理流程中，无论是写入磁盘、从磁盘读出来、还是复制到其他副本这些流程中，批消息都不会被解开，一直是作为一条“批消息”来进行处理的。 消费时
同样以批为单位进行传递的，Consumer从Broker拉到一批消息后，客户端把批消息解开，再一条一条交给用户代码处理。

构建批消息和解开批消息分别在发送端和消费端的客户端完成，不仅减轻了Broker的压力，最重要的是减少了Broker处理请求的次数，提升了总体的处理能力。

2. 使用顺序读写提升磁盘IO性能

对于磁盘，顺序读写性能远远好于随机读写。顺序读写相比随机读写省去了大部分的寻址时间，它只需要寻址一次。
Kafka利用了这个存储特性。存储设计简单，对于每个分区，它把从Producer收到的消息，顺序地写入对应log文件，一个文件写满后，开启一个新的文件这样顺序写下去。消费的时候，也顺序的读取。

3.利用PageCache加速消息读写

PageCache就是操作系统在内存中给磁盘的文件建立缓存。在调用系统的API读写文件是，不会直接读取磁盘上的，而是操作的是PageCache，也就是文件在内存中缓存的副本。

写文件：数据 — 写入 —> 内存的PageCache ——一批一批写入—— > 磁盘
读文件：从PageCache中读取数据

PageCache中有数据，直接读取，节省从磁盘上读取数据的时间 PageCache中没有数据，操作系统会引发一个缺页中断，应用程序的读取线程会被阻塞，操作系统把数据从文件中复制到PageCache中，然后应用程序再从PageCache中继续吧数据读取出来。其中的读磁盘操作会比较慢。

使用完PageCache后，不会立即清除，而是尽可能利用空闲内存保留，内存不足时，使用清理策略（LRU或者它的变种算法）清理掉部分PageCache。保留逻辑：优先保留最近一段时间最常使用的PageCache。

大部分情况下，消费读消息都会命中PageCache，好处：

读取的速度非常快给写入消息让出磁盘的IO资源，简介提升了写入的性能 4. ZeroCopy: 零拷贝技术

在服务端，处理消费的大致逻辑：

从文件中找到消息数据，读到内存中把消息通过网络发给客户端

这个过程数据实际做了2次或者3次复制：

从文件复制到PageCache中，如果命中PageCache，这一步可以省掉；从PageCache复制到应用程序的内存空间中，也就是我们可以操作的对象所在的内存；从应用程序的内存空间复制到Socket的缓冲区，这个过程就是调用网络应用框架的API发送数据的过程

kafka利用零拷贝技术可以减少一次复制，2、3步骤合并为一次。直接从PageCache中把数据复制到Socket缓冲区，减少一次复制，由于不用把数据复制到用户内存空间，DMA控制器可以直接完成数据复制，不需要CPU参与，速度更快。

系统调用：

#include 
ssize_t sendfile(int out_fd, int in_fd, off_t *offset, size_t count);

前两个参数：目的端和远端的文件描述符，后两个参数：远端的偏移量和复制数据的长度，返回值是实际复制数据的长度。

作者：窝是一只程序猿

io 队列 kafka 消息队列

1024 个赞

需要登录后方可回复, 如果你还没有账号请注册新账号

Ruby Web Service 应用 - SOAP4R

Rhoda 2020-05-09

893

MySQL 安装

Prudence 2020-08-30

665

Laravel数据库读写分离配置的方法

Ursula 2020-10-02

766

display:none和visibility:hidden的差别比较与演示代码

Querida 2020-07-01

876

.NETCore中RabbitMQ使用死信队列的实现

Olivia 2023-05-13

622

MySQL数据同步出现Slave_IO_Running: No问题的解决

Bliss 2023-05-13

898

一文详解golang通过io包进行文件读写

Rhoda 2023-05-13

1639

Redis优雅地实现延迟队列的方法分享

Serepta 2023-05-13

1992

Linux的5种IO模型用法详解

Lassie 2023-05-13

1603

SpringBootdisruptor高性能队列使用

Diane 2023-05-31

1460

python浅谈一下线程间通信之队列

Tanisha 2023-07-01

1201

kafka消费不到数据的排查过程

Nora 2023-07-03

666

SparkStreaming整合Kafka过程详解

Pandora 2023-07-04

721

Golang操作Kafka如何设置消息的失效时间

Olinda 2023-07-17

325

golang微服务框架kratos实现Socket.IO服务的方法

Kitty 2023-07-17

1818

Go高级特性探究之优先级队列详解

Elsa 2023-07-17

一文弄懂RedisStream消息队列

Sabah 2023-07-20

516

redis使用zset实现延时队列的示例代码

Faith 2023-07-20

1143

一文详解Go语言io包中的discard类型

Rose 2023-07-21

1036

Go语言之io.ReadAtLeast函数的基本使用和原理解析

Querida 2023-07-21

1350

我要提问

致谢

帮助他人，成就自己。

人生最大成功就是伸出热情而温暖的双手，尽自己所能去帮助身边的每一个人，只要无私的奉献，就会收获到美好的生活。

1024问感谢每一位朋友的帮助和支持。

软件开发网提供编程的基础软件技术培训教程,软件开发编程实例讲解Go,Node,HTML,CSS,Javascript,Python,Java,Ruby,C,PHP,MySQL等软件开发编程语言以及数据开发的基础知识，也提供大量的软件开发在线实例、从入门到精通就在1024问。

育儿网微养生全球行美食街育儿菜谱大全海南旅游女性养狗百科星座