面试官:Netty的线程模型可不是Reactor这么简单

日期:2021-01-21 21:45:22   来源:互联网   编辑:小狐   阅读人数:504
笔者看来Netty的内核主要包括如下图三个部分:其各个核心模块主要的职责如下:内存 主要提高高效的内存,包含内存分配,内存回收。网通通道 复制网络通信,例如实现对NIO、OIO等底层JAVA API

笔者看来Netty的内核主要包括如下图三个部分:

面试官:Netty的线程模型可不是Reactor这么简单(图1)

其各个核心模块主要的职责如下:

内存 主要提高高效的内存,包含内存分配,内存回收。

网通通道 复制网络通信,例如实现对NIO、OIO等底层JAVA API 的封装,简化网络编程模型。

大家不妨回想一下在以往的面试的过程中,面试官通常会问: Netty 的线程模型是什么?

主从多 Reactor 模型,相信大家都能脱口而出,呢?就没有了?

线程模型在网络通信中主要解决什么样的问题?在 Netty 中又是如何解决的,Netty 的线程模型为什么如此高效?请容我慢慢道来。

主从多 Reactor 模型

主从多 Reactor 模型是业界一种非常经典的线程编程模型,其原理图如下所示:

面试官:Netty的线程模型可不是Reactor这么简单(图2)

我们首先简单介绍一下上图中涉及的几个重要角色:

Acceptor 请求接收者,在实践时其职责类似,并不真正负责连接请求的建立,而只将其请求委托 Main Reactor 线程池来实现,起到一个的作用。

Main Reactor 主 Reactor 线程组,主要 负责连接事件 ,并将 IO读写请求到 SubReactor 线程池 。当然在一些需要对客户端进行权限控制等场景下,权限校验的职责可以放到 Main Reactor 线程池,即 Main Reactor 也可以注册通道的读写事件 ,读取客户端权限校验相关的数据包,执行权限验证,权限验证通过后再将2通道注册到IO线程。

Sub Reactor Main Reactor 通常监听客户端连接后会将通道的读写到 Sub Reactor 线程池中一个线程(负载均衡)负责数据的读写。在 NIO 中 通常注册通道的读(OP_READ)写事件(OP_WRITE)

为了更加深刻的理解主从 Reactor 模型,我们来看一下网络通讯一般会包含哪些关键动作:

面试官:Netty的线程模型可不是Reactor这么简单(图3)

一个网络交互通常的几个步骤如下:

服务端启动,并在特定端口上监听,例如 web 应用的 80端口。

客户端发起TCP的三次握手,与服务端建立连接,这里以 NIO 为例,连接成功建立后会创建NioSocketChannel对象。

服务端通过 NioSocketChannel 从网卡中 读取数据 。

服务端根据 通信协议 从二进制流中 解码 出一个个请求。

根据请求, 执行对应的业务操作 ,例如 Dubbo 服务端接受一个查询用户ID为1的用户信息。

将业务执行结果返回到客户端,通常涉及到 协议编码、压缩 等。

线程模型需要解决的问题:连接监听、网络读写、编码、解码、业务执行这些操作步骤如何运用 多线程编程,提升性能。

主从多Reactor模型是如何解决上面的问题呢?

连接建立(OP_ACCEPT)由 Main Reactor 线程池负责,创建NioSocketChannel后,将其给SubReactor。

SubReactor 线程池主要 负责网络的读写 (从网络中读字节流、将字节流发送到网络中)即注册OP_READ、OP_WRITE,并且 同一个通道会绑定一个SubReactor线程 。

编码、解码、业务执行,则具体情况具体分析 通常 编码、解码会放在IO线程中执行,而业务逻辑的执行通常会采用额外的线程池 ,但不是绝对的,一个好的框架通常会使用参数来进行定制化选择,例如 ping、pong 这种心跳包,直接在 IO 线程中执行,无需再到业务线程池,避免线程切换开销。

Netty 的线程模型

Netty的线程模型是基于主从多Reactor模型。

面试官:Netty的线程模型可不是Reactor这么简单(图4)

Netty 中网络的连接事件(OP_ACCEPT)由Main Reactor 线程组实现, 即 Boss Group,通常只需设置一个线程

网络的 读写操作由 Work Group ( Sub Reactor) 线程组来实现,线程的个数默认为 2 * CPU Core, 一个 Channel 绑定到其中一个 Work 线程,一个 Work 线程中可以绑定多个 Channel

在 Netty 中编码、解码等操作会被封装成一个一个事件处理器(ChannelHandler)那这些 Handler 是在IO线程池中执行?

默认情况下ChannelHandler 是在 IO 线程中执行,那如何改变默认行为呢?其关键代码如下:

面试官:Netty的线程模型可不是Reactor这么简单(图5)

关键点:在将事件处理器添加到事件链时可以指定在哪个线程池中执行,如果不指定则为 IO线程中执行。

面试官: 通常业务操作会专门开辟一个线程池,那业务处理完成之后,如何将响应结果通过 IO 线程写入到网卡中呢?

面试官:Netty的线程模型可不是Reactor这么简单(图6)

业务线程调用 Channel 对象的 write 方法并不会立即写入网络,只是将数据放入一个待写入队列(缓存区)IO线程每次执行事件选择后,会从待写入缓存区中获取写入任务,将数据真正写入到网络中,数据到达网卡之前会经过一系列的 Channel Handler(Netty事件传播机制)最终写入网卡。

最后再来介绍一下 Netty 中 IO 线程的大体工作流程。

面试官:Netty的线程模型可不是Reactor这么简单(图7)

IO线程处理的关键点:

每一IO线程在执行上述操作时是串行执行的,即注册在一个 Selector(事件选择器)中的所有通道, 同一时间只有一个通道的事件被处理。 这也是为什么NIO应对大文件传输时不具备优势的根本原因。

IO 线程在处理完所有就绪事件后,还会从任务队列(Task Queue)获取任务,例如上文中提到的业务线程在执行完业务后需要将返回结果写入网络, Netty 中所有的网络读写操作只能在IO线程中真正获得运行 ,故业务线程需要将带写入的响应结果封装成 Task,放入到 IO 线程任务队列中。

事件传播机制,可以参考笔者近期发布的文章: Netty 事件传播机制详解

总结

回到到主题,如果我们在面试过程中碰到面试官提问“Netty 的线程模型是什么?”时,我们应该可以从容应对了。

Netty的线程模型基于主从多Reactor模型。通常由一个线程负责处理OP_ACCEPT事件,拥有 CPU 核数的两倍的IO线程处理读写事件。

一个通道的IO操作会绑定在一个IO线程中,而一个IO线程可以注册多个通道。

在一个网络通信中通常会包含网络数据读写,编码、解码、业务处理。默认情况下编码、解码等操作会在IO线程中运行,但也可以指定其他线程池。

通常业务处理会单独开启业务线程池,但也可以进一步细化,例如心跳包可以直接在IO线程中处理,而需要再给业务线程池,避免线程切换。

在一个IO线程中所有通道的事件是 串行处理 的。

本文相关词条概念解析:

线程

线程,计算机科学术语,有时也被称为轻量级进程(Light Weight Process,LWP),它是运行中的程序的调度单位。一个标准的线程由线程ID,当前指令指针(PC),寄存器集合和堆栈组成。线程被包含在进程之中,是进程的一个实体,是CPU调度和分派的基本单位它是比进程更小的能独立运行的基本单位。线程自己基本上不拥有系统资源,只拥有一点在运行中必不可少的资源(如程序计数器,一组寄存器和栈),但是它可与同属一个进程的其他的线程共享进程所拥有的全部资源。

  • 网友评论
返回顶部