「这是我参与11月更文挑战的第25天,活动详情查看:2021最后一次更文挑战」。
点赞再看,养成习惯👏👏
IO模型
IO模型简单说就是用什么样的通道进行数据的发送和接收,Java共支持3种网络编程IO模式:BIO
,NIO
,AIO
。
BIO(Blocking IO)
BIO是同步阻塞模型,一个客户端连接对应一个处理线程,典型的模型如下:
BIO服务端示例代码
1 | java复制代码public class SocketServer { |
BIO客户端示例代码
1 | java复制代码public class SocketClient { |
缺点
由于accept()
是一个阻塞方法,如果没有客户端连接的话,将一直阻塞着,而且在单线程的情况下由于read也是一个阻塞的操作,如果连接不做数据的读写操作会导致线程阻塞,浪费资源,而且其它客户端也进不来,多线程可以解决这个问题,但是很多客户端如果仅仅只是连接下,又不做读写操作,那么会操作大量的资源浪费,如果线程很多,会导致服务器线程太多,压力太大,比如 C10K 问题。
应用场景
BIO方式适用于连接数目比较小并且一次发送大量数据的场景,这种方式对服务器资源要求比较高,并发局限于应用中。但程序简单易理解。
NIO(Non Blocking IO)
同步非阻塞,服务器实现模式为一个线程可以处理多个请求(连接) ,客户端发送的连接请求都会注册到多路复用器selector上,多路复用器轮询到连接有IO请求就进行处理,JDK1.4开始引入。
应用场景:
NIO方式适用于连接数目多且连接比较短(轻操作) 的架构, 比如聊天服务器, 弹幕系统, 服务器间通讯,编程比较复杂。
NIO服务端代码示例
1 | java复制代码public class NioServer { |
总结:如果连接数太多的话,会有大量的无效遍历,假如有10000个连接,其中只有1000个连接有写数据,但是由于其他9000个连接并没有断开,我们还是要每次轮询遍历一万次,其中有十分之九的遍历都是无效的,这显然不是一个让人很满意的状态。
NIO引入多路复用器代码示例
1 | java复制代码public class NioSelectorServer { |
NIO 有三大核心组件: Channel(通道), Buffer(缓冲区),Selector(多路复用器)
1)、channel 类似于流,每个 channel 对应一个 buffer缓冲区,buffer 底层就是个数组。
2)、channel 会注册到 selector 上,由 selector 根据 channel 读写事件的发生将其交由某个空闲的线程处理。
3)、NIO 的 Buffer 和 channel 都是既可以读也可以写。
NIO底层在JDK1.4版本是用linux的内核函数 select()
或 poll()
来实现,跟上面的 NioServer 代码类似,selector 每次都会轮询所有的 sockchannel 看下哪个 channel 有读写事件,有的话就处理,没有就继续遍历,JDK1.5开始引入了 epoll 基于事件响应机制来优化NIO。
底层实现
NioSelectorServer 代码里如下几个方法非常重要,我们从Hotspot与Linux内核函数级别来理解下
1 | java复制代码Selector.open() //创建多路复用器 |
总结:NIO整个调用流程就是Java调用了操作系统的内核函数来创建Socket,获取到Socket的文件描述符,再创建一个Selector对象,对应操作系统的Epoll描述符,将获取到的Socket连接的文件描述符的事件绑定到Selector对应的Epoll文件描述符上,进行事件的异步通知,这样就实现了使用一条线程,并且不需要太多的无效的遍历,将事件处理交给了操作系统内核(操作系统中断程序实现),大大提高了效率。
Epoll函数详解
(1) int epoll_create(int size);
创建一个epoll实例,并返回一个非负数作为文件描述符,用于对epoll接口的所有后续调用。
参数size代表可能会容纳size个描述符,但size不是一个最大值,只是提示操作系统它的数量级,现在这个参数基本上已经弃用了。
所以说调用Selector selector = Selector.open();执行这一句本质就是创建了一个epoll对象,是通过调用操作系统函数epoll_create创建的。
(2) int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event);
使用文件描述符epfd引用的epoll实例,对目标文件描述符fd执行op操作。
参数epfd表示epoll对应的文件描述符,参数fd表示socket对应的文件描述符。
参数op有以下几个值:
- EPOLL_CTL_ADD:注册新的fd到epfd中,并关联事件event;
- EPOLL_CTL_MOD:修改已经注册的fd的监听事件;
- EPOLL_CTL_DEL:从epfd中移除fd,并且忽略掉绑定的event,这时event可以为null;
参数event是一个结构体
1 | c复制代码struct epoll_event { |
events有很多可选值,这里只举例最常见的几个:
- EPOLLIN :表示对应的文件描述符是可读的;
- EPOLLOUT:表示对应的文件描述符是可写的;
- EPOLLERR:表示对应的文件描述符发生了错误;
成功则返回0,失败返回-1
(3)int epoll_wait(int epfd, struct epoll_event *events, int maxevents, int timeout);
等待文件描述符epfd上的事件。
epfd是Epoll对应的文件描述符,events表示调用者所有可用事件的集合,maxevents表示最多等到多少个事件就返回,timeout是超时时间。
I/O多路复用底层主要用的Linux 内核函数(select,poll,epoll)来实现,windows不支持epoll实现,windows底层是基于winsock2的select函数实现的(不开源)。
select | poll | epoll(jdk 1.5及以上) | |
---|---|---|---|
操作方式 | 遍历 | 遍历 | 回调 |
底层实现 | 数组 | 链表 | 哈希表 |
IO效率 | 每次调用都进行线性遍历,时间复杂度为O(n) | 每次调用都进行线性遍历,时间复杂度为O(n) | 事件通知方式,每当有IO事件就绪,系统注册的回调函数就会被调用,时间复杂度O(1) |
最大连接 | 有上限 | 无上限 | 无上限 |
AIO(NIO 2.0)
异步非阻塞,由操作系统完成后回调通知服务端程序启动线程去处理,一般适用于连接数较多且连接时间较长的应用。
应用场景
AIO方式适用于连接数目多且连接比较长(重操作)的架构,JDK7 开始支持。
AIO服务端代码示例
1 | java复制代码public class AIOServer { |
AIO客户端代码示例
1 | java复制代码public class AIOClient { |
BIO、 NIO、 AIO 对比
本文转载自: 掘金