Linux多路转接I/O模型详解

从Select到Epoll，彻底搞懂高性能网络编程

在Linux系统编程中，I/O多路复用（I/O multiplexing）是一种高效处理多个I/O事件的技术。它允许单个进程同时监视多个文件描述符，一旦某个描述符就绪（可读/可写/异常），就能通知程序进行相应的读写操作。本文将详细介绍三种经典的I/O多路复用机制：select、poll 和 epoll，帮助初学者理解它们的原理、优缺点及适用场景。

1. select 模型

select 是最早出现的I/O多路复用函数，它通过三个fd_set集合来监听可读、可写和异常事件。调用select时，用户需要将待监听的fd集合从用户空间拷贝到内核空间，内核遍历所有fd检查状态，返回后用户需要再次遍历找到就绪的fd。select的主要缺点包括：单个进程能监听的fd数量受FD_SETSIZE限制（通常为1024）；每次调用都需要重新设置fd集合；随着fd数量增加，性能线性下降。

2. poll 模型

poll 是对select的改进，它使用pollfd结构体数组来管理fd，没有最大数量限制（受系统内存限制）。poll仍然需要遍历所有fd，并将整个数组拷贝到内核，返回后同样需要遍历所有fd。虽然poll解决了select的1024限制，但性能问题依然存在，当连接数较大时效率较低。

3. epoll 模型

epoll 是Linux特有的I/O多路复用机制，专为处理大量文件描述符而设计。它通过三个系统调用（epoll_create, epoll_ctl, epoll_wait）实现，采用事件驱动机制，只在就绪事件发生时回调，避免了遍历所有fd。epoll使用内存映射技术，减少用户态与内核态的数据拷贝，性能不会随着fd数量增加而明显下降。因此，epoll成为高性能网络服务器（如Nginx、Redis）的首选。