那谁的技术博客

感兴趣领域:高性能服务器编程,存储,算法,Linux内核
随笔 - 210, 文章 - 0, 评论 - 1183, 引用 - 0
数据加载中……

epoll为什么这么快

epoll是多路复用IO(I/O Multiplexing)中的一种方式,但是仅用于linux2.6以上内核,在开始讨论这个问题之前,先来解释一下为什么需要多路复用IO.

以一个生活中的例子来解释.

假设你在大学中读书,要等待一个朋友来访,而这个朋友只知道你在A号楼,但是不知道你具体住在哪里,于是你们约好了在A号楼门口见面.

如果你使用的阻塞IO模型来处理这个问题,那么你就只能一直守候在A号楼门口等待朋友的到来,在这段时间里你不能做别的事情,不难知道,这种方式的效率是低下的.

现在时代变化了,开始使用多路复用IO模型来处理这个问题.你告诉你的朋友来了A号楼找楼管大妈,让她告诉你该怎么走.这里的楼管大妈扮演的就是多路复用IO的角色.

进一步解释select和epoll模型的差异.

select版大妈做的是如下的事情:比如同学甲的朋友来了,select版大妈比较笨,她带着朋友挨个房间进行查询谁是同学甲,你等的朋友来了,于是在实际的代码中,select版大妈做的是以下的事情:

int n = select(&readset,NULL,NULL,100);

for (int i = 0; n > 0++i)
{
   
if (FD_ISSET(fdarray[i], &readset))
   {
      do_something(fdarray[i]);
      --n;
   }
}

epoll版大妈就比较先进了,她记下了同学甲的信息,比如说他的房间号,那么等同学甲的朋友到来时,只需要告诉该朋友同学甲在哪个房间即可,不用自己亲自带着人满大楼的找人了.于是epoll版大妈做的事情可以用如下的代码表示:
n=epoll_wait(epfd,events,20,500);
   
for(i=0;i<n;++i)
{
    do_something(events[n]);
}

在epoll中,关键的数据结构epoll_event定义如下:
typedef union epoll_data {
                
void *ptr;
                
int fd;
                __uint32_t u32;
                __uint64_t u64;
        } epoll_data_t;

        
struct epoll_event {
                __uint32_t events;      
/* Epoll events */
                epoll_data_t data;      
/* User data variable */
        }; 
可以看到,epoll_data是一个union结构体,它就是epoll版大妈用于保存同学信息的结构体,它可以保存很多类型的信息:fd,指针,等等.有了这个结构体,epoll大妈可以不用吹灰之力就可以定位到同学甲.

别小看了这些效率的提高,在一个大规模并发的服务器中,轮询IO是最耗时间的操作之一.再回到那个例子中,如果每到来一个朋友楼管大妈都要全楼的查询同学,那么处理的效率必然就低下了,过不久楼底就有不少的人了.

对比最早给出的阻塞IO的处理模型, 可以看到采用了多路复用IO之后, 程序可以自由的进行自己除了IO操作之外的工作, 只有到IO状态发生变化的时候由多路复用IO进行通知, 然后再采取相应的操作, 而不用一直阻塞等待IO状态发生变化了.

从上面的分析也可以看出,epoll比select的提高实际上是一个用空间换时间思想的具体应用.



posted on 2008-10-12 22:35 那谁 阅读(20263) 评论(15)  编辑 收藏 引用 所属分类: 网络编程服务器设计Linux/Unix

评论

# re: epoll为什么这么快[未登录]  回复  更多评论   

不错不错,大妈的比喻甚是形象
2008-10-14 13:18 | frank

# re: epoll为什么这么快  回复  更多评论   

这个例子甚好!
弄不清楚epoll和select的区别来着。
2008-10-22 22:18 | ronliu

# re: epoll为什么这么快  回复  更多评论   

niu
2008-12-12 11:00 | kou

# re: epoll为什么这么快  回复  更多评论   

比喻很形象,如果能再加上一些测试数据就好了
2009-07-01 17:10 | liang

# re: epoll为什么这么快  回复  更多评论   

好文章!Squid、Memcahed 以及 Nginx 就是采用epoll多路复用模型的。学习了。
2009-08-24 23:24 | wanwan

# re: epoll为什么这么快  回复  更多评论   

可以看到,epoll_data是一个union结构体,它就是epoll版大妈用于保存同学信息的结构体,它可以保存很多类型的信息:fd,指针,等等.有了这个结构体,epoll大妈可以不用吹灰之力就可以定位到同学甲.
这里解释不太对,这个结构体是用户用来判断是哪个SOCKET的特征。不是快速找到的原因。
2009-10-07 10:34 | LXJ

# re: epoll为什么这么快  回复  更多评论   

说实话,从楼主列举的代码,没看到select 和epoll 的区别在哪里?
2010-03-02 14:55 | guest

# re: epoll为什么这么快  回复  更多评论   

挺好的。

不过关于回调那 不是很清楚
2010-08-26 11:08 | 欣萌

# re: epoll为什么这么快  回复  更多评论   

比喻的真是好!
2010-10-01 12:39 | khejing

# re: epoll为什么这么快  回复  更多评论   

orz.......
(楼主一定这么干过吧)
2010-11-16 21:00 | zgx

# re: epoll为什么这么快[未登录]  回复  更多评论   


楼主的分析是错误的。
epoll的高效是在内核实现的高效,并不是应用程序的实现的高效。
看看内核代码就搞清楚了。
2011-05-23 18:57 | kk

# re: epoll为什么这么快  回复  更多评论   

不错,比喻很好
2011-05-24 09:59 | www

# re: epoll为什么这么快  回复  更多评论   

摆脱,你这种文章充满了错误,摆脱不要误导别人
2012-08-12 15:06 | 显然是错的

# re: epoll为什么这么快  回复  更多评论   

@guest
确实没看出区别,,,不是把挨个循环做到底层了么。。。。还是要循环吧
2013-08-22 18:50 | kbl

# re: epoll为什么这么快  回复  更多评论   

@LXJ
确实是,这很容易导致误导
2015-03-24 13:55 | 不知

只有注册用户登录后才能发表评论。
网站导航: 博客园   IT新闻   BlogJava   博问   Chat2DB   管理