Epoll笔记！

epoll的接口非常简单，一共就三个函数：
1. int epoll_create(int size);
创建一个epoll的句柄，size用来告诉内核这个监听的数目一共有多大。这个参数不同于select()中的第一个参数，给出最大监听的fd+1的值。需要注意的是，当创建好epoll句柄后，它就是会占用一个fd值，在linux下如果查看/proc/进程id/fd/，是能够看到这个fd的，所以在使用完epoll后，必须调用close()关闭，否则可能导致fd被耗尽。

2. int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event);
epoll的事件注册函数，它不同与select()是在监听事件时告诉内核要监听什么类型的事件，而是在这里先注册要监听的事件类型。第一个参数是epoll_create()的返回值，第二个参数表示动作，用三个宏来表示：
EPOLL_CTL_ADD：注册新的fd到epfd中；
EPOLL_CTL_MOD：修改已经注册的fd的监听事件；
EPOLL_CTL_DEL：从epfd中删除一个fd；
第三个参数是需要监听的fd，第四个参数是告诉内核需要监听什么事，struct epoll_event结构如下：
struct epoll_event {
__uint32_t events; /* Epoll events */
epoll_data_t data; /* User data variable */
};

events可以是以下几个宏的集合：
EPOLLIN ：表示对应的文件描述符可以读（包括对端SOCKET正常关闭）；
EPOLLOUT：表示对应的文件描述符可以写；
EPOLLPRI：表示对应的文件描述符有紧急的数据可读（这里应该表示有带外数据到来）；
EPOLLERR：表示对应的文件描述符发生错误；
EPOLLHUP：表示对应的文件描述符被挂断；
EPOLLET：将EPOLL设为边缘触发(Edge Triggered)模式，这是相对于水平触发(Level Triggered)来说的。
EPOLLONESHOT：只监听一次事件，当监听完这次事件之后，如果还需要继续监听这个socket的话，需要再次把这个socket加入到EPOLL队列里

3. int epoll_wait(int epfd, struct epoll_event * events, int maxevents, int timeout);
等待事件的产生，类似于select()调用。参数events用来从内核得到事件的集合，maxevents告之内核这个events有多大，这个maxevents的值不能大于创建epoll_create()时的size，参数timeout是超时时间（毫秒，0会立即返回，-1将不确定，也有说法说是永久阻塞）。该函数返回需要处理的事件数目，如返回0表示已超时。

EPOLL事件有两种模型：
Edge Triggered (ET)
Level Triggered (LT)

ET(edge-triggered)是高速工作方式，只支持no-block socket。在这种模式下，当描述符从未就绪变为就绪时，内核通过epoll告诉你。然后它会假设你知道文件描述符已经就绪，并且不会再为那个文件描述符发送更多的就绪通知，直到你做了某些操作导致那个文件描述符不再为就绪状态了(比如，你在发送，接收或者接收请求，或者发送接收的数据少于一定量时导致了一个EWOULDBLOCK 错误）。但是请注意，如果一直不对这个fd作IO操作(从而导致它再次变成未就绪)，内核不会发送更多的通知(only once),不过在TCP协议中，ET模式的加速效用仍需要更多的benchmark确认

另外，当使用epoll的ET模型来工作时，当产生了一个EPOLLIN事件后，
读数据的时候需要考虑的是当recv()返回的大小如果等于请求的大小，那么很有可能是缓冲区还有数据未读完，也意味着该次事件还没有处理完，所以还需要再次读取：
while(rs)
{
buflen = recv(activeevents[i].data.fd, buf, sizeof(buf), 0);
if(buflen < 0)
{
    // 由于是非阻塞的模式,所以当errno为EAGAIN时,表示当前缓冲区已无数据可读
    // 在这里就当作是该次事件已处理处.
    if(errno == EAGAIN)
     break;
    else
     return;
   }
   else if(buflen == 0)
   {
     // 这里表示对端的socket已正常关闭.
   }
   if(buflen == sizeof(buf)
     rs = 1;   // 需要再次读取
   else
     rs = 0;
}

还有，假如发送端流量大于接收端的流量(意思是epoll所在的程序读比转发的socket要快),由于是非阻塞的socket,那么send()函数虽然返回,但实际缓冲区的数据并未真正发给接收端,这样不断的读和发，当缓冲区满后会产生EAGAIN错误(参考man send),同时,不理会这次请求发送的数据.所以,需要封装socket_send()的函数用来处理这种情况,该函数会尽量将数据写完再返回，返回-1表示出错。在socket_send()内部,当写缓冲已满(send()返回-1,且errno为EAGAIN),那么会等待后再重试.这种方式并不很完美,在理论上可能会长时间的阻塞在socket_send()内部,但暂没有更好的办法.

ssize_t socket_send(int sockfd, const char* buffer, size_t buflen)
{
ssize_t tmp;
size_t total = buflen;
const char *p = buffer;

while(1)
{
    tmp = send(sockfd, p, total, 0);
    if(tmp < 0)
    {
      // 当send收到信号时,可以继续写,但这里返回-1.
      if(errno == EINTR)
        return -1;

      // 当socket是非阻塞时,如返回此错误,表示写缓冲队列已满,
      // 在这里做延时后再重试.
      if(errno == EAGAIN)
      {
        usleep(1000);
        continue;
      }

      return -1;
    }

    if((size_t)tmp == total)
      return buflen;

    total -= tmp;
    p += tmp;
}

return tmp;
}

posted on 2008-06-23 10:17 Bugs 阅读(1536) 评论(6) 编辑收藏引用

# re: Epoll笔记！ 2008-06-23 10:25 Bugs

/*
这种方式并不很完美,在理论上可能会长时间的阻塞在socket_send()内部,但暂没有更好的办法.*/
这种情况下，比较好的方法是为该socket关联一个写数据队列或缓冲，本次写失败之后，等待epoll的下一次写事件通知，再访问该关联数据队列，再次发送。回复更多评论

# re: Epoll笔记！[未登录] 2008-06-23 12:25 CppExplore

socket本身有发送缓冲区的，不必再关联写数据队列或缓存。不放心可以开大缓冲区。回复更多评论

# re: Epoll笔记！ 2008-06-24 08:39 饭中淹

额外的一个写数据队列或者缓冲是很重要的。
特别是需要处理很多socket的时候。

而且
EPOLL可以和线程池结合起来使用。用一个队列和一个线程池来模拟
IOCP，效率可能会比较高。
回复更多评论

# re: Epoll笔记！ 2008-06-24 11:08 Bugs

@饭中淹
更加期待*nix下的AIO对套接字的支持。
完全就是与IOCP模式相同。
回复更多评论

# re: Epoll笔记！[未登录] 2008-06-24 11:32 cppexplore

没觉得有什么必要性，每个socket都有自己的缓存的，不是共用的，再引入的复杂性和产出之间权衡下。网络层上接线程消息队列，属于系统线程划分的范畴，不仅epoll可以 select、poll等每个都可以。
完全与iocp相同，自己封装就可，仅仅是外在的表现形式，并不是穿了一件AIO的外衣就有AIO的性能。回复更多评论

# re: Epoll笔记！ 2008-06-25 21:54 Hellfire

用epoll模拟iocp， asio就是这么干的。
效率上肯定不如原生的AIO来的好，
如果是跨平台的高效框架，也可以作为一种考虑。回复更多评论

刷新评论列表

只有注册用户登录后才能发表评论。
【推荐】100%开源！大型工业跨平台软件C++源码提供，建模，组态！



网站导航: 博客园 IT新闻 BlogJava 博问 Chat2DB 管理

# re: Epoll笔记！ 2008-06-23 10:25 Bugs

# re: Epoll笔记！[未登录] 2008-06-23 12:25 CppExplore

# re: Epoll笔记！ 2008-06-24 08:39 饭中淹

# re: Epoll笔记！ 2008-06-24 11:08 Bugs

# re: Epoll笔记！[未登录] 2008-06-24 11:32 cppexplore

# re: Epoll笔记！ 2008-06-25 21:54 Hellfire

Bugs

导航

统计

常用链接

留言簿(4)

随笔档案(16)

Blog

Web

最新随笔

搜索

积分与排名

最新随笔

最新评论

阅读排行榜

评论排行榜

Epoll笔记！

评论