I/O 同步，异步，阻塞，非阻塞问题

IO - 同步，异步，阻塞，非阻塞
同步（synchronous） IO和异步（asynchronous） IO，阻塞（blocking） IO和非阻塞（non-blocking）IO ，我相信这几个词困扰过很多人，更痛苦的是，如果你查阅过文献资料，你会发现不同的资料中的解释是不一样的，例如在wiki中，异步和非阻塞被当成了一个概念。
出现这种情况的原因，我认为很大程度上是因为IO这个概念本身就很宽泛，它其实包含了好几个层面。比如说，你可以把它看做是一个物理上的设备，也可以看做是 OS抽象出来的一个软件，还可以看做是平时写程序用的read(),write()函数，不同的层面对于这几个词的理解也是不一样的。

先看一个较低的层次。如果从CPU的角度看，其实大部分的IO都是异步的：因为CPU启动这个IO操作后，就去干其它的事情了，一直到产生一个中断，告诉它IO完成了。
“Most physical I/O is asynchronous—the CPU starts the transfer and goes off to do something else until the interrupt arrives. User programs are much easier to write if the I/O operations are blocking—after a read system call the program is automatically suspended until the data are available in the buffer. It is up to the operating system to make operations that are actually interrupt-driven look blocking to the user programs.” （引自 Modern Operating Systems, 2ed）

不过，本文并不想探究那么底层的东东。作为程序员，更多的还是从应用层面来考虑。所以，以下重点介绍的是应用程序中能够采用的四种IO机制。
（说明，下文中图片引用自 http://www.ibm.com/developerworks/cn/linux/l-async/ ）

首先，从最常用到的，也是最容易理解的同步阻塞IO 说起。

在这个模型中，应用程序（application）为了执行这个read操作，会调用相应的一个system call，将系统控制权交给kernel，然后就进行等待（这其实就是被阻塞了）。kernel开始执行这个system call，执行完毕后会向应用程序返回响应，应用程序得到响应后，就不再阻塞，并进行后面的工作。

例如，“在调用 read 系统调用时，应用程序会阻塞并对内核进行上下文切换。然后会触发读操作，当响应返回时（从我们正在从中读取的设备中返回），数据就被移动到用户空间的缓冲区中。然后应用程序就会解除阻塞（read 调用返回）。”

举一个浅显的例子，就好比你去一个银行柜台存钱。首先，你会将存钱的单子填好，然后交给柜员。这里，你就好比是application，单子就是调用的 system call，柜员就是kernel。提交好单子后，你就坐在柜台前等，相当于开始进行等待。柜员办好以后会给你一个回执，表示办好了，这就是 response。然后你就可以拿着回执干其它的事了。注意，这个时候，如果你办完之后马上去查账，存的钱已经打到你的账户上了。后面你会发现，这点很重要。

接下来谈同步非阻塞IO 。
先看这个图，

在linux下，应用程序可以通过设置文件描述符的属性O_NONBLOCK，I/O操作可以立即返回，但是并不保证I/O操作成功。
也就是说，当应用程序设置了O_NONBLOCK之后，执行write操作，调用相应的system call，这个system call会从内核中立即返回。但是在这个返回的时间点，数据可能还没有被真正的写入到指定的地方。也就是说，kernel只是很快的返回了这个 system call（这样，应用程序不会被这个IO操作blocking），但是这个system call具体要执行的事情（写数据）可能并没有完成。而对于应用程序，虽然这个IO操作很快就返回了，但是它并不知道这个IO操作是否真的成功了，如果想知道，需要应用程序主动地去问kernel。

这次不是去银行存钱，而是去银行汇款。同样的，你也需要填写汇款单然后交给柜员，柜员进行一些简单的手续处理就能够给你回执。但是，你拿到回执并不意味着钱已经打到了对方的账上。事实上，一般汇款的周期大概是24个小时，如果你要以存钱的模式来汇款的话，意味着你需要在银行等24个小时，这显然是不现实的。所以，同步非阻塞IO在实际生活中也是有它的意义的。

再来谈谈异步阻塞IO 。
在linux中，常常通过select/poll来实现这种机制。

以图为例，
和之前一样，应用程序要执行read操作，因此调用一个system call，这个system call被传递给了kernel。但在应用程序这边，它调用system call之后，并不等待kernel返回response，这一点是和前面两种机制不一样的地方。这也是为什么它被称为异步的原因。但是为什么称其为阻塞呢？这是因为虽然应用程序是一个异步的方式，但是select()函数会将应用程序阻塞住，一直等到这个system call有结果返回了，再通知应用程序。也就是说，“在这种模型中，配置的是非阻塞 I/O，然后使用阻塞 select 系统调用来确定一个 I/O 描述符何时有操作。”
所以，从IO操作的实际效果来看，异步阻塞IO和第一种同步阻塞IO是一样的，应用程序都是一直等到IO操作成功之后（数据已经被写入或者读取），才开始进行下面的工作。异步阻塞IO的好处在于一个select函数可以为多个描述符提供通知，提高了并发性。

关于提高并发性这点，我们还以银行为例说明。比如说一个银行柜台，现在有10个人想存钱。按照现在银行的做法，一个个排队。第一个人先填存款单，然后提交，然后柜员处理，然后给回执，成功后再轮到下一个人。大家应该都在银行排过对，这样的流程是很痛苦的。如果按照异步阻塞的机制，10个人都填好存款单，然后都提交给柜台，提交完之后所有的10个人就在银行大厅等待。这时候会专门有个人，他会了解存款单处理的情况，一旦有存款单处理完毕，他会将回执交给相应的正在大厅等待的人，这个拿到回执的人就可以去干其他的事情了。而前面提到的这个专人，就对应于select函数。

最后，谈谈异步非阻塞IO 。
这个概念相对前面两个反而更容易理解一些。

如图所示，应用程序提交read请求的system call，然后，kernel开始处理相应的IO操作，而同时，应用程序并不等kernel返回响应，就会开始执行其他的处理操作（应用程序没有被IO操作所阻塞）。当kernel执行完毕，返回read的响应，就会产生一个信号或执行一个基于线程的回调函数来完成这次 I/O 处理过程。

比如银行存钱。现在某银行新开通了一项存钱业务。用户之需要将存款单交给柜台，然后无需等待就可以离开了。柜台办好以后会给用户发送一条短信，告知交易成功。这样用户不需要在柜台前进行长时间的等待，同时，也能够得到确切的消息知道交易完成。

从前面的介绍中可以看出，所谓的同步和异步，在这里指的是application和kernel之间的交互方式。如果application不需要等待 kernel的回应，那么它就是异步的。如果application提交完IO请求后，需要等待“回执”，那么它就是同步的。
而阻塞和非阻塞，指的是application是否等待IO操作的完成。如果application必须等到IO操作实际完成以后再执行下面的操作，那么它是阻塞的。反之，如果不等待IO操作的完成就开始执行其它操作，那么它是非阻塞的。

本文来自CSDN博客，转载请标明出处：http://blog.csdn.net/historyasamirror/archive/2009/06/15/4270633.aspx

posted on 2009-07-10 17:30 张建林阅读(593) 评论(0) 编辑收藏引用

只有注册用户登录后才能发表评论。
【推荐】100%开源！大型工业跨平台软件C++源码提供，建模，组态！



网站导航: 博客园 IT新闻 BlogJava 博问 Chat2DB 管理

jianlinzhang

常用链接

留言簿(8)

随笔档案

文章档案

学习

娱乐

搜索

最新评论

阅读排行榜

评论排行榜