exit和_exit(Linux进程控制

Posted on 2009-02-17 17:42 Prayer 阅读(1178) 评论(0) 编辑收藏引用所属分类: LINUX/UNIX/AIX

作为系统调用而言，_exit和exit是一对孪生兄弟，它们究竟相似到什么程度，我们可以从Linux的源码中找到答案：

#define __NR__exit __NR_exit /* 摘自文件include/asm-i386/unistd.h第334行 */

"__NR_"是在Linux的源码中为每个系统调用加上的前缀，请注意第一个exit前有2条下划线，第二个exit前只有1条下划线。

这时随便一个懂得C语言并且头脑清醒的人都会说，_exit和exit没有任何区别，但我们还要讲一下这两者之间的区别，这种区别主要体现在它们在函数库中的定义。_exit在Linux函数库中的原型是：

＃i nclude<unistd.h>
            void _exit(int status);

和exit比较一下，exit()函数定义在stdlib.h中，而_exit()定义在unistd.h中，从名字上看，stdlib.h似乎比unistd.h高级一点，那么，它们之间到底有什么区别呢？让我们先来看流程图，通过下图，我们会对这两个系统调用的执行过程产生一个较为直观的认识。

从图中可以看出，_exit()函数的作用最为简单：直接使进程停止运行，清除其使用的内存空间，并销毁其在内核中的各种数据结构；exit()函数则在这些基础上作了一些包装，在执行退出之前加了若干道工序，也是因为这个原因，有些人认为exit已经不能算是纯粹的系统调用。

exit()函数与_exit()函数最大的区别就在于exit()函数在调用exit系统调用之前要检查文件的打开情况，把文件缓冲区中的内容写回文件，就是图中的"清理I/O缓冲"一项。

在Linux的标准函数库中，有一套称作"高级I/O"的函数，我们熟知的printf()、fopen()、fread()、fwrite()都在此列，它们也被称作"缓冲I/O（buffered I/O）"，其特征是对应每一个打开的文件，在内存中都有一片缓冲区，每次读文件时，会多读出若干条记录，这样下次读文件时就可以直接从内存的缓冲区中读取，每次写文件的时候，也仅仅是写入内存中的缓冲区，等满足了一定的条件（达到一定数量，或遇到特定字符，如换行符和文件结束符EOF），再将缓冲区中的内容一次性写入文件，这样就大大增加了文件读写的速度，但也为我们编程带来了一点点麻烦。如果有一些数据，我们认为已经写入了文件，实际上因为没有满足特定的条件，它们还只是保存在缓冲区内，这时我们用_exit()函数直接将进程关闭，缓冲区中的数据就会丢失，反之，如果想保证数据的完整性，就一定要使用exit()函数。

请看以下例程：

/* exit2.c */
            ＃i nclude<stdlib.h>
            main()
            {
            printf("output begin
            ");
            printf("content in buffer");
            exit(0);
            }

编译并运行：

$gcc exit2.c -o exit2
            $./exit2
            output begin
            content in buffer
            /* _exit1.c */
            ＃i nclude<unistd.h>
            main()
            {
            printf("output begin
            ");
            printf("content in buffer");
            _exit(0);
            }

编译并运行：

$gcc _exit1.c -o _exit1
            $./_exit1
            output begin

在Linux中，标准输入和标准输出都是作为文件处理的，虽然是一类特殊的文件，但从程序员的角度来看，它们和硬盘上存储数据的普通文件并没有任何区别。与所有其他文件一样，它们在打开后也有自己的缓冲区。

请读者结合前面的叙述，思考一下为什么这两个程序会得出不同的结果。相信如果您理解了我前面所讲的内容，会很容易的得出结论。

在这篇文章中，我们对Linux的进程管理作了初步的了解，并在此基础上学习了getpid、fork、exit和_exit四个系统调用。在下一篇文章中，我们将学习与Linux进程管理相关的其他系统调用，并将作一些更深入的探讨。

前面的文章中，我们已经了解了父进程和子进程的概念，并已经掌握了系统调用exit的用法，但可能很少有人意识到，在一个进程调用了exit之后，该进程并非马上就消失掉，而是留下一个称为僵尸进程（Zombie）的数据结构。在Linux进程的5种状态中，僵尸进程是非常特殊的一种，它已经放弃了几乎所有内存空间，没有任何可执行代码，也不能被调度，仅仅在进程列表中保留一个位置，记载该进程的退出状态等信息供其他进程收集，除此之外，僵尸进程不再占有任何内存空间。从这点来看，僵尸进程虽然有一个很酷的名字，但它的影响力远远抵不上那些真正的僵尸兄弟，真正的僵尸总能令人感到恐怖，而僵尸进程却除了留下一些供人凭吊的信息，对系统毫无作用。

也许读者们还对这个新概念比较好奇，那就让我们来看一眼Linux里的僵尸进程究竟长什么样子。

当一个进程已退出，但其父进程还没有调用系统调用wait（稍后介绍）对其进行收集之前的这段时间里，它会一直保持僵尸状态，利用这个特点，我们来写一个简单的小程序：

/* zombie.c */
            ＃i nclude
            ＃i nclude
            main()
            {
            pid_t pid;
            pid=fork();
            if(pid<0) /* 如果出错 */
            printf("error occurred!n");
            else if(pid==0) /* 如果是子进程 */
            exit(0);
            else  /* 如果是父进程 */
            sleep(60); /* 休眠60秒，这段时间里，父进程什么也干不了 */
            wait(NULL); /* 收集僵尸进程 */
            }

sleep的作用是让进程休眠指定的秒数，在这60秒内，子进程已经退出，而父进程正忙着睡觉，不可能对它进行收集，这样，我们就能保持子进程60秒的僵尸状态。

编译这个程序：

$ cc zombie.c -o zombie

后台运行程序，以使我们能够执行下一条命令：

$ ./zombie &
            [1] 1577

列一下系统内的进程：

$ ps -ax
            ...     ...
            1177 pts/0       S         0:00 -bash
            1577 pts/0       S         0:00 ./zombie
            1578 pts/0       Z         0:00 [zombie ]
            1579 pts/0       R         0:00 ps -ax

没有出现Z的zombie

看到中间的"Z"了吗？那就是僵尸进程的标志，它表示1578号进程现在就是一个僵尸进程。

我们已经学习了系统调用exit，它的作用是使进程退出，但也仅仅限于将一个正常的进程变成一个僵尸进程，并不能将其完全销毁。僵尸进程虽然对其他进程几乎没有什么影响，不占用CPU时间，消耗的内存也几乎可以忽略不计，但有它在那里呆着，还是让人觉得心里很不舒服。而且Linux系统中进程数目是有限制的，在一些特殊的情况下，如果存在太多的僵尸进程，也会影响到新进程的产生。那么，我们该如何来消灭这些僵尸进程呢？

先来了解一下僵尸进程的来由，我们知道，Linux和UNIX总有着剪不断理还乱的亲缘关系，僵尸进程的概念也是从UNIX上继承来的，而UNIX的先驱们设计这个东西并非是因为闲来无聊想烦烦其他的程序员。僵尸进程中保存着很多对程序员和系统管理员非常重要的信息，首先，这个进程是怎么死亡的？是正常退出呢，还是出现了错误，还是被其它进程强迫退出的？其次，这个进程占用的总系统CPU时间和总用户CPU时间分别是多少？发生页错误的数目和收到信号的数目。这些信息都被存储在僵尸进程中，试想如果没有僵尸进程，进程一退出，所有与之相关的信息都立刻归于无形，而此时程序员或系统管理员需要用到，就只好干瞪眼了。

那么，我们如何收集这些信息，并终结这些僵尸进程呢？就要靠我们下面要讲到的waitpid调用和wait调用。这两者的作用都是收集僵尸进程留下的信息，同时使这个进程彻底消失。下面就对这两个调用分别作详细介绍。

只有注册用户登录后才能发表评论。
【推荐】100%开源！大型工业跨平台软件C++源码提供，建模，组态！

相关文章: nm命令中符号类型详解 linux 比较两个文件夹不同 (diff命令, md5列表) linux下提示/usr/lib64/libstdc++.so.6: version `GLIBCXX_3.4.14' not found 解决办法 lib lib32 lib64等lib文件夹的说明 Linux程序分析工具介绍—ldd,nm 动态库(.so)链接静态库(.a)的情况总结理清gcc、libc、libstdc++的关系 linux so 动态库中全局变量被覆盖问题 GCC的符号可见性——解决多个库同名符号冲突问题链接与自定义函数名同名的库函数

网站导航: 博客园 IT新闻 BlogJava 博问 Chat2DB 管理

Prayer

exit和_exit(Linux进程控制

日历

常用链接

留言簿(28)

随笔分类

随笔档案

文章分类

UNIX

信用卡

搜索

最新评论

阅读排行榜

评论排行榜