Posted on 2012-10-15 11:18
鑫龙 阅读(179)
评论(0) 编辑 收藏 引用 所属分类:
linux内核
今天看到写时拷贝这个概念,当时一下没有理解,后来查看一些网上的资料,找到了这篇文章,里面的那份个小程序能够很好的说明进程创建写时拷贝的概念。怕以后找不到就转载了。嘿嘿。下面是那篇文章的原文:Linux进程创建,子进程对 父进程资源“写时拷贝”的证明 传统的fork()系统调用直接把所有的资源复制给新创建的进程。这种实现过于简单并且效率低下,因为它拷贝的数据或许可以共享(This approach is significantly na?ve and inefficient in that it copies much data that might otherwise be shared.)。更糟糕的是,如果新进程打算立即执行一个新的映像,那么所有的拷贝都将前功尽弃。 Linux的fork()使用写时拷贝 (copy- on-write)页实现。写时拷贝是一种可以推迟甚至避免拷贝数据的技术。内核此 时并不复制整个进程的地址空间,而是让父子进程共享同一个地址空间。只用在需要写入的时候才会复制地址空间,从而使各个进行拥有各自的地址空间。也就是 说,资源的复制是在需要写入的时候才会进行,在此之前,只有以只读方式共享。这种技术使地址空间上的页的拷贝被推迟到实际发生写入的时候。在页根本不会被 写入的情况下---例如,fork()后立即执行exec(),地址空间就无需被复制了。fork()的实际开销就是复制父进程的页表以及给子进程创建一 个进程描述符。下列程序可证明写时拷贝:
#include <stdio.h>#include <sched.h>int data = 10;int child_process(){ printf("Child process %d, data %dn",getpid(),data); data = 20; printf("Child process %d, data %dn",getpid(),data); while(1);}int main(int argc, char* argv[]){ if(fork()==0) { child_process(); }else{ sleep(1); printf("Parent process %d, data %dn",getpid(), data); while(1); }}运行结果Child process 6427, data 10Child process 6427, data 20Parent process 6426, data 10 第1个Child process 6427, data 10是因为子进程创建时task_struct的mm直接拷贝自parent的mm;第2个Child process 6427, data 20是因为子进程进行了“写时拷贝”,有了自己的dataa;第3个Parent process 6426, data 10输出10是因为子进程的data和父进程的data不是同一份。
如果把上述程序改为:
#include <stdio.h> #include <sched.h> #include <stdlib.h>
int data = 10;
int child_process() { printf("Child process %d, data %dn",getpid(),data); data = 20; printf("Child process %d, data %dn",getpid(),data); while(1); }
int main(int argc, char* argv[]) { void **child_stack; child_stack = (void **) malloc(16384); clone(child_process, child_stack, CLONE_VM|CLONE_FILES|CLONE_SIGHAND, NULL);
sleep(1); printf("Parent process %d, data %dn",getpid(), data); while(1); }
|
运行结果将是Child process 6443, data 10 Child process 6443, data 20 Parent process 6442, data 20
|
由于使用了CLONE_VM创建进程,子进程的mm实际直接指向父进程的mm,所以data是同一份。改变父子进程的data都会互相看到。