posts - 200, comments - 8, trackbacks - 0, articles - 0
今天看到写时拷贝这个概念,当时一下没有理解,后来查看一些网上的资料,找到了这篇文章,里面的那份个小程序能够很好的说明进程创建写时拷贝的概念。怕以后找不到就转载了。嘿嘿。
下面是那篇文章的原文:

Linux进程创建,子进程对 父进程资源“写时拷贝”的证明     传统的fork()系统调用直接把所有的资源复制给新创建的进程。这种实现过于简单并且效率低下,因为它拷贝的数据或许可以共享(This approach is significantly na?ve and inefficient in that it copies much data that might otherwise be shared.)。更糟糕的是,如果新进程打算立即执行一个新的映像,那么所有的拷贝都将前功尽弃。
    Linux的fork()使用写时拷贝 (copy- on-write)页实现。写时拷贝是一种可以推迟甚至避免拷贝数据的技术。内核此 时并不复制整个进程的地址空间,而是让父子进程共享同一个地址空间。只用在需要写入的时候才会复制地址空间,从而使各个进行拥有各自的地址空间。也就是 说,资源的复制是在需要写入的时候才会进行,在此之前,只有以只读方式共享。这种技术使地址空间上的页的拷贝被推迟到实际发生写入的时候。在页根本不会被 写入的情况下---例如,fork()后立即执行exec(),地址空间就无需被复制了。fork()的实际开销就是复制父进程的页表以及给子进程创建一 个进程描述符。下列程序可证明写时拷贝:

#include <stdio.h>

#include <sched.h>

int data = 10;

int child_process()
{
    printf("Child process %d, data %dn",getpid(),data);
    data = 20;
    printf("Child process %d, data %dn",getpid(),data);
    while(1);
}

int main(int argc, char* argv[])
{
    if(fork()==0) {
      child_process();    
    }else{
        sleep(1);
        printf("Parent process %d, data %dn",getpid(), data);
        while(1);
    }
}
运行结果
Child process 6427, data 10
Child process 6427, data 20
Parent process 6426, data 10 

    第1个Child process 6427, data 10是因为子进程创建时task_struct的mm直接拷贝自parent的mm;第2个Child process 6427, data 20是因为子进程进行了“写时拷贝”,有了自己的dataa;第3个Parent process 6426, data 10输出10是因为子进程的data和父进程的data不是同一份。
    如果把上述程序改为:

#include <stdio.h>
#include <sched.h>
#include <stdlib.h>

int data = 10;

int child_process()
{
    printf("Child process %d, data %dn",getpid(),data);
    data = 20;
    printf("Child process %d, data %dn",getpid(),data);
    while(1);
}

int main(int argc, char* argv[])
{
    void **child_stack;
    child_stack = (void **) malloc(16384);
    clone(child_process, child_stack, CLONE_VM|CLONE_FILES|CLONE_SIGHAND, NULL);

    sleep(1);
    printf("Parent process %d, data %dn",getpid(), data);
    while(1);
}

运行结果将是
Child process 6443, data 10
Child process 6443, data 20
Parent process 6442, data 20

    由于使用了CLONE_VM创建进程,子进程的mm实际直接指向父进程的mm,所以data是同一份。改变父子进程的data都会互相看到。 

只有注册用户登录后才能发表评论。
网站导航: 博客园   IT新闻   BlogJava   知识库   博问   管理