进程在执行过程中,可以通过系统调用的方式创建多个新进程。Linux系统提供了两种创建进程的方式:函数fork()用来创建一个新进程,该进程几乎是当前进程的一个完全副本;函数exec()函数用来启动另外的进程以取代当前运行的进程。这里主要介绍如何利用fork()函数创建新的进程以及fork()函数的工作机制。
fork在英中有“分叉”的含义,在Linux系统中,这个名字比较形象,因为一个进程在运行中,如果使用了fork,就产生了另一个与之完全相同的进程,于是进程就“分叉”了。
fork函数原型:
pid_t fork(void);头文件: #include<unistd.h>返回值:子进程中返回0,父进程中返回子进程的ID,出错返回-1
功能:fork函数被调用一次,但返回两次。两次返回的唯一出别是child process的返回值是0,而父进程的返回值则是child process的进程ID。所以可以通过fork函数的返回值来进入父子进程独有的代码段(但是要借助ifelse(else if else )选择语句)。 注意:
己的数据段父子进程共享代码段,但是分别拥有自和堆栈段。每个进程都可以通过调用getpid()来获取自己的id,也可以调用getppid()来获取父进程的id。fork之后,操作系统会复制一个与父进程完全相同的子进程,虽说是父子关系,但是在操作系统看来,他们更像兄弟关系,这2个进程共享代码空间,但是数据空间是互相独立的,子进程数据空间中的内容是父进程的完整拷贝,指令指针也完全相同,子进程拥有父进程当前运行到的位置。至于那一个最先运行,可能与操作系统(调度算法)有关,而且这个问题在实际应用中并不重要,如果需要父子进程协同,可以通过原语的办法解决。可以先看一个简单的例子:
#include<unistd.h> #include<stdio.h> int main() { pid_t pid; int var = 0; pid = fork(); if (pid<0 ) { printf("error int fork!\n"); }else if ( pid==0) { printf("This is the child process,pid is %d.\n",getpid()); var = 100; }else { printf("This is the parent process,pid is %d.\n",getpid()); var = 50; } printf("var is %d.\n",var); return 0; }在Linux运行的结果是: This is the parent process,pid is 7052. var is 50. This is the child process,pid is 7053. var is 100.通过var的值可以看出,最后一个printf()的输出是在不同的进程中的。这里的父进程就是执行的main函数。子进程是父进程的副本,开始于fork函数。
从fork函数开始以后的代码父子共享,即父进程要执行这段代码,子进程也要执行这段代码。(子进程获得父进程数据空间,堆和栈的副本。但是父子进程并不共享这些存储空间部分。父,子进程共享代码段。)也就是说,子进程一旦开始运行,虽然它继承了父进程的一切数据(fork之前的数据父,子进程是一样的),但fork之后数据却已经分开,相互之间不再有影响了。
再看一个复杂一点的例子:
#include<unistd.h> #include<stdio.h> int main() { pid_t pid; int i = 0; int root = 0; printf("r\t i\t C/P\t ppid\t pid\n"); //pid = fork(); for (i=0; i<2; ++i) { pid = fork(); if (pid < 0 ) { printf("error int fork!\n"); }else if ( pid==0 ) { root++; printf("%d\t %d\t child\t %d\t %d\n",root ,i,getppid(),getpid()); //sleep(1); }else { //root++; printf("%d\t %d\t parent\t %d\t %d\n",root ,i,getppid(),getpid()); } } return 0; } 在Linux运行的结果是: r i C/P ppid pid 0 0 parent 31768 6236 1 0 child 6236 6237 0 1 parent 31768 6236 1 1 child 6236 6238 1 1 parent 6236 6237 2 1 child 6237 6239在上面的输出结果中,第一列表示当前进程是否为根进程,第二列表示for循环中i的值,第三列描述当前进程是父进程还是子进程,第四列表示当前进程的父进程ID,第五列表示当前进程的ID。
其执行过程大概像这样(注意图片是copy别人的,参数不一样):
因为fork()函数是在for循环里面,所以 这个程序最终产生了3个子进程,执行过6次printf()函数。
注意一般来说,在fork之后的父进程先执行还是子进程先执行是不确定的。(取决于内核的调度算法)
参考文献:
[1]. http://blog.csdn.net/jason314/article/details/5640969
[2]. http://blog.csdn.net/theone10211024/article/details/13774669
[3]. http://blog.csdn.net/yangcs2009/article/details/39267733
