转本贴请把 win_hate 的名字写上。
略谈 c 语言中指针与数组的区别
数组与指针是两个不同的概念,即使是从编译的层面上来看。不过,在很多时候,两者的用法极为相似。本文将讨论两者的区别。
一、理论分析
编译器在处理指针与数组的时候,是区别对待的。
对于指针
p 是一个变量,所以编译器要为之分配一个空间。
对于数组:
a 是一个地址,编译器会为数组 a 分配一个空间,但不会为 a 本身分配空间,在使用到a的地方,会被替换为一个地址+属性,其结果为一个"常量指针"。
在对一个指针变量进行 dereferance 的时候,比如 (*p)。编译器首先要得到 p 的地址,从中取值,然后把得到的值作为地址,再取值。类似如下汇编:
lea (p), %esi /* this is &p */
mov (%esi), %edi /* this is p */
mov (%edi), %eax /* this is p[0] */
或者,更简单的
mov (p), %esi /* this is p */
mov (%esi), %eax /* and this is p[0] */
相比之下,数组的引用
则省去了取 a 地址的过程,符号 a 代表一个地址,这个地址不存放在任何变量中!
lea (a), %esi /* this is a */
mov (%esi), %eax /* this is a[0] */
或更简单的:
mov (a), %esi /* this is a[0] */
熟悉汇编的人,容易从看出,区别是大的。
二、两个例子
第一个例子,演示 "把数组声明为指针" 是如何使程序崩溃的。
file: 1.c
int a[10]={0};
file: 2.c
int
main ()
{
extern int *a;
printf ("%d\n", a[0]);
return 0;
}
运行这个程序,Segmentation fault
在模块1.c 中, a 被定义为一个数组,但在模块 2.c中,a被声明为指针。所以编译器在处理 printf ("%d\n", a[0]) 时:
认为 a 是一个指针,所以先取其地址&a,然而,a 实际是个数组,&a 就是 a本身,所的 &a 是 a 的首地址。
然后编译器取 指针a的值,这实际上是 得到的是数组的第一个元素 a[0] ,值为0!也就是,编译器得到了一个 0 指针,最后,编译器对其derefrence,崩溃!
第二个例子演示“把指针声明为数组”如何的到错误的数据:
file: 3.c
int *pa = (int *)0;
f ()
{
printf ("%x\n", &pa);
}
file: 4.c
int
main ()
{
extern int pa[];
printf ("%p\n", pa);
printf ("%d\n", pa[0]);
f ();
return 0;
}
在这个例子中, pa 被定义为一个指针,并初始化为0, 但在另一个模块中,被声明为一个数组.
编译器在处理 printf ("%p\n", pa) 时,认为 pa 是数组,所以直接打印符号pa的值,此值为指针pa的地址!
编译器在处理 printf ("%p\n", pa[0]) 时,认为 pa 是数组,以符号 pa 对应的值加一个偏移0,并取其值,得到的实际上是 指针 pa 的值 即 0.
三、总结
我罗罗嗦嗦地讲了半天,如果还不清楚,请研究一下我给出的代码。
[参考文献]
[1] Peter Van Der Linden, <<Expert C Programming --- Deep C Secrets>;>;