数组与指针熟练c/c++ (七)

刚看了expert C中对数组和指针的诠释，觉得很讲的很精彩，尤其对这种情况引起的错误记忆犹新：
file: 1.c
int a[10]={0};

file: 2.c
int
main ()
{
extern int *a;

printf ("%d\n", a[0]);
return 0;
}

但是当我运行程序在VC6上时，发现这个程序Link时会报错，那是不是编译器更新了呢？
由此转一篇文章诠释数组和指针的，作者win_hate , http://bbs.chinaunix.net/viewthread.php?tid=239405

转本贴请把 win_hate 的名字写上。

略谈 c 语言中指针与数组的区别

数组与指针是两个不同的概念，即使是从编译的层面上来看。不过，在很多时候，两者的用法极为相似。本文将讨论两者的区别。

一、理论分析

编译器在处理指针与数组的时候，是区别对待的。

对于指针

[Copy to clipboard] [ - ]

CODE:

int *p;

p 是一个变量，所以编译器要为之分配一个空间。

[Copy to clipboard] [ - ]

CODE:

.comm p, 4

对于数组：

[Copy to clipboard] [ - ]

CODE:

int a[10]

a 是一个地址，编译器会为数组 a 分配一个空间，但不会为 a 本身分配空间，在使用到a的地方，会被替换为一个地址+属性，其结果为一个"常量指针"。

[Copy to clipboard] [ - ]

CODE:

.comm a, 40

在对一个指针变量进行 dereferance 的时候，比如 (*p)。编译器首先要得到 p 的地址，从中取值，然后把得到的值作为地址，再取值。类似如下汇编：

[Copy to clipboard] [ - ]

CODE:

lea (p), %esi /* this is &p */
mov (%esi), %edi /* this is p */
mov (%edi), %eax /* this is p[0] */

或者，更简单的

mov (p), %esi /* this is p */
mov (%esi), %eax /* and this is p[0] */

相比之下，数组的引用

[Copy to clipboard] [ - ]

CODE:

int a[10];
a[0];

则省去了取 a 地址的过程，符号 a 代表一个地址，这个地址不存放在任何变量中！

[Copy to clipboard] [ - ]

CODE:

lea (a), %esi                   /* this is a */
mov (%esi), %eax    /* this is a[0] */

或更简单的：

mov (a), %esi                /* this is a[0] */

熟悉汇编的人，容易从看出，区别是大的。

二、两个例子
第一个例子，演示 "把数组声明为指针" 是如何使程序崩溃的。

[Copy to clipboard] [ - ]

CODE:

file: 1.c
int a[10]={0};

file: 2.c
int
main ()
{
extern int *a;

printf ("%d\n", a[0]);
return 0;
}

运行这个程序，Segmentation fault

在模块1.c 中， a 被定义为一个数组，但在模块 2.c中，a被声明为指针。所以编译器在处理 printf ("%d\n", a[0]) 时:
认为 a 是一个指针，所以先取其地址&a，然而，a 实际是个数组，&a 就是 a本身，所的 &a 是 a 的首地址。
然后编译器取指针a的值，这实际上是得到的是数组的第一个元素 a[0] ，值为0！也就是，编译器得到了一个 0 指针，最后，编译器对其derefrence，崩溃！

第二个例子演示“把指针声明为数组”如何的到错误的数据:

[Copy to clipboard] [ - ]

CODE:

file: 3.c
int *pa = (int *)0;

f ()
{
printf ("%x\n", &pa);
}

file: 4.c
int
main ()
{
extern int pa[];
printf ("%p\n", pa);
printf ("%d\n", pa[0]);
f ();

return 0;
}

[Copy to clipboard] [ - ]

CODE:

0x403010
0
403010

在这个例子中， pa 被定义为一个指针，并初始化为0, 但在另一个模块中，被声明为一个数组.
编译器在处理 printf ("%p\n", pa) 时，认为 pa 是数组，所以直接打印符号pa的值，此值为指针pa的地址！

编译器在处理 printf ("%p\n", pa[0]) 时，认为 pa 是数组，以符号 pa 对应的值加一个偏移0，并取其值，得到的实际上是指针 pa 的值即 0.

三、总结

我罗罗嗦嗦地讲了半天，如果还不清楚，请研究一下我给出的代码。

[参考文献]
[1] Peter Van Der Linden， <<Expert C Programming --- Deep C Secrets>;>;

posted on 2009-03-29 19:17 攀升阅读(2072) 评论(0) 编辑收藏引用

只有注册用户登录后才能发表评论。
【推荐】100%开源！大型工业跨平台软件C++源码提供，建模，组态！



网站导航: 博客园 IT新闻 BlogJava 博问 Chat2DB 管理

攀升·Uranus