franksunny的个人技术空间
获得人生中的成功需要的专注与坚持不懈多过天才与机会。 ——C.W. Wendte

由一道面试题来看 Struct 的对界

 

本文节选自宋宝华的C/C++struct深层探索一文,本人对其所描述的struct对齐比较喜欢,为此转来与大家分享,原文见http://blog.donews.com/21cnbao/archive/2005/09/08/544877.aspx

 

Intel 、微软等公司曾经出过一道类似的面试题:

1. #include <iostream.h>

2. #pragma pack(8)

3. struct example1

4. {

5.     short a;

6.     long b;

7. };

8. struct example2

9. {

10.          char c;

11.          example1 struct1;

12.          short e;

13. };

14. #pragma pack()

 

15. int main(int argc, char* argv[])

16. {

17.          example2 struct2;

18.   cout << sizeof(example1) << endl;

19.   cout << sizeof(example2) << endl;

20.   cout << (unsigned int)(&struct2.struct1) - (unsigned int)(&struct2)

<< endl;

21. return 0;

22. }

问程序的输入结果是什么?

答案是:

8

16

4

不明白?还是不明白?下面一一道来:

1 自然对界

struct 是一种复合数据类型,其构成元素既可以是基本数据类型(如 int long float 等)的变量,也可以是一些复合数据类型(如 array struct union 等)的数据单元。对于结构体,编译器会自动进行成员变量的对齐,以提高运算效率。缺省情况下,编译器为结构体的每个成员按其自然对界( natural alignment )条件分配空间。各个成员按照它们被声明的顺序在内存中顺序存储,第一个成员的地址和整个结构的地址相同。

自然对界 (natural alignment) 即默认对齐方式,是指按结构体的成员中 size 最大的成员对齐。

例如:

struct naturalalign

{

char a;

short b;

char c;

};

在上述结构体中, size 最大的是 short ,其长度为 2 字节,因而结构体中的 char 成员 a c 都以 2 为单位对齐, sizeof(naturalalign) 的结果等于 6

如果改为:

struct naturalalign

{

char a;

int b;

char c;

};

其结果显然为 12

 

2 指定对界

一般地,可以通过下面的方法来改变缺省的对界条件:

· 使用伪指令 #pragma pack (n) ,编译器将按照 n 个字节对齐;

· 使用伪指令 #pragma pack () ,取消自定义字节对齐方式。

注意:如果 #pragma pack (n) 中指定的 n 大于结构体中最大成员的 size ,则其不起作用,结构体仍然按照 size 最大的成员进行对界。

例如:

#pragma pack (n)

struct naturalalign

{

char a;

int b;

char c;

};

#pragma pack ()

n 4 8 16 时,其对齐方式均一样, sizeof(naturalalign) 的结果都等于 12 。而当 n 2 时,其发挥了作用,使得 sizeof(naturalalign) 的结果为 8

VC++ 6.0 编译器中,我们可以指定其对界方式(见图 1 ),其操作方式为依次选择 projetct > setting > C/C++ 菜单,在 struct member alignment 中指定你要的对界方式。

1  在 VC++ 6.0 中指定对界方式

另外,通过 __attribute((aligned (n))) 也可以让所作用的结构体成员对齐在 n 字节边界上,但是它较少被使用,因而不作详细讲解。

 

3   面试题的解答

至此,我们可以对 Intel 、微软的面试题进行全面的解答。

程序中第 2 #pragma pack (8) 虽然指定了对界为 8 ,但是由于 struct example1 中的成员最大 size 4 long 变量 size 4 ),故 struct example1 仍然按 4 字节对界, struct example1 size 8 ,即第 18 行的输出结果;

struct example2 中包含了 struct example1 ,其本身包含的简单数据成员的最大 size 2 short 变量 e ),但是因为其包含了 struct example1 ,而 struct example1 中的最大成员 size 4 struct example2 也应以 4 对界, #pragma pack (8) 中指定的对界对 struct example2 也不起作用,故 19 行的输出结果为 16

由于 struct example2 中的成员以 4 为单位对界,故其 char 变量 c 后应补充 3 个空,其后才是成员 struct1 的内存空间, 20 行的输出结果为 4

 

 

在阅读了此节之后,本人对为什么在使用过程中用sizeof取得的结构长度不同的问题有了认识,不过本人调试时,不光跟对界方式有关,还和设置的Processor有关,这方面还请大侠帮我指点下迷津。

    过了快一年了,回过头来再看看这篇文章发现还是有用的,另外再加上一句别人:当未用 #pragma 指令指定编译器的对齐位数时,结构体按最长宽度的数据成员的宽度对齐;当使用了#pragma 指令指定编译器的对齐位数时,结构体按最长宽度的数据成员的宽度和 #pragma 指令指定的位数中的较小值对齐。(2007年10月8日) 

posted on 2006-10-20 21:52 frank.sunny 阅读(2078) 评论(9)  编辑 收藏 引用 所属分类: C/C++学习和实践

FeedBack:
# re: 由一道面试题来看Struct的对界(再谈结构)
2006-12-22 13:32 | mumutou
错误,struct所说的对齐不是这么回事
  回复  更多评论
  
# re: 由一道面试题来看Struct的对界(再谈结构)
2006-12-22 13:34 | mumutou
char a;

int b;

char c;
按照4边界对齐,1+4+1 =6;
(6/4+1) * 4 = 8
也就是说对struct总的长度进行4边界对齐,而不是对每个struct内容4边界对齐  回复  更多评论
  
# re: 由一道面试题来看Struct的对界(再谈结构)
2006-12-26 20:59 | frank.sunny
谢谢楼上的大侠提点,在你的指点下,认真看了下对齐的东西,你说的也不是很对
上面的题按4边界对齐的话,也要考虑顺序的即 1+(3)+ 4 + 1 = 9
(9 / 4 +1) * 4 = 12
也就前一个类型根据后一个类型扩展
具体我再附上别人的源代码。

struct DATA1
{
char c1; //偏移量0,累积size = 1
char c2; //偏移量1,累积size = 1 + 1 = 2
short si; //偏移量2,累积size = 2 + 2
};

struct DATA2
{
char c1; //偏移量0,累积size = 1
short si; //偏移量1 + (1),累积size = 1 + (1) + 2 = 4
char c2; //偏移量4,累积size = 4 + 1 = 5,但按最大长度sizeof(short) = 2对齐,故最后取6
};

struct DATA3
{
char c1; //偏移量0,累积size = 1
double d; //偏移量1 + (7),累积size = 1 + (7) + 8 = 16
char c2; //偏移量16,累积size = 16 + 1 = 17,但按最大长度sizeof(double) = 8对齐,故最后取24
};

#pragma pack(push,1) //强制1字节对齐
struct DATA4
{
char c1; //偏移量0,累积size = 1
double d; //偏移量1,累积size = 1 + 8 = 9
char c2; //偏移量9,累积size = 9 + 1 = 10
};
#pragma pack(pop) //恢复默认对齐方式

struct DATA5
{
char c1;
double d;
char c2;
};

void main()
{
cout << "sizeof(DATA1) = " << sizeof(DATA1) << endl;
cout << "sizeof(DATA2) = " << sizeof(DATA2) << endl;
cout << "sizeof(DATA3) = " << sizeof(DATA3) << endl;
cout << "sizeof(DATA4) = " << sizeof(DATA4) << endl;
cout << "sizeof(DATA5) = " << sizeof(DATA5) << endl;
}  回复  更多评论
  
# re: 由一道面试题来看Struct的对界(再谈结构)
2008-07-18 11:37 | dshy
struct test {
char x1;
short x2;
float x3;
char x4;
};

sizeof(test)是多少?  回复  更多评论
  
# re: 由一道面试题来看Struct的对界(再谈结构)
2009-03-04 17:59 | JYSG3
错误,误人子弟  回复  更多评论
  
# re: 由一道面试题来看Struct的对界(再谈结构)
2009-03-18 16:12 | 撒旦
sizeof(test)是多少?
//应该是12个字节吧,1 + 2 + (1) + 4 +1 =9,因为是以4字节对起,所以应该是12字节。  回复  更多评论
  
# re: 由一道面试题来看Struct的对界(再谈结构)
2010-04-24 11:43 | 小林
您好: 我读了你的代码分析,收获颇多。也发现了一点小问题,现向你提一下。
我将你的程序在机子上运行,发现你的分析结果跟电脑显示的结果不一样。
double,long 最大长度不是按8 对齐,而是 按4对齐。
struct DATA3
{
char c1; //偏移量0,累积size = 1
double d; //偏移量1 + (3),累积size = 1 + (3) + 8 = 112
char c2; //偏移量16,累积size = 12+ 1 = 13,但按最大长度sizeof(double) = 4对齐,故最后取16
};   回复  更多评论
  
# re: 由一道面试题来看Struct的对界(再谈结构)
2011-03-16 13:53 | casper
路过,学习,有问题:
struct DATA3
{
char c1; //偏移量0,累积size = 1
double d; //偏移量1 + (7),累积size = 1 + (7) + 8 = 16
char c2; //偏移量16,累积size = 16 + 1 = 17,但按最大长度sizeof(double) = 8对齐,故最后取24
};
就拿这个来说 这个的结果应该是16

不能用单独的最长来界定

单个的元素需要在结构体内部对齐

同时最后还需要界定整个结构体的对齐问题  回复  更多评论
  
# re: 由一道面试题来看Struct的对界(再谈结构)
2011-03-16 14:03 | casper
struct DATA3{
char c1;
double d;
char c2;
};
*结构体内部 有补齐需求的只有d
sizeof(double) > 4 ---> 4
c1 block 1+(3)=4
total: 1+(3)+8+1=13
*结构体开始对齐
sizeof(double) > 4 ---> 4 4*4-3=13
c2 block 1+(3)=4
total: 1+(3)+8+1+(3)=16@casper
  回复  更多评论
  

只有注册用户登录后才能发表评论。
网站导航: 博客园   IT新闻   BlogJava   知识库   博问   管理



常用链接

留言簿(13)

随笔分类

个人其它博客

基础知识链接

最新评论

阅读排行榜

评论排行榜