arm 下C编程的非对齐访问
闲话少说了,先贴一个测试的代码,如果有arm开发板的同学可以拿到板子上跑一下,和在x86机器上跑出来的程序结果对比一下。
测试代码
#include#include struct test{unsigned char a;unsigned char b;unsigned char sc;unsigned char sd;};struct test bbb;int main (int argc, char argv){char *tmp=(char *)&bbb;printf("sizeof(struct test)=%d \n",sizeof(struct test));bbb.a = 0x01;bbb.b = 0x02;bbb.sc = 0x03;bbb.sd = 0x04;printf("bbb 0x%08x \n",*(unsigned long *)tmp);printf("tmp %x= 0x%04x \n",(int)tmp,*((unsigned short *)(tmp)));tmp+=1;printf("tmp+1 %x= 0x%04x \n",(int)tmp,*((unsigned short *)(tmp))); tmp+=1;printf("tmp+2 %x= 0x%04x \n",(int)tmp,*((unsigned short *)(tmp))); }
结果出乎意料(如果你不知道),竟然结果不同。
问题分析:
我们假设变量bbb在内存中是这样分布的
0x1000 | 0x01 |
0x1001 | 0x02 |
0x1002 | 0x03 |
0x1003 | 0x04 |
1、tmp开始的时候是指向0x1000的,取将tmp强制转换为unsigned short 后输出地值为0x0201,这个没问题。
2、将tmp向后移动一位到0x1001后,取将tmp强制转换为unsigned short 后输出地值,这里,在x86和arm上跑的时候,就出现了不同的值了
在x86机器上跑出来的值是0x0302,这个是我们所期望的;但是在arm上这个值是0x0201。回去了?!
与其他RISC架构一样,ARM处理器能够高效地访问对齐的数据,即字地址的末尾两位为零,半字地址的最后一位为零,也称这样的数据位于它的自然大小边界或者是自然对齐的。ARM编译器希望普通的“C”指针指向一个4字节对齐内存地址,这样它可以在代码中使用LDR/STR指令一次操作4个字节,否则只能使用LDRB/LDRH等字节/半字操作指令。相反如果指针指向一个非自然对齐的地址,例如如果一个整型指针指向地址0x8006,当然希望装载地址0x8006-0x8007-0x8008-0x8009处的数据,但是实际上ARM会对非自然对齐的地址进行转换而从装载地址 0x8004-0x8005-0x8006-0x8007处的数据。
3、如果是long型的强制转换,
long *tmp_long=(long *)tmp;
如果现在tmp指向的是0x1002,*tmp_long会是什么值呢?在x86下可能会出现段错误,因为内存越界了,如果没有的话,输出应该是0x00000403;
在arm下输出的结果是0x02010304,这个我没太想明白。我看网上有的说是循环移位的结果,这个循环移位以字节。如果是这个样子的话,那么short类型为什么不是循环移位啊?想不明白啊。
总结:
对于arm中的双字节或者4字节数据的访问,不能直接通过数据类型的强制转换来实现,必须通过单字节的方式:使用单字节赋值,或者memcpy等函数,不过这样做的时候,首先要先确定数据是大端还是小端模式。
例如上面的数据,需要取出long型,可以这样做
long tmp_long;memcpy(&tmp_long,tmp,4);
armC编程非对齐访 相关文章:
- Windows CE 进程、线程和内存管理(11-09)
- RedHatLinux新手入门教程(5)(11-12)
- uClinux介绍(11-09)
- openwebmailV1.60安装教学(11-12)
- Linux嵌入式系统开发平台选型探讨(11-09)
- Windows CE 进程、线程和内存管理(二)(11-09)