微波EDA网,见证研发工程师的成长!
首页 > 硬件设计 > 嵌入式设计 > 高效的C编程之:C编译器及其优化

高效的C编程之:C编译器及其优化

时间:08-30 来源:3721RD 点击:

:产生的代码比使用-O2 -Ospace选项产生的代码尺寸小,但执行效率可能会差。

如果要使编译的代码更侧重于代码的尺寸或执行效率(两者往往不可兼得),可以使用下面的编译选项。

· -Ospace:指示编译程序执行优化,以延长执行时间为代价减小映像大小。例如,由外部函数调用代替内联函数。如果代码大小比性能更重要,则使用该选项。这是编译器的默认设置。

· -Otime:指示编译程序执行优化,以增大映像大小为代价缩短执行时间。如果执行时间比代码大小更重要,则使用该选项。例如,它编译:

while (expression) body;

为:

if (expression) {

do body;

while (expression);

}

如果既不指定-Otime也不指定-Ospace,则编译器默认使用-Ospace。可使用-Otime编译代码中对时间要求严格的部分,使用-Ospace编译其余部分。但不能在同一编译程序调用中同时指定-Otime和-Ospace。

14.1.4 AAPCS选项

ARM结构过程调用标准AAPCS(Procedure Call Standard for the ARM Architecture)是ARM体系结构二进制接口ABI(Application Binary Interface for the ARM Architecture【BSABI】)标准的一部分。使用该标准可以很方便的执行C和汇编语言的相互调用。

编译程序时,使用--apcs选项可以指定所使用得AAPCS标准的版本。如果没有指定--apcs或--cpu选项,则编译器使用下面默认编译选项。

--apcs /noswst/nointer/noropi/norwpi --cpu ARM7TDMI --fpu softvfp

有关AAPCS的详细信息,请参加ARM相关文档。

14.1.5 编译选项对代码生成影响示例

本节举例说明编译器的优化选项如何影响代码生成。

1.使用-O0选项

下面的例子显示了即使使用-O0编译选项对代码进行编译时,有些冗余代码还是会被编译器自动清除。

int f(int *p)

{

return (*p = = *p);

}

使用armcc -c -O0对源程序进行编译,生成的汇编代码如下所示。

f

MOV r1, r0

MOV r0, #1

MOV pc, lr

通过上面的例子可以看到,编译出的最终代码中没有加载(Load)指针P的值,变量*p被编译器优化掉了。如果不想让编译器对变量*p做优化,可以使用"volatile"对变量进行声明。下面的例子,显示了将变量声明为"volatile"类型后,使用armcc编译(-O2的优化级别)后的结果。

f

LDR r1,[r0]

LDR r0,[r0]

CMP r1,r0

MOVNE r0,#0

MOVEQ r0,#1

MOV pc,lr

另外,编译的代码中的"MOV r1, r0"并没有实际意义,只是为了方便调试程序时设置断点使用。

2.冗余代码的清除

下面例子显示了一段急待优化的代码。

int dummy()

{

int a=10, b=20;

int c;

c=a+b;

return 0;

}

当使用arm –c –O0进行编译时,产生的汇编码如下所示。

dummy:

0000807C E3A0100A MOV r1,#0xa

>>> REDUNDANT\#3 int a=10,b=20;

00008080 E3A02014 MOV r2,#0x14

>>> REDUNDANT\#5 c=a+b;

00008084 E0813002 ADD r3,r1,r2

>>> REDUNDANT\#6 return 0;

00008088 E3A00000 MOV r0,#0

>>> REDUNDANT\#7 }

0000808C E12FFF1E BX r14

从上面的汇编输出可以看到,编译器并没有对程序中的冗余变量做任何工作。但上面这段代码在编译时,编译器会给出警告,警告信息如下所示。

Warning : #550-D: variable "c" was set but never used

Redundant.c line 4 int c;

但如果将编译器的优化级别提高,如使用arm –c –O1命令,则编译器输出的汇编代码如下所示。

dummy:

0000807C E3A00000 MOV r0,#0

>>> REDUNDANT\#7 }

00008080 E12FFF1E BX r14

从上面的例子看出,当优化级别提高到-O1时,程序中的冗余变量就会被清除。

3.指令重排

当指定编译器对程序代码进行优化时,编译器会对程序中排列不合理的汇编指令序列进行重排(只有在-O1及其以上的优化级别中才有),重排的目的是为了减少指令互锁(interload)。所谓互锁就是指如果一条指令需要前一条指令的执行结果,而这时结果还没有出来,那么处理器就会等待。这被称为流水线冒险(pipeline hazard),也被称为流水线互锁。

下面例子显示了对同一程序使用代码重排和不使用代码重排所产生的汇编码的区别。÷

程序的源代码如下所示。

int f(int *p, int x)

{ return *p + x * 3; }

使用-O0选项对代码进行编译(无代码重排),产生的结果如下所示。

ADD r1,r1,r1,LSL #1

LDR r0,[r0,#0]

ADD r0,r0,r1 ; ARM9上产生互锁

MOV pc,lr

使用-O1选项对代码进行编译(存

Copyright © 2017-2020 微波EDA网 版权所有

网站地图

Top