高效的C编程之: 函数调用
保存/恢复寄存器的操作,因此执行效率比一般函数要高。
当函数中必须对一些寄存器进行保存时,可以使用高效率的多寄存器存储指令STM,对需要保存的寄存器内存一次性存储。
正是由于叶子函数执行的高效性,所以在编程时,尽量将子程序编写为叶子函数,这样即使程序中多次调用也不会影响代码性能。
为了高效的调用函数,可以遵循下面函数调用原则。
· 避免在被频繁调用的函数中调用其他函数,以保证被频繁调用的函数被编译器编译为叶子函数。
· 把比较小的被调用函数和调用函数放在同一个源文件中,并且要先定义后调用,编译器就可以优化函数调用或内联较小的函数。
· 对性能影响较大的重要函数可使用关键字_inline进行内联。
14.9.4 嵌套优化
| 注意 | 嵌套优化(Tail-Call optimization)只适用于armcc。编译时如果使用-g或-debug选项,编译器自动关闭该功能。 |
一个函数如果在其结束时调用了另一个函数,则编译器使用B指令调转到被调用函数,而非BL指令。这样就避免了一级不必要的函数返回。图14.3显示了嵌套优化的调用过程。
图14.3 嵌套优化函数调用过程
当编译时使用-O1或-O2选项时,编译器都执行这种嵌套优化。需要注意的是,当函数中引用了局部变量地址,由于指针别名问题的影响,即使函数在返回时调用了其他函数,编译器也不会使用嵌套优化。
下面通过一个例子来分析嵌套优化是如何提高代码执行效率的。
extern int func2(int);
int func1 (int a, int b)
{ if (a > b)
return (func2(a - b));
else
return (func2(b - a));
}
编译后的代码如下所示。
func1
CMP a1,a2
SUBLE a1,a2,a1
SUBGT a1,a1,a2
B func2
首先,func1中使用B指令代替BL指令,不用担心lr寄存器被破坏,减少了对寄存器压栈保护操作。另外,程序直接从func2返回到调用func1的函数,减少一次函数返回。如果说正常的指令调用过程为:
BL + BL+ MOV pc,lr + MOV pc,lr
那么经过嵌套优化的函数调用过程就可以表示为:
BL + BL+ MOV pc,lr
这样,总的开销将减少25%。
14.9.5 单纯子函数
所谓单纯子函数(Pure Functions)是指那些函数返回值只和调用参数有关。换句话说,就是如果调用函数的参数相同,那么函数的返回结果也相同。如果程序中存在这样的函数,可以在函数定义时使用_pure进行声明,这样在程序编译时编译器会根据函数的调用情况对其进行优化。
下面的例子显示了当函数用_pure声明时,编译器对其所做的优化。
程序源码文件如下。
int square(int x)
{
return x * x;
}
int f(int n)
{
return square(n) + square(n)
}
编译后的结果如下。
square
MOV a2,a1
MUL a1,a2,a2
MOV pc,lr
f
STMDB sp!,{lr}
MOV a3,a1
BL square
MOV a4,a1
MOV a1,a3
BL square
ADD a1,a4,a1
LDMIA sp!,{pc}
上面的程序中,square函数为"单纯子函数",当使用_pure声明该函数时编译器在调用该函数时,将对程序进行优化。
声明的方法和编译后的结果如下所示。
__pure int square(int x)
{
return x * x;
}
f
STMDB sp!,{lr}
BL square
MOV a1,a1,LSL #1
LDMIA sp!,{pc}
从编译后的代码中可以看到,用_pure声明的函数在f函数中只调用了一次。
虽然"单纯子函数"可以提高代码执行效率,但同时也会带来一些负面影响。比如,在"单纯子函数"中,不能直接或间接访问内存地址。所以在程序中使用"单纯子函数"时要特别小心。
另外,还可以使用#pragma声明"单纯子函数",下面的代码显示了它的声明过程。
#pragma no_side_effects
/* function definition */
#pragma side_effects
14.9.6 内嵌函数
ARM编译器支持函数内嵌功能。使用关键字"_inline"声明函数,可以使函数内嵌。下面的例子显示了如何使用函数内嵌功能。
程序源文件如下。
__inline int square(int x)
{
return x * x;
}
#include <math.h>
double length(int x, int y)
{
return sqrt(square(x) + square(y));
}
编译结果如下所示。
length
STMDB sp!,{lr}
MUL a3,a1,a1
MLA a1,a2,a2,a3
C编程 函数调用 ARM __value_in_regs 相关文章:
- Linux下C编程基础之:常用编辑器(08-13)
- Linux下C编程基础之:gcc编译器(08-13)
- Linux下C编程基础之:gdb调试器(08-13)
- Linux下C编程基础之:make工程管理器(08-13)
- Linux下C编程基础之:使用autotools(08-13)
- Linux下C编程基础之:实验内容(08-13)