微波EDA网,见证研发工程师的成长!
首页 > 硬件设计 > 嵌入式设计 > 高效的C编程之: 函数调用

高效的C编程之: 函数调用

时间:08-30 来源:3721RD 点击:

保存/恢复寄存器的操作,因此执行效率比一般函数要高。

当函数中必须对一些寄存器进行保存时,可以使用高效率的多寄存器存储指令STM,对需要保存的寄存器内存一次性存储。

正是由于叶子函数执行的高效性,所以在编程时,尽量将子程序编写为叶子函数,这样即使程序中多次调用也不会影响代码性能。

为了高效的调用函数,可以遵循下面函数调用原则。

· 避免在被频繁调用的函数中调用其他函数,以保证被频繁调用的函数被编译器编译为叶子函数。

· 把比较小的被调用函数和调用函数放在同一个源文件中,并且要先定义后调用,编译器就可以优化函数调用或内联较小的函数。

· 对性能影响较大的重要函数可使用关键字_inline进行内联。

14.9.4 嵌套优化

注意

嵌套优化(Tail-Call optimization)只适用于armcc。编译时如果使用-g或-debug选项,编译器自动关闭该功能。

一个函数如果在其结束时调用了另一个函数,则编译器使用B指令调转到被调用函数,而非BL指令。这样就避免了一级不必要的函数返回。图14.3显示了嵌套优化的调用过程。

图14.3 嵌套优化函数调用过程

当编译时使用-O1或-O2选项时,编译器都执行这种嵌套优化。需要注意的是,当函数中引用了局部变量地址,由于指针别名问题的影响,即使函数在返回时调用了其他函数,编译器也不会使用嵌套优化。

下面通过一个例子来分析嵌套优化是如何提高代码执行效率的。

extern int func2(int);

int func1 (int a, int b)

{ if (a > b)

return (func2(a - b));

else

return (func2(b - a));

}

编译后的代码如下所示。

func1

CMP a1,a2

SUBLE a1,a2,a1

SUBGT a1,a1,a2

B func2

首先,func1中使用B指令代替BL指令,不用担心lr寄存器被破坏,减少了对寄存器压栈保护操作。另外,程序直接从func2返回到调用func1的函数,减少一次函数返回。如果说正常的指令调用过程为:

BL + BL+ MOV pc,lr + MOV pc,lr

那么经过嵌套优化的函数调用过程就可以表示为:

BL + BL+ MOV pc,lr

这样,总的开销将减少25%。

14.9.5 单纯子函数

所谓单纯子函数(Pure Functions)是指那些函数返回值只和调用参数有关。换句话说,就是如果调用函数的参数相同,那么函数的返回结果也相同。如果程序中存在这样的函数,可以在函数定义时使用_pure进行声明,这样在程序编译时编译器会根据函数的调用情况对其进行优化。

下面的例子显示了当函数用_pure声明时,编译器对其所做的优化。

程序源码文件如下。

int square(int x)

{

return x * x;

}

int f(int n)

{

return square(n) + square(n)

}

编译后的结果如下。

square

MOV a2,a1

MUL a1,a2,a2

MOV pc,lr

f

STMDB sp!,{lr}

MOV a3,a1

BL square

MOV a4,a1

MOV a1,a3

BL square

ADD a1,a4,a1

LDMIA sp!,{pc}

上面的程序中,square函数为"单纯子函数",当使用_pure声明该函数时编译器在调用该函数时,将对程序进行优化。

声明的方法和编译后的结果如下所示。

__pure int square(int x)

{

return x * x;

}

f

STMDB sp!,{lr}

BL square

MOV a1,a1,LSL #1

LDMIA sp!,{pc}

从编译后的代码中可以看到,用_pure声明的函数在f函数中只调用了一次。

虽然"单纯子函数"可以提高代码执行效率,但同时也会带来一些负面影响。比如,在"单纯子函数"中,不能直接或间接访问内存地址。所以在程序中使用"单纯子函数"时要特别小心。

另外,还可以使用#pragma声明"单纯子函数",下面的代码显示了它的声明过程。

#pragma no_side_effects

/* function definition */

#pragma side_effects

14.9.6 内嵌函数

ARM编译器支持函数内嵌功能。使用关键字"_inline"声明函数,可以使函数内嵌。下面的例子显示了如何使用函数内嵌功能。

程序源文件如下。

__inline int square(int x)

{

return x * x;

}

#include <math.h>

double length(int x, int y)

{

return sqrt(square(x) + square(y));

}

编译结果如下所示。

length

STMDB sp!,{lr}

MUL a3,a1,a1

MLA a1,a2,a2,a3

Copyright © 2017-2020 微波EDA网 版权所有

网站地图

Top