高效的C编程之：浮点运算

时间：08-30 来源：3721RD 点击：

14.10 浮点运算

大多数的ARM处理器硬件上并不支持浮点运算。但ARM上提供了以下几个选项来实现浮点运算。

· 浮点累加协处理器FPA（Floating-Point Accelerator）：ARM上提供了一组协处理器指令专门实现浮点运算。但这需要硬件支持，具体某一处理器上是否有FPA协处理器支持，可以查看ARM相关手册。

· 浮点运算仿真（FPE）：使用软件仿真了FPA协处理器的执行。

· 浮点运算库（FPLib）：使用ARM的浮点运算库函数实现程序中的浮点运算操作。这就意味着C编译器要把每一个浮点操作转换成一个子程序调用。C库中的子函数使用整型运算来模拟浮点操作。这些代码是用高效的汇编语言编写而成的。尽管如此，浮点运算执行起来还是要比相应整型运算慢得多。

注意

Thumb指令不支持协处理器指令，所以在Thumb状态下实现浮点运算，只能调用ARM浮点运算库。

为了在ARM上高效地实现浮点运算，请遵循以下规则。

· 避免使用浮点除法运算。通常情况下，除法运算的执行速度是普通加法或乘法运算速度的1/2。在无法避免除法的情况下，尽量使除法的除数为常数。如，x=x/3.0，可将其变为x = x * (1.0/3.0)。这样除数为常数（1.0/3.0），该值在编译阶段由编译器计算。

· 使用float型代替double型。float型要比double使用更少的内存和寄存器。

· 避免使用三角函数功能。实现三角函数功能，如sin、cos，使用了大量的乘加运算，它的运算速度大约是普通乘法运算的十倍。

· 当编译器处理浮点运算操作时，由于精度的影响很多优化不能实现。比如，表达式3 * (x / 3)，编译器不能判断其值和x是等价的。所以在使用浮点运算表达式时，最好先人工的做一些必要的优化。

栏目分类

高效的C编程之： 浮点运算