微波EDA网,见证研发工程师的成长!
首页 > 硬件设计 > 嵌入式设计 > Thumb指令集之: Thumb指令的特点及实现

Thumb指令集之: Thumb指令的特点及实现

时间:08-30 来源:3721RD 点击:

在ARM体系结构中,ARM指令集中的指令是32位指令,其执行效率很高。对于存储系统数据总线为16位的应用系统,ARM体系提供了Thumb指令集。Thumb指令集是ARM指令集的一个子集,它比ARM指令集有更高的代码密度(一个可执行的程序在内存中所占的空间)。在存储系统受限的嵌入式系统中,比如移动电话、PDA等,代码密度是非常重要的,同时,成本压力也会限制存储器的大小、数据宽度和速度。在ARM体系的T变种(T variable)的版本中,同时支持ARM指令集和Thumb指令集,而且遵循一定的调用规则时,Thumb子程序和ARM子程序可以相互调用。

11.1 Thumb指令的特点及实现

Thumb指令集把32位ARM指令集的一个子集编码为一个16位的指令集。在16位外部数据总线宽度下,ARM处理器上使用Thumb指令的性能要比使用ARM指令的性能更好;而在32位外部数据总线宽度下,使用Thumb指令的性能要比使用ARM指令的性能差。因此,Thumb指令多用于存储器受限的一些系统中。Thumb指令集并没有改变ARM系统底层的程序设计模型,只是在该模型上增加了一些限制条件。Thumb指令集中的数据处理指令的操作数仍然是32位,指令寻址地址也是32位的。

代码密度是Thumb指令集的一个主要优势。平均而言,对于同一个程序,使用Thumb指令实现所需的存储空间,要比等效的ARM指令实现少30%左右。下面的例子代码,使用ARM指令和Thumb指令实现相同的除法操作。从例子中可以看出,虽然Thumb指令的实现使用了更多的指令,但是它占用的总的存储空间却比较小。

【例11.1】使用ARM指令实现除法运算

MOV r3,#0

loop

SUB r0,r0,r1

ADDGE r3,r3,#1

BGE loop

ADD r2,r0,r1

【例11.1】中r0为被除数,r1存放除数,r2和r3分别存放余数和商。完成整个除法运算使用了5条指令,每一条指令所占的字节数为4,所以实现一个除法运算,ARM指令所占有的字节数为20。

【例11.2】使用Thumb指令实现除法运算

MOV r3,#0

loop

ADD r3,#1

SUB r0,r1

BGE loop

SUB r3,#1

ADD r2,r0,r1

【例11.2】使用Thumb指令完成了和【例11.1】完全相同的功能。Thumb指令虽然使用了6条指令,但其每条指令占用2个字节,所以总的字节数为6×2=12,小于ARM指令所占用的20个字节。

Thumb指令是ARM指令的一个受限子集,在Thumb状态下,不能直接访问所有的处理器寄存器,只有r0~r7是可以被任意访问的,在Thumb状态下使用该8个寄存器和在ARM状态下使用没有区别。寄存器r8~r12只能通过MOV、ADD或CMP指令访问。CMP指令和所有操作r0~r7的数据处理指令都会影响CPSR中的条件标志位。一些Thumb指令还使用到了程序计数器PC(r15),链接地址寄存器LR(r14)和堆栈指针寄存器SP(r13)。在Thumb状态下,读取r15寄存器时,bit[0]值为0,bit [31∶1]包含了PC的值。当对r15进行写入时,bit[0]被忽略,bit[31∶1]被设置成当前程序计数器的值。

表11.1列出了Thumb状态下,各寄存器的使用情况。

表11.1 Thumb寄存器的使用

寄 存 器

访 问

r0~r7

完全访问

r8~r12

只能通过MOV、ADD及CMP访问

r13

限制访问

r14

限制访问

r15

限制访问

CPSR

间接访问

SPSR

不能访问

从表11.1可以看出,Thumb状态下不能直接访问CPSR和SPSR。也就是没有和MSR和MRS等价的指令。为了改变CPSR和SPSR的值,必须使处理器状态切换到ARM状态,再使用指令MSR和MRS来实现。同样,在Thumb状态下也没有协处理器访问指令,要访问协处理器寄存器来配置cache和进行内存管理,也必须使处理器切换到ARM状态。

注意

Thumb状态下,对CPSR的条件标准位控制由算术和逻辑操作设置并控制条件转移。

Copyright © 2017-2020 微波EDA网 版权所有

网站地图

Top