ARM体系架构下的同步操作

时间：11-09 来源：互联网点击：

处理器在访问共享资源时，必须对临界区进行同步，即保证同一时间内，只有一个对临界区的访问者。

当共享资源为一内存地址时，原子操作是对该类型共享资源同步访问的最佳方式。

随着应用的日益复杂和SMP的广泛使用，处理器都开始提供硬件同步原语以支持原子地更新内存地址。

CISC处理器比如IA32，可以提供单独的多种原子指令完成复杂的原子操作，由处理器保证读-修改-写回过程的原子性。

而RISC则不同，由于除Load和Store的所有操作都必须在寄存器中完成，

如何保证从装载内存地址到寄存器，到修改寄存器中的值，再到将寄存器中的值写回内存中可以原子性的完成，便成为了处理器设计的关键。

从ARMv6架构开始，ARM处理器提供了Exclusive accesses同步原语，包含两条指令：

LDREXSTREX

LDREX和STREX指令，将对一个内存地址的原子操作拆分成两个步骤，

同处理器内置的记录exclusive accesses的exclusive monitors一起，完成对内存的原子操作。

LDREX

LDREX与LDR指令类似，完成将内存中的数据加载进寄存器的操作。

与LDR指令不同的是，该指令也会同时初始化exclusive monitor来记录对该地址的同步访问。例如

LDREX R1, [R0]

会将R0寄存器中内存地址的数据，加载进R1中并更新exclusive monitor。

STREX

该指令的格式为：

STREX Rd, Rm, [Rn]

STREX会根据exclusive monitor的指示决定是否将寄存器中的值写回内存中。

如果exclusive monitor许可这次写入，则STREX会将寄存器Rm的值写回Rn所存储的内存地址中，并将Rd寄存器设置为0表示操作成功。

如果exclusive monitor禁止这次写入，则STREX指令会将Rd寄存器的值设置为1表示操作失败并放弃这次写入。

应用程序可以根据Rd中的值来判断写回是否成功。

在这篇文章里，首先会以Linux Kernel中ARM架构的原子相加操作为例，介绍这两条指令的使用方法；

之后，会介绍GCC提供的一些内置函数，这些同步函数使用这两条指令完成同步操作。

Linux Kernel中的atomic_add函数

如下是Linux Kernel中使用的atomic_add函数的定义，它实现原子的给 v 指向的atomic_t增加 i 的功能。

1 static inline void atomic_add(int i, atomic_t *v)2 {3         unsigned long tmp;4         int result;5 6         __asm__ __volatile__("@ atomic_add\n"7 "1:     ldrex   %0, [%3]\n"8 "       add     %0, %0, %4\n"9 "       strex   %1, %0, [%3]\n"10 "       teq     %1, #0\n"11 "       bne     1b"12         : "=&r" (result), "=&r" (tmp), "+Qo" (v->counter)13         : "r" (&v->counter), "Ir" (i)14         : "cc");15 }

在第7行，使用LDREX指令将v->counter所指向的内存地址的值装入寄存器中，并初始化exclusive monitor。

在第8行，将该寄存器中的值与i相加。

在第9，10，11行，使用STREX指令尝试将修改后的值存入原来的地址，

如果STREX写入%1寄存器的值为0，则认为原子更新成功，函数返回；

如果%1寄存器的值不为0，则认为exclusive monitor拒绝了本次对内存地址的访问，

则跳转回第7行重新进行以上所述的过程，直到成功将修改后的值写入内存为止。

该过程可能多次反复进行，但可以保证，在最后一次的读-修改-写回的过程中，没有其他代码访问该内存地址。

static inline void atomic_set(atomic_t *v, int i){unsigned long tmp;__asm__ __volatile__("@ atomic_set/n""1:    ldrex    %0, [%1]/n""    strex    %0, %2, [%1]/n""    teq    %0, #0/n""    bne    1b": "=&r" (tmp): "r" (&v->counter), "r" (i): "cc");}

输入为v(原子变量)，i(要设置的值)，均存放在动态分配的寄存器中。tmp用来指示操作是否成功。

GCC内置的原子操作函数

看了上面的GCC内联汇编，是不是有点晕？

在用户态下，GCC为我们提供了一系列内置函数，这些函数可以让我们既享受原子操作的好处，

又免于编写复杂的内联汇编指令。这一系列的函数均以__sync开头，分为如下几类：

type __sync_fetch_and_add (type *ptr, type value, ...)type __sync_fetch_and_sub (type *ptr, type value, ...)type __sync_fetch_and_or (type *ptr, type value, ...)type __sync_fetch_and_and (type *ptr, type value, ...)type __sync_fetch_and_xor (type *ptr, type value, ...)type __sync_fetch_and_nand (type *ptr, type value, ...)

这一系列函数完成对ptr所指向的内存地址的对应操作，并返回操作之前的值。

type __sync_add_and_fetch (type *ptr, type value, ...)type __sync_sub_and_fetch (type *ptr, type value, ...)type __sync_or_and_fetch (type *ptr, type value, ...)type __sync_and_and_fetch (type *ptr, type value, ...)type __sync_xor_and_fetch (type *ptr, type value, ...)type __sync_nand_and_fetch (type *ptr, type value, ...)

上一篇：ARM中异常模式的跳转
下一篇：ARM Linux系统中的用户栈与内核栈

ARM体系架构同步操相关文章：

栏目分类