基于DBL结构的嵌入式64kb SRAM的低功耗设计

时间：10-15 来源：无忧电子开发网点击：

嵌入式存储器的容量及其在系统芯片中所占的面积越来越大，对其操作所带来的动态功耗成为系统芯片功耗中重要的组成部分，因此，必须寻求有效的低功耗设计技术，以降低嵌入式存储器对整个系统的影响。为了降低存储器的功耗，人们采用了字线分割、分级字线译码以及字线脉冲产生等技术，大大降低了存储器的动态功耗。另外一种能有效降低存储器动态功耗的技术就是位线分割(DBL)。针对系统要求，笔者采用DBL结构以及一种存储阵列分块译码结构，完成了64 kb嵌入式存储器模块的设计。

参数的修正与公式的重新推导

DBL结构的原理

　 DBL结构就是通过将两个或者多个SRAM存储单元进行合并，以减少连接到位线上的晶体管数目，从而减小位线电容，达到降低存储器动态功耗的目的。图1w给出了将4个SRAM单元连接在一起并通过传输管连接到位线上的电路示意图。与一般布局的位线结构相比，图1w所示的DBL结构中连接到位线上的传输管数目减少了3 /4。

DBL结构有两个关键:第1，确定存储阵列行数N 与合并的单元个数M 之间的最优关系。所谓最优是指合并后存储器的动态功耗最小。对于这个关系，文献[ 1 ]中给出了相应的公式:

p_nor = (1 /M + 0.1) + 2 ×( (M + 1) / (N (ΔV /V ) ) ) 　， (1)
M_{op t} = ( (N /2) ×(ΔV /V ) ) ^{1 /2} 　， (2)
式中ΔV 表示位线上电压的摆幅， V 表示电源电压。第2，确定合并后各个管子的宽长比。下面，针对这两个问题进行讨论。

DBL功耗公式的修正

公式(1) ， ( 2)是在下述假设下得出的:在SRAM中，位线的电容主要是由存储单元中传输晶体管的漏极电容和位线的金属连线电容构成，并且金属线的寄生电容是与位线相连管子漏极总电容C的10% ，则图2中寄生电容C₁ 和C₂可表示为:

C₁ = C M /N 　，　C₂= C /M + 0.1C　

然而，上述假设并没有真正反映位线电容的构成，因为位线电容的组成包括存储单元中传输晶体管的源/漏电容C_BS ，位线间的耦合电容C_BB ，位线与横向字线之间的耦合电容C_WW ，位线与地线的耦合电容C_BSS ，位线与电源线的耦合电容C_BDD ，位线的金属连线电容C_W 等。随着深亚微米技术的发展，在位线总电容中，传输晶体管的源/ 漏电容C_BS 所占的比例只有60% ～ 70% ，其他的电容分量共占30% ～40%，在这种情况下公式设计电路会带来较大的误差。另外，对C₁的舍入过大，由此也引入了很大的误差，必须进行修正。笔者对公式的重新推导如下。

假设存储阵列的行数为N， DBL 结构中合并的存储单元数为M，一般布局结构(N 行) 中，与位线相连的所有传输管漏极的总电容为C，并假定位线上其他的寄生电容是此漏极总电容的30% ，则图2中电容C₁ 和C₂ 可表示为

C₁ = C (1.3M + 1) /N 　，　C₂= (C /M ) + 0.3C　

假设读写操作时子位线不进行预充电，并且其电压值能够达到电源电压，用ΔV 表示位线上电压的摆幅，那么，图2中DBL存储器的动态功耗可表示为
p =f (M ) = (C2 ×ΔV ×V + 2 ×C1 ×V2 ) ×f = [ (C /M + 0.3 ×C) ×ΔV ×V + 2 ×C ( (1.3M + 1) /N ) ×V2 ] ×f (3)
根据标准存储单元的功耗表达式pstan = (C ×ΔV ×V ) ×f　， (4)
对式(3) 归一化得pnor = (1 /M + 0.3) + 2 ×( (1.3M + 1) / (N ×ΔV /V ) ) 　， (5)
因此可求得功耗最小时的M 值Mop t = ( (N /2. 6) ×(ΔV /V ) ) 1 /2 　。 (6)

　　如果存储阵列的行数N = 1 024，位线电压变化率ΔV /V = 011，则Mop t ≈ 6， pnor ≈ 0164。但是如果按照公式(1) ， (2) 计算，则_{Mop t} ≈ 8， p_nor ≈ 0140，后面的设计均基于修正后的公式(5) ， (6)。

管子宽长比的选择

在6管存储单元中，为了完成正常的读写操作，各个管子的宽长比必须满足一定的约束条件，这种约束条件通常用上拉比P_R 和单元比C_R 来刻画。对于图3@ 所示的存储单元，有C_R= (W_{N 2} / L_{N 2} ) / (W_{N 4} /L_{N 4} ) P_R = (W_P1 / L_P1 ) / (W_{N 3} /L_{N 3} ) 。为了完成正常的读出操作，不发生"读翻转"，要求C_R大于1.8 (V_DD = 3.3V， Vt = 0.5V) [ 7 ] ，因此N₂ 比 N₄有更好的导通性。为了完成正常的写入操作，要求P_R 小于1 (V_DD = 3.3V， V_tp = 0.5V 和μ_P / μ_N =0.5) ，也就是说， N₃应该比P₁ 有更好的导通性。在DBL结构中，如果存储单元中各个管子的W /L 与一般结构中的相同，显然，由于N4 和N6 (N3 和N5 ) 的串联等效关系，使得CR 的条件更容易满足，而PR 的条件更不容易满足，从而使写入操作变得更加困难。因此，为了完成正常的读写操作，应合理确定管子N₄ 和N₆ (N₃ 和N₅ ) 的宽长比。N4 和N6 宽长比的选择，可以通过将N₄ 和N₆ (N₃ 和N₅ ) 近似成串联电阻来估算，如图3w 所示。为了方便分析，假设N₄ 和N₆ 的结构相同。显然，为了保持原先存储单元正常的读写功能，应该将N₄ 和N₆ 的宽长比都加倍，而其他管子的宽长比保持不变。

上一篇：使用 Virtex-4 器件实现的 DDR2 的控制器
下一篇：多点温湿度测控系统设计

存储器 SRAM 位线分割分块译码相关文章：

栏目分类