微波EDA网,见证研发工程师的成长!
首页 > 硬件设计 > 嵌入式设计 > 新一代多核媒体处理器优化高清视频应用

新一代多核媒体处理器优化高清视频应用

时间:02-16 来源:互联网 点击:

2010年一季度,LSI发布了新一代多核媒体处理器或基带处理器:StarPro2704和StarPro2716(简称SP27xx)。LSI上一代多核媒体处理器StarPro2603和StarPro2612(简称SP26xx)已经在2G无线基带及语音媒体网关上成功应用。SP27xx相比SP26xx,在媒体和基带算法处理能力上有至少2倍的增强,同时在降低功耗方面加入了很多先进技术。针对运营商级和中小企业级的3G/4G无线基站、更高密度的语音媒体网关以及高清视频服务器等方面的应用,SP27xx均能提供业界领先的高性能低功耗的解决方案。本文首先介绍SP27xx的新特性,然后着重分析SP27xx在高清视频领域的应用。

SP27xx体系结构

SP2716是通过MCM多芯片封装工艺将4个SP2704的裸片封装成一个芯片,其处理能力是SP2704的4倍。相对于4个SP2704,SP2716大大放宽了对单板尺寸的限制,这使得用户能够更方便地扩展高端音视频业务。下文重点介绍SP2704的体系结构。

SP2704继承了SP2603的体系构架,由2个基本模块组成:媒体处理模块(MPB)和包处理模块(PPB)。媒体处理模块主要由4个SC3400e的DSP子系统组成,而包处理模块的核心是ARM11双核处理器系统。在这种单芯片DSP+ARM的多核处理器结构中,数据面和控制面分别由DSP和ARM来处理,使得DSP可以最大程度地利用其运算优势,同时不需要额外使用片外处理器来处理应用程协议,是最高效的音视频媒体网关结构。

SP2704拥有超大的片内内存,对于高密度语音网关和非高清视频应用,一般不需要使用片外存储区,这就最大程度地降低了成本和单板总功耗,减少了软硬件设计复杂度,也放宽了单板尺寸的限制。此外,SP27xx采用了业界领先的40nm芯片工艺,还引入了许多先进的低功耗技术。以语音网关应用为例,SP27xx的每通道功耗远远低于业界其他同类芯片。

1)DSP子系统(DSS)

SP2704有4个频率为750MHz的StarCore SC3400eDSP子系统(DSS)。相对上一代芯片SP2603,如果不考虑DSP内核能力的增强,SP2704的DSP处理能力可达SP2603的两倍。每个DSS还包含内存保护单元(MPU),256KB本地零等待RAM,32KB一级指令高速缓存,32KB一级数据高速缓存,512KB L2高速缓存,两个专用的2通道DMA控制器。

2)包处理模块(PPB)

包处理模块(PPB)是基于双核ARM11 MP的子系统,工作频率仅为DSS工作频率的一半。PPB主要负责整个芯片加载和管理(包括ARM和DSP),以及输入输出数据包的管理。PPB还包括:ROM用于存放ARM Boot代码,以及SPI/SSP、UART、NAND flash控制器接口,可为客户提供多种Boot方式。

3)丰富的片内内存和2个超高带宽总线

SP2704中有2个超高带宽总线矩阵:DSP总线矩阵和PPB总线矩阵,可用作数据处理功能模块的系统互连,以1/2DSP子系统时钟速率运行,带宽分别是128位和64位。SP2704拥有丰富的片内内存,除了DSP和ARM子系统内部的零等待RAM,还有一个6M的片内系统共享内存。共享内存分成12个存储块,不同的内核可以同时访问不同的存储块,真正达到了数据访问的高吞吐量、高可用性以及低时延。

4) 丰富的接口资源

SP2704拥有丰富的接口资源,可以满足各种音视频网关服务器应用:两个10/100/1000/2500Mbps以太网MAC,可配置为FE(SS-SMII)或GE(SGMII);TDM处理模块通过6个串行端口进行TDM流量的多路复用和解多路复用;10Gbps x4 SRIO接口(4个3.125Gbps Lane)或者配置为两个独立的x1SRIO接口;PCIe接口,可接到host或SP2704设备之间互联;32位DDR3接口工作频率高达1066MHz。

图1 SP2704媒体处理器体系结构。

SC3400e---基于SC3400的增强

SC3400e与SC3400后向兼容,SC3400e继承了SC3400的变长指令集(VLES)结构和12级流水深度。SC3400e的能力增强表现在以下几个方面:

1)实数和复数乘加能力的增强

SC3400e与SC3400的数据算术逻辑单元(DALU)都包含了4个乘加单元(MAC)。SC3400的MAC包含1个16位*16位的乘法器和1个40位的加法器;而SC3400e的MAC包含4个16位*16位的乘法器和2个40位的加法器,其加法器支持2个40位复数操作数的加/减法。实数乘加运算能力提高1倍,而复数乘加运算能力则是原来的4倍。

SC3400e的实数和复数MAC运算能力可概括为:每周期可完成8个16位实数乘加运算,性能是SC3400的2倍;每周期可完成4个16位(16位实部,16位虚部)的复数乘加运算,性能是SC3400的4倍;每周期可完成8个8位(8位实部,8位虚部)的复数乘加运算,性能是SC3400的8倍;每周期可完成4个32位*16位的实数乘加运算,性能是SC3400的2倍;每周期可完成4个(16位*16位+16位*16位+40位)的实数点积运算。如果设置了饱和模式,A=sat{sat{A+BxC}+DxE},则性能是SC3400的2倍。

2)在COF和控

Copyright © 2017-2020 微波EDA网 版权所有

网站地图

Top