微波EDA网,见证研发工程师的成长!
首页 > 硬件设计 > 嵌入式设计 > 基于嵌入式的多媒体应用的多处理器核软件设计框架

基于嵌入式的多媒体应用的多处理器核软件设计框架

时间:04-08 来源:3721RD 点击:

在实际的应用中,系统可能运用多种算法来处理数据流,而每种算法都可能用到不同的数据访问模式。这种情况下,则可以将这几种软件结构结合起来完成一个特殊的应用。为利用多核结构,可采用流水处理来实现算法的并行操作,但这种并行操作是不对称的,因为不同处理器核上可能执行的计算是不同的。然而,系统可以分配一些其它的任务到处理器核的空闲指令上,在保持灵活性的同时也达到了处理器核的工作量平衡。图7说明了行级处理和宏块处理相结合的处理结构中的数据流模型。

在某些其他应用中,多个数据块之间也会存在数据相关性,数据访问模式仍然是可预测的,但它扩展到了一个宏块或一个行的粒度之外。例如,运动窗口搜寻就可能使用几个相邻的宏块。虽然数据访问模式仍然是可预测的,但系统在算法迭代过程中要访问多个数据块。在这种情况下,您可以对软件框架进行修正,以实现有效的并行操作。例如,如果多行间存在相关性,可以通过调整行处理结构将N个连续行的帧单元传送到每个处理器核的L1存储器中。利用类似的方法,还可以对宏块处理结构进行扩展,从L2存储器中将不止一个宏块送入内部L1存储器。

软件框架分析

为了对双核处理的软件框架进行评估,AD公司利用数据流模型率先开发了一款单核应用软件,并与双核实现进行了对比。参考文献【1】讨论了单核模型的更多细节。Blackfin独有的系统优化技术完全可以有效的使用可用带宽(参考文献【2】)。 为了分析简单,公司只对基本软件架构的处理速度做了对比,而没有考虑几种组合的软件架构。

所谓周期是指为了满足NTSC(国家电视系统委员会)视频输入的实时需要,用于处理数据流的处理器核计算周期。对于一个以600MHz运行的处理器核,为了满足实时约束条件,处理每一像素可用的周期数为44核周期/像素。任何处理器核访问流数据都只需一个单内核周期,因为所有的数据访问都是对L1存储器的访问。该周期数没有包括中断引起的延迟。

如表1所示,双核处理结构将所有软件结构的处理速度都有效提高了两倍。表中还说明了L1存储器对于每个处理器核的可用容量,以及每种软件架构所需的共享存储空间。这些软件架构应用ADi公司的DD/SSL(设备驱动程序/系统服务库)实现对外设和数据的管理(参考文献【3】)。

Copyright © 2017-2020 微波EDA网 版权所有

网站地图

Top