微波EDA网,见证研发工程师的成长!
首页 > 硬件设计 > 嵌入式设计 > 嵌入式多媒体应用的多核编程框架

嵌入式多媒体应用的多核编程框架

时间:12-29 来源:互联网 点击:

此,处理器核可以独立处理每一组郑图6显示了这种框架的数据流。与帧级处理框架类似,系统可以将帧数据块传送至处理器核的L1存储器。为了有效利用外部存储器的交错存储库结构,系统在处理器核间均衡地分配存储库。ADSP-BF561的每一个外部存储库都支持多达四个内部SDRAM存储库。这种框架的应用实例包括MPEG-2/4等编码/解码算法。

图6 在GOP级数据访问模式中,关联性存在于一组数据帧内部,两组帧之间数据不存在关联性。

在实际应用中,系统可能使用多种算法处理数据流,而每种算法都可能用到不同的数据存取模式。这种情况下,可以针对特殊应用将几种框架结合起来使用。为利用多核结构,可以采用流水线处理来实现并行操作,但这种并行操作是不对称的,因为不同处理器核上可能执行不同的计算。然而,系统可以分配一些其它的任务到处理器核的空闲指令上,在保持灵活性的同时达到处理器核的工作量平衡。图7显示了行级处理和宏块处理相结合的框架的数据流模型。

图7 行级处理和宏块处理相结合的框架的数据流模型

在某些其他应用中,多个数据块之间也会存在数据关联性,数据存取模式仍然是可预测的,但它扩展到了一个宏块或一行的粒度之外。例如,运动窗口搜索就可能使用几个相邻的宏块。数据存取模式仍然是可预测的,但系统在算法的多次迭代之间要访问多个数据块。这种情况下,可以对软件框架进行修正,以实现有效的并行操作。例如,如果多行间存在关联,可以通过调整行处理框架,将N个连续行的帧片段传送到每个处理器核的L1存储器。利用类似的方法,还可以对宏块处理框架进行扩展,以便将多个宏块从L2存储器送入内部L1存储器。

软件框架分析

为了对双核处理的软件框架进行评估,ADI公司利用数据流模型率先开发了一款单核应用软件,然后与双核方案进行对比。Blackfin独有的系统优化技术也能有效地利用可用带宽。为了简化分析,ADI公司只比较了基本框架的处理速度,而没有考虑几种架构的组合。

所谓周期,是指为了满足NTSC(美国国家电视系统委员会)视频输入的实时约束条件而用于处理数据流的处理器核计算周期。对于一个以600MHz速度运行的处理器核,为了满足实时约束条件,处理每一像素可用的总周期数为44周期/像素。任何对数据流的处理器核访问都只需要一个单核周期,因为所有数据访问都是对L1存储器的访问。所示的周期数不包括中断延迟。

如表1所示,双核框架将所有框架的处理速度有效提高了两倍。表中还说明了每个处理器核的L1存储器使用量,以及各种框架需要的共享存储器空间。这些框架使用ADI公司的DD/SSL(器件驱动/系统服务库)实现对外设和数据的管理。

表1:框架说明

Copyright © 2017-2020 微波EDA网 版权所有

网站地图

Top