微波EDA网,见证研发工程师的成长!
首页 > 硬件设计 > 嵌入式设计 > 基于FPGA的VLIW微处理器的设计与实现

基于FPGA的VLIW微处理器的设计与实现

时间:06-05 来源:互联网 点击:

超长指令字VLIW微处理器架构采用了先进的清晰并行指令设计。VLIW微处理器的最大优点是简化了处理器的结构,删除了处理器内部许多复杂的控制电路,它能从应用程序中提取高度并行的指令数据,并把这些机器指令均匀地分配给芯片中的众多执行单元。本设计是针对VLIW微处理器的基本功能设计实现的,是针对64位指令字和192位数据进行操作处理,主要功能是将指令和数据分别划分到3个并行操作单元中,在执行单元中根据3个并行指令控制,对3个并行操作单元的数据进行并行处理,同时对操作处理数据进行存储处理管理。

1 VLIW微处理器

1.1 VLIW微处理的基本结构

VLIW微处理器的基本架构如图1所示,采用4级流水线的形式进行架构组织,分别是取指令、译码、执行、写回。VLIW微处理器从外部储存器中,取出指令和数据,指令通过译码操作,要求处理器进行执行动作,处理寄存器中的数据或者是取指令单元传输来的数据,并通过写回单元,将处理的数据存储到寄存器中。取指令单元是从存储器中取出相对应的指令和数据,并将相应的信息传输给译码单元和寄存器堆单元;译码单元的作用是将取指令单元的指令信息翻译为执行单元能够识别的操作,将相应的信息传输到执行单元中;执行单元是执行对应的指令信息和处理相关的数据,同时也对寄存器堆送来的数据和指令进行相应的操作;写回单元是将执行单元的数据存储到寄存器堆中;寄存器堆是暂时存放取指令单元和写回单元的数据或是指令。


1.2 VLIW微处理器操作方式

VLIW处理器指令操作方式是实行3种并行的操作,指令格式设置为:最高4位作为保留位,其余各20位依次划给操作1、操作2、操作3,在每个20位中又分别留有4位的保留位,最后对16位的指令进行划分为操作码、源1地址、源2地址、目标地址。3种操作方式是并行执行,相互独立,互不干扰,并且操作执行都是64位的数据;每一种操作方式都可以实现16种操作运算:空操作、加、减、乘、装载、移动、读、比较、或、与非、或非、取反、左移、右移、循环左移、循环右移等操作。任何一种操作都可以对16个寄存器中的数据进行操作处理,且寄存器中所存储的数据是64位。整个操作过程是将源1与源2寄存器中的数据进行某种操作运算,将其操作处理结果存入目标寄存器中,其操作处理方式是采用寄存器寻址方式。

2 VLIW微处理器的设计与实现

根据VLIW微处理器系统架构和基本原理,将整个VLIW微处理划分为5个主要部分,并对如图2所示的5个部分进行功能设计与实现。具体原理:取指令模块把外部存储器的数据和指令传送给译码模块,并将部分指令信息传送给寄存器堆,实现取指令的功能;译码模块将取指模块的数据和指令进行相对应的译码,实现某一种具体的操作,并将译码结果传送到执行模块中;执行模块将译码模块或者寄存器堆模块的数据和指令实现其操作的具体功能,并将操作结果传送到写回模块中;写回模块将执行模块的信息写入寄存器中,并输出相关操作处理的数据。


2.1 取指令模块的设计

取指令模块的功能是从外部指令/数据的Catch取得VLIW指令和数据,将取得的信息传输给译码模块,让指令进行译码,同时也将取得的信息传输给寄存器堆模块,让执行模块执行操作进入内部寄存器而从寄存器堆取回数据。取指令模块设计实现如图3所示。将指令和数据通过选择器分配到3个操作并行单元中,然后细分操作执行的方式。具体划分为顶层模块和3种并行操作模块。顶层模块主要实现对指令和数据进行分流,分成操作码和操作地址的形式。由于都是并行操作,只需要写出操作1的功能,其余的操作功能一致,只是输入的操作指令和操作地址不一样。


2.2 译码操作模块的设计

译码操作模块的功能是将取指令模块传输来的信息进行译码操作,将所进行译码操作传输给执行模块。由于在进行译码操作时,操作1、操作2、操作3的指令与数据没有相互冲突,而且每一种操作的功能都是对16种操作进行相对应的译码,不同在于输入的各个操作的数据或指令的不相同,因此,在实现译码模块时,只需要实现一个操作译码的功能就可以。在改变输入的情况下就实现操作2、操作3的2种操作译码的功能,从而可实现译码模块的整个功能。译码模块其划分原理如图4所示。


2.3 执行模块的设计

执行模块是在VLIW微处理器所有模块中最复杂的模块,其主要功能是执行VLIW指令操作,并将执行的操作结果送到写回模块中。在执行模块中采用寄存器旁路的特点,寄存器旁路用于处理指令或者数据之间的相互冲突问题。

将执行模块划分为:顶层模块、操作1模块、操作2模块、操作3模块、功能执行模块、异常处理模块。顶层模块实现3种操作的数据与指令分流和中间变量的处理;操作1模块实现寄存器旁路的功能和数据的处理;操作2模块和操作3模块实现的功能与操作1模块相同,不同点在于中间数据冲突处理不一样;功能执行模块实现16种操作的具体功能;异常处理模块实现数据或指令的异常处理的具体功能。将各个模块连接就实现执行单元的整个功能。

2.4 寄存器堆的实现

寄存器堆的结构如图5所示。输入端的数据、指令是来自2个单元,一个是取指令单元数据和指令,另一个是写回单元的数据;输出的指令、数据要传输到执行单元中进行执行操作。因为3种操作是并行执行的,每一种操作功能都是一样,因此在某个输入信号下,经由某种操作单元时,在选择器MUX下,选择某种具体操作运算。在功能单元FU中,对取出的存储器数据进行相应的操作运算处理,并将操作处理的结果输出送到执行单元中。图中虚线表示将写回单元输送来的操作数据直接存储到存储器中。实现时,要注意处理数据的相关问题。


2.5 写回单元的设计

Copyright © 2017-2020 微波EDA网 版权所有

网站地图

Top