QIC 在缩短大容量FPGA编译时间中的作用
值得注意的是,第二次编译中已经使用了QIC,但往往花费时间和第一次编译差不多,有时还有增长。许多人为此怀疑QIC的性能,认为QIC没有效果甚至恶化了编译时间。这其实是一种误解!为什么呢?回到图2,我们可以看到,QIC流程在Analysis&Synthesis和fitter之间增加了一个新的处理阶段——分区合并,它是需要额外花费在第一次Flat Compilation中不存在的时间。而且,由于这是创建分区后的第一次编译,所有分区的网表都是空白的,也就是说整个设计都需要被编译、分析、综合、布局布线等的工作量和第一次编译是类似的,因此这部分花费的时间也是差不多。把这两部分时间加起来,自然第2次编译时间有可能会比第一次长了。只有当进行第3次编译的时候,各个分区都有可重用的网表了,才有可能将那些没有设计改变的分区的网表重用,从而节约综合和布局布线阶段的时间,达到整体编译时间的节约。
图3是笔者支持的一个客户所进行的QIC增量式编译性能评估的结果总结。客户的设计是高端路由器中的包处理应用,使用了ALTERA公司的Stratix4GX530器件,逻辑利用率大约是60%。客户的编译硬件是一台高性能服务器:、
图3 Z客户增量式编译评估实验效果
• CPU:16core Intel(R) Xeon(R) CPU E7420 @2.13GHz
• Memory:64GB
即使是如此,在不使用QIC的情况下,客户的每次编译都需要12到13个小时。而在使用QIC并根据QIC指导原则进行了必要的设计优化后,最好的实验结果是可以在6个小时左右(大约350分钟)完成一次编译,节约了接近55%的总编译时间!从图3中很容易看出前面文字描述的几个特点:
1. 第一次编译和第二次编译的总时间差不多(750 VS 730)
2. 第三次编译中,Analysis&Synthesis操作的时间,fitter操作得时间都比第一次编译有非常明显的降低;
3. 从原理上看,QIC的网表重用对Assembly和时序分析没有直接影响。因此三次编译中,Assembler和时序分析所花费的时间是差不多的。
QIC指导原则
合理创建分区
Quartus中的“分区”是和设计层次紧密关联的。任何设计,无论简单还是复杂,都会有一个顶层模块(top-level module),Quartus自动将它设置为一个默认分区(命名为top),不需要用户设定。而别的分区,需要用户手动创建。创建分区的方法很简单,在Quartus GUI界面左上角的Hierarchy窗口,选择想创建分区的实体,右键唤出的菜单中选择“Design Partition”,然后在下一级菜单中选择”Setting as Design Partition”,分区就创建成功了。
从图2可以看出,分区(Partition)是增量式编译中的一个关键概念。Altera规定:只要是有完整设计边界的设计实体,无论它在设计的哪一层次,都可以用它来创建设计分区。也就是说,Quartus II中,设计中任何层次中的任何一个设计模块,可以作为一个设计分区;一个设计中也可以包含不止一个设计分区;即使是在设计的同一层次,也可有多个分区。同时,请注意:分区之间没有层次关系,任何逻辑只能归属于某一个分区。以图5为例,A模块由A1、B1、C1三个子模块组成。如果A模块被设置为分区,Quartus会用模块名来为此分区命名:A分区。那么,A分区中就会包含A1、B1、C1三个子模块的所有逻辑。但如果把B1子模块也创建为分区,那么,A分区中就只包含A1、C1两个子模块的逻辑,B1子模块的逻辑只属于新的B1分区了。
图4 在Quartus GUI中创建分区示意
图5 分区与逻辑归属变化
图6 分区合并报告
图7 分区综合后资源使用统计
图8 Design partition window
图9 Design partition window
从前面分区的性质和特点可以看出,对包含多个功能模块的多层次复杂设计,可以有许多种设置分区的方案。但需要注意的是:不是任何一种分区方案都能带来编译时间的节约,恶劣的设计分区甚至能够导致编译失败!如何得到高效合理的设计分区呢?我们需要遵从以下原则:
a. 不要创建太多的分区,一般性的设计建议分区的数量控制在4~8个之间;
b. 不要创建太小的分区,一般建议不要小于1000个LE或者ALM;
c. 外设接口逻辑和内核处理逻辑放到不同的设计分区;
d. 相同或相近功能的外设接口,如果管脚位置相邻,可以放在同一个分区,否则创建不同的设计分区;
e. 不同的分区方案中,分区之间的联接少的方案更优。
针对QIC优化代码
除了分区方案,设计代码也对QIC的性能有直接的影响,需要设计者针对QIC做一些特定的代码优化。优化主要有两方面,一方面是升级所使用的Megacore IP到最新的版本;另一方面则是一些更严格的编码规则。
之所以建议升级Megacore IP到最新的版本,这
FPGA EDA Altera Quartus LTE 电路 相关文章:
- 基于FPGA的片上系统的无线保密通信终端(02-16)
- 基于Virtex-5 FPGA设计Gbps无线通信基站(05-12)
- 基于FPGA的DVI/HDMI接口实现(05-13)
- 基于ARM的嵌入式系统中从串配置FPGA的实现(06-09)
- 采用EEPROM对大容量FPGA芯片数据实现串行加载(03-18)
- 赛灵思:可编程逻辑不仅已是大势所趋,而且势不可挡(07-24)
