下一代网络设备核心单元:网络处理器应用研究
时间:08-30
来源:互联网
点击:
4 网络处理器体系结构简介
4.1 Intel公司IXP1200网络处理器介绍
IXP1200系列是Intel公司IXA架构的核心产品,组成如下:1个主频最高可达232MHz的处理核心StrongARM;6个RISC结构的可编程微引擎,每个微引擎又包含4个硬件线程;64位IX Bus;32位的SRAM接口单元,工作频率为核心频率的一半;64位的SDRAM接口单元,工作频率为核心频率的一半;32位PCI总线接口单元,最高66MHz。
主要特点为:
(1)并行处理:六个微引擎和一个StrongARM构成IXP1200的计算资源,共享相同资源,包括:SDRAM,SRAM,PCI,IX Bus等。微引擎和StrongARM均为RISC处理器,并行工作。StrongARM负责协议控制层面任务和微引擎管理。微引擎负责数据层面的高速数据分组处理,通过对六个微引擎/24个硬件线程分配不同功能的微码程序,可以实现网络负荷的动态/静态调配。微码程序的可重载性为系统软件升级提供了极大方便。
(2)分布式数据存储结构:每个微引擎独立使用256个32位寄存器。其中128个寄存器是传送寄存器集。每个微引擎将数据载入自己的传送寄存器集,对传送寄存器集进行操作,然后通过传送寄存器集写到数据目的地。数据载入传送寄存器集后,微引擎可在单指令周期完成访问。
(3)硬件多线程:每个微引擎有4个编程计算器,支持4个硬件线程。每个线程可以执行相同或不同的微码程序,采用内部线程通信机制实现线程同步,提高系统效率。微码指令采用5级流水线机制,执行周期为1个时钟周期。
(4)主动内存管理:SDRAM和SRAM支持多个读写队列进行优先级排队以优化带宽。允许StrongARM和6个微引擎/24个线程同时提交对内存单元的读写请求,内存单元根据特定优化指令对读写请求硬件优先级排队。用户可自定义内存管理优化策略。
(5)多层并发性:通过多个独立数据总线和控制总线,可以实现数据并发移动:SDRAM单元和微引擎或IX BUS单元之间的双向同时读写;SRAM单元和微引擎或IX BUS单元之间的双向同时读写;SDRAM单元和PCI单元之间读写;IX BUS单元和微引擎之间读写。
(6)块数据移动:每个微引擎分配很大的寄存器集,单个指令就可以实现功能单元之间64个字节的数据块移动,和功能单元与IX BUS之间128个字节的数据块移动。块数据移动在充分利用微引擎计算资源的同时,还可以减小微码程序规模。
(7)可扩展性:多个IXP1200处理器可以通过IX BUS总线互联,从而有效增加处理系统处理能力和数据带宽;ATM、E1/T1、Ethernet MAC等数据接口可以通过IX BUS总线接入IXP1200;微引擎的微码程序存储空间具有可扩展性。
4.2 IBM公司NP4GS3网络处理器介绍
NP4GS3网络处理器是IBM PowerNP网络处理器家族的高端产品,支持2.5Gbps的网络应用,由以下模块组成:(1)EPC:嵌入式处理器组是NP核心部件,包含16个协议处理器,可同时执行32个线程,具有并行处理32个数据分组的能力。为提高性能,采用硬件加速器实现树搜索、帧转发、帧过滤、CRC计算及其他功能。(2)Embedded PowerPC:负责NP非实时管理控制,包括特殊帧处理、配置、盒管理和高层协议处理。同时集成PCI接口,可以满足用户集成其他新器件的需求。(3)Ingress EDS:对来自物理层设备的数据分组进行入队、出队、调度,然后送到交换组织。(4)Egress EDS:对来自交换组织的数据分组进行入队、出队、调度,然后送到物理层设备。(5)Ingress SWI:将数据分组从Ingress EDS传送到交换组织或其他的NP4GS3。(6)Egress SWI:将数据分组从交换组织或其他的 NP4GS3传送到Ingress EDS。(7)Ingress PMM:接收来自物理层设备的数据分组。(8)Egress PMM:将数据分组发送到物理层设备。
NP4GS3网络处理器支持40个10/100Mb以太网端口和4个 Gigabit 以太网端口,可配置成4个OC-12 POS,16个OC-3 POS或链接聚合POS端口。处理器具有扩展能力,可由多达64个的NP4GS3组成交换组织,实现2层、3层甚至更高层数据分组的线速转发处理。
4.3 网络处理器体系结构特点
上述两种NP的体系结构具有以下共同特点:(1)多内核并行处理器:采用多内核并行处理器结构。片内处理器按任务分为核心处理器和数据分组协处理器。核心处理器通常负责非实时的管理任务;数据分组处理器进行实时、线速数据分组处理。(2)专用硬件加速处理单元:采用专用硬件对特定协议操作进行协处理:如CRC效验、哈希查找、树查找、字符匹配。针对安全产品,提供加/解密、大数运算等硬件单元。(3)优化指令集:通常采用RISC技术,结合多级流水线技术,大部分指令在一个时钟周期完成。并针对网络协议处理特点,设置
4.1 Intel公司IXP1200网络处理器介绍
IXP1200系列是Intel公司IXA架构的核心产品,组成如下:1个主频最高可达232MHz的处理核心StrongARM;6个RISC结构的可编程微引擎,每个微引擎又包含4个硬件线程;64位IX Bus;32位的SRAM接口单元,工作频率为核心频率的一半;64位的SDRAM接口单元,工作频率为核心频率的一半;32位PCI总线接口单元,最高66MHz。
主要特点为:
(1)并行处理:六个微引擎和一个StrongARM构成IXP1200的计算资源,共享相同资源,包括:SDRAM,SRAM,PCI,IX Bus等。微引擎和StrongARM均为RISC处理器,并行工作。StrongARM负责协议控制层面任务和微引擎管理。微引擎负责数据层面的高速数据分组处理,通过对六个微引擎/24个硬件线程分配不同功能的微码程序,可以实现网络负荷的动态/静态调配。微码程序的可重载性为系统软件升级提供了极大方便。
(2)分布式数据存储结构:每个微引擎独立使用256个32位寄存器。其中128个寄存器是传送寄存器集。每个微引擎将数据载入自己的传送寄存器集,对传送寄存器集进行操作,然后通过传送寄存器集写到数据目的地。数据载入传送寄存器集后,微引擎可在单指令周期完成访问。
(3)硬件多线程:每个微引擎有4个编程计算器,支持4个硬件线程。每个线程可以执行相同或不同的微码程序,采用内部线程通信机制实现线程同步,提高系统效率。微码指令采用5级流水线机制,执行周期为1个时钟周期。
(4)主动内存管理:SDRAM和SRAM支持多个读写队列进行优先级排队以优化带宽。允许StrongARM和6个微引擎/24个线程同时提交对内存单元的读写请求,内存单元根据特定优化指令对读写请求硬件优先级排队。用户可自定义内存管理优化策略。
(5)多层并发性:通过多个独立数据总线和控制总线,可以实现数据并发移动:SDRAM单元和微引擎或IX BUS单元之间的双向同时读写;SRAM单元和微引擎或IX BUS单元之间的双向同时读写;SDRAM单元和PCI单元之间读写;IX BUS单元和微引擎之间读写。
(6)块数据移动:每个微引擎分配很大的寄存器集,单个指令就可以实现功能单元之间64个字节的数据块移动,和功能单元与IX BUS之间128个字节的数据块移动。块数据移动在充分利用微引擎计算资源的同时,还可以减小微码程序规模。
(7)可扩展性:多个IXP1200处理器可以通过IX BUS总线互联,从而有效增加处理系统处理能力和数据带宽;ATM、E1/T1、Ethernet MAC等数据接口可以通过IX BUS总线接入IXP1200;微引擎的微码程序存储空间具有可扩展性。
4.2 IBM公司NP4GS3网络处理器介绍
NP4GS3网络处理器是IBM PowerNP网络处理器家族的高端产品,支持2.5Gbps的网络应用,由以下模块组成:(1)EPC:嵌入式处理器组是NP核心部件,包含16个协议处理器,可同时执行32个线程,具有并行处理32个数据分组的能力。为提高性能,采用硬件加速器实现树搜索、帧转发、帧过滤、CRC计算及其他功能。(2)Embedded PowerPC:负责NP非实时管理控制,包括特殊帧处理、配置、盒管理和高层协议处理。同时集成PCI接口,可以满足用户集成其他新器件的需求。(3)Ingress EDS:对来自物理层设备的数据分组进行入队、出队、调度,然后送到交换组织。(4)Egress EDS:对来自交换组织的数据分组进行入队、出队、调度,然后送到物理层设备。(5)Ingress SWI:将数据分组从Ingress EDS传送到交换组织或其他的NP4GS3。(6)Egress SWI:将数据分组从交换组织或其他的 NP4GS3传送到Ingress EDS。(7)Ingress PMM:接收来自物理层设备的数据分组。(8)Egress PMM:将数据分组发送到物理层设备。
NP4GS3网络处理器支持40个10/100Mb以太网端口和4个 Gigabit 以太网端口,可配置成4个OC-12 POS,16个OC-3 POS或链接聚合POS端口。处理器具有扩展能力,可由多达64个的NP4GS3组成交换组织,实现2层、3层甚至更高层数据分组的线速转发处理。
4.3 网络处理器体系结构特点
上述两种NP的体系结构具有以下共同特点:(1)多内核并行处理器:采用多内核并行处理器结构。片内处理器按任务分为核心处理器和数据分组协处理器。核心处理器通常负责非实时的管理任务;数据分组处理器进行实时、线速数据分组处理。(2)专用硬件加速处理单元:采用专用硬件对特定协议操作进行协处理:如CRC效验、哈希查找、树查找、字符匹配。针对安全产品,提供加/解密、大数运算等硬件单元。(3)优化指令集:通常采用RISC技术,结合多级流水线技术,大部分指令在一个时钟周期完成。并针对网络协议处理特点,设置
电路 ARM 总线 嵌入式 VxWorks Linux C语言 相关文章:
- 浅谈E1线路维护技术与应用(01-12)
- R4网络接口和电路域容灾技术(01-05)
- 移动通信网引入IMS的相关探讨(02-21)
- 未来接入网的结构与演进(01-26)
- 电子熔丝在计算机应用中的优势(06-08)
- 高性能、高集成度的TD-SCDMA模拟基带集成电路的实现和应用(01-09)
