微波EDA网,见证研发工程师的成长!
首页 > 硬件设计 > FPGA和CPLD > 云中的机器学习:FPGA 上的深度神经网络

云中的机器学习:FPGA 上的深度神经网络

时间:09-07 来源:互联网 点击:

一切始于 C/C++


卷积神经网络备受青睐,并大规模部署用于处理图像识别、自然语言处理等众多任务。随着 CNN 从高性能计算应用 (HPC) 向数据中心迁移,需要采用高效方法来实现它们。

FPGA 可高效实现 CNN。FPGA 的具有出色的单位功耗性能,因此非常适用于数据中心。

AuvizDNN 函数库可用来在 FPGA 上实现 CNN。AuvizDNN 能降低 FPGA 的使用复杂性,并提供用户可从其 C/C++ 程序中调用的简单函数,用以在 FPGA 上实现加速。使用 AuvizDNN 时,可在 AuvizDNN 库中调用函数,因此实现 FPGA 加速与编写 C/C++ 程序没有太大区别。

如需更多信息,敬请访问网址www.auvizsystems.com,或发邮件至sales@auvizsystems.com。
   
参考资料  

1.    A. Krizhevsky, I. Sutskever, G. E. Hinton, “深度卷积神经网络的ImageNet分类”,神经信息处理系统发展,2012


图 1 –  AlexNet 是一种图像识别基准,包含五个卷积层(蓝框)和三个致密层(黄)。


图 2 – AlexNet 中的卷积层执行 3D 卷积、激活和子采样。


图 3  – 图表展示了 AlexNet 中涉及的计算复杂性和数据传输数量。


图 4 - 实现 CNN 时的函数调用顺序。


图 5 – 使用 AuvizDNN 创建 AlexNet 的 L1 的代码片段。


图 6 – AlexNets 的性能因 FPGA 类型不同而不同。

Copyright © 2017-2020 微波EDA网 版权所有

网站地图

Top