云中的机器学习:FPGA 上的深度神经网络
时间:09-07
来源:互联网
点击:
一切始于 C/C++
卷积神经网络备受青睐,并大规模部署用于处理图像识别、自然语言处理等众多任务。随着 CNN 从高性能计算应用 (HPC) 向数据中心迁移,需要采用高效方法来实现它们。
FPGA 可高效实现 CNN。FPGA 的具有出色的单位功耗性能,因此非常适用于数据中心。
AuvizDNN 函数库可用来在 FPGA 上实现 CNN。AuvizDNN 能降低 FPGA 的使用复杂性,并提供用户可从其 C/C++ 程序中调用的简单函数,用以在 FPGA 上实现加速。使用 AuvizDNN 时,可在 AuvizDNN 库中调用函数,因此实现 FPGA 加速与编写 C/C++ 程序没有太大区别。
如需更多信息,敬请访问网址www.auvizsystems.com,或发邮件至sales@auvizsystems.com。
参考资料
1. A. Krizhevsky, I. Sutskever, G. E. Hinton, “深度卷积神经网络的ImageNet分类”,神经信息处理系统发展,2012
图 1 – AlexNet 是一种图像识别基准,包含五个卷积层(蓝框)和三个致密层(黄)。
图 2 – AlexNet 中的卷积层执行 3D 卷积、激活和子采样。
图 3 – 图表展示了 AlexNet 中涉及的计算复杂性和数据传输数量。
图 4 - 实现 CNN 时的函数调用顺序。
图 5 – 使用 AuvizDNN 创建 AlexNet 的 L1 的代码片段。
图 6 – AlexNets 的性能因 FPGA 类型不同而不同。
- 赛灵思:可编程逻辑不仅已是大势所趋,而且势不可挡(07-24)
- FPGA可帮助搜索引擎降低功耗和碳排放(09-12)
- 基于Spartan-3A DSP的安全视频分析(05-01)
- 赛灵思新版视频入门套件加快视频开发速度(05-29)
- 赛灵思“授之以渔”理论:危机中如何巧降成本(06-04)
- 赛灵思详解新近推出的FPGA领域设计平台(12-16)