微波EDA网,见证研发工程师的成长!
首页 > 硬件设计 > 行业新闻动态 > 芯片世界观︱最新企业级CPU Naples被指没戏,AMD:别惹我,蓝瘦

芯片世界观︱最新企业级CPU Naples被指没戏,AMD:别惹我,蓝瘦

时间:09-17 来源:3721RD 点击:

72个增强型Silvermont核心(兼容Haswell)、多增加了2个AVX 512位VPU,这个CPU尺寸不小,还配备了6个DDR通道。

这个CPU能够在二进制级别上兼容Haswell,基本上能够自动地以套接字或协处理器模式运行,大大提高了英特尔解决方案的计算能力,它同时采用了4 SMT架构,可以在每个核心上运行四个线程,也进一步增强了计算能力。在协处理器目标应用市场,该方案正面临来自英伟达的竞争威胁,AMD同时也要在2017年中发布其基于Zen和GCN架构、集成HBM模块的企业级APU进入这个市场。不过,考虑到核心数量预计提升不多以及性能差异不大,很难想象AMD于2017年发布的新产品会给英特尔现有的产品带来多么强的竞争压力。由于热功耗的限制,集成了GCN GPU和HBM模块的Naples CPU不会实现太大的性能提升。因为,Naples CPU的总设计功耗预计为150W。事实上,有传言谈到一个搭载北极星架构GPU的16核心版本Naples,它能够在32位下实现4 TFLOPS的运算能力,想挑战英特尔具备完全自主优势,32位运算能力能达到6 TFLOPS的Knights Landing,这个指标有点太低了。而且,AMD这款产品只有32个线程、4个DDR通道,英特尔的Knight Landing则有288个线程、6个DDR通道,所以这款传言产品和英特尔的目标市场在本质上是不同的,而且AMD的APU不能使用集成GPU运行一些通用的线程,通用线程是在CPU上运行的。

我们还必须考虑到,英特尔将在2017年年底和2018年之间发布其10 nm CPU,而基于10 nm光刻技术的Knights Hill和Knights Mill也将在2018年推出,这将再次带来一贯的性能升级。

相反,AMD将在2018年年底发布其12nm产品,2019年年底发布7nm产品。

此外,英特尔将把LGA 3647插槽用于Skylake处理器,这就意味着有可能出现比传闻的26-28核心数更多的CPU版本,这意味着Naples核心数量的相对优势有可能不存在。Skylake还将集成100G OmniPath互连、AVX 512指令集、Cannonlake图形,并将在收购Altera之后第一次集成FPGA:这将是一个性能出色的组合,肯定会吸引许多客户。

Naples的L3高速缓存问题
另一个必须强调的事情是L3高速缓存问题:最新的基准测试结果显示,Naples每个CCX配备了64MB L3缓存,这就意味着每个CPU提供惊人的、高达512MB的L3缓存,各个网站都对这个巨大的数字很兴奋,但是,这个数据有可能是完全错误的。

这可能是由Geekbench的一些读取错误引起的,考虑到缓存是完全共享的和包容的,这种错误也是很容易解释的。Naples基于Zen架构,考虑为每个核心使用2MB的L3缓存,每个CCX有四个核心,Naples由8个CCX组成,可以得出L3缓存的大小总共为64MB。关于这个问题,考虑到Geekbench做基准测试的架构不是AMD官方提供的,所以很容易遇到这些程序错误。

此外,从制造工艺的角度,如果我们使用英特尔密度更高的14nm光刻技术构建512MB的L3缓存,裸片尺寸几乎就要达到1000mm2,这还仅仅是用于L3缓存的:这种尺寸几乎是英伟达 GP100裸片尺寸的两倍。我们还没有考虑其他组件,如32个CPU内核、指令高速缓存、多媒体解码器和编码器、4个内存控制器、其他控制器等。单从制造上来讲,这基本上是不可行的,而且非常昂贵,这种大尺寸高速缓存的可用性也是很值得质疑的。

要点
尽管AMD的Naples和Snowy Owl距离正式发布还有很长一段时间,但是考虑到这些基准测试结果,拿它来对标英特尔即将发布的新解决方案是不合适的,至少现在看来是这样。

的确,这些只是初步的基准测试结果,但是考虑到Naples使用的是在未来三四个月就要上市的Zen架构,它不可能那么落后于既定的发展路线图。

Snow Owl(企业级APU)仍然没有基准测试结果问世,但是看起来它也不会提供多么强大的性能。它将有16个核心,并将配备HBM模块以及等价于实际的北极星10之类的模块,以实现32位下的4+ TFLOPS性能。用它来对抗传统的Xeon CPU或Knights Landing有点太不自量力了。英特尔的Knights Landing集成了3D MCDRAM、6个DDR通道、6+ TFLOPS 32位运算能力、72个核心、288个线程,而且因为与Haswell二进制兼容,所以能够利用对Haswell的每次优化。这就够AMD喝一壶的了,更不用说具有6个DDR通道、集成FPGA、英特尔OmniPath的Xeon Skylake,或者预计将在2018年上市的Knights Hill/Knights Mill组合了。

AMD可能真正给英特尔制造麻烦的是在消费级APU市场,那些客户想用集成显卡玩中低级别的游戏,并获得良好的图形效果。AMD可以发布集成单个HBM模块的Raven Ridge解决方案,实现128 GB/s的视频内存带宽和768个GPU内核。问题是,要发布的APU的TDP必

Copyright © 2017-2020 微波EDA网 版权所有

网站地图

Top