微波EDA网,见证研发工程师的成长!
首页 > 硬件设计 > 行业新闻动态 > AMD X86处理器十年回顾,天平还会往英特尔倾斜吗

AMD X86处理器十年回顾,天平还会往英特尔倾斜吗

时间:07-01 来源:台湾水电工协会-非在职工友 点击:

熟悉的"钟摆(Tick-Tock)战略",小步快跑,急起直追,展现了惊人的执行力,以服务器市场为主,Intel 追击的轨迹可简述为:

2006年:由以色列海法主导、原本和NetBurst高低档搭配的Pentium M体系Merom微架构,完全取代NetBurst,一统服务器、桌机、笔电。这时Intel靠着Woodcrest夺回单一核心的效能优势,也再度确定Intel高效能x86微架构的发展基础,回到起源于1995年Pentium Pro的P6,直到非循序指令执行引擎替换成NetBurst系的Sandy Bridge,才替问世于1995年的P6划下辉煌的句点。

没有原生4 核没关系,采用多芯片封装一次包两颗凑4 核也可以。当时应该也少人预期到,隔没几年,就换AMD 被迫如法炮制昔日嘲讽的"双馅水饺",在Socket G34 塞两颗核心二打一,勉强对抗占有优势的Intel。

2009年:由Hillsboro主导、在Pentium 4初期曾目标"时脉上看10GHz"的Nehalem,重回以P6体系为基础后,原生4核加上了同时多执行绪、QPI汇流排、整合式记忆体控制器与相对应的MESIF快取记忆体一致性协定,基本上已经可以视为"Intel世界的K8",但青出于蓝胜于蓝,AMD K8的多处理器系统架构优势,此时已荡然无存(除了Intel多出很烫手有点难散热的IOH),支撑AMD不坠的,只有K8重大战略胜利的剩余动量与现有客户的信心度。

对Intel,开始移植源自Itanium 的系统可靠性技术至8 处理器Nehalem-EX 最重大的意义是:确立Itanium 边缘化的命运。2006 年启动钟摆战略时,将64 位元x86 指令集从心不甘情不愿的IA-32e 和EM64T 正名为Intel 64,就初露端倪。这重大的战略决定,也和当时Intel 部分高层离职潮有直接或间接关系,包括因P6 奇迹而拥有完美"服务器夏天"感到骄傲的某任Cadence 执行长,与18 岁就进Intel 上班,后来确定抢不到执行长而跳槽VMware 时还放话"Itanium 业务其实有赚钱"的那位。

当然,AMD 也没有闲着坐等Intel 咬上来,但以K8 为基础的原生4 核K10(Barcelona,Shanghai)与原生6 核K10(Istanbul),相较于Intel 的钟摆频率,进步幅度都太小了,而Barcelona 的TLB 臭虫事件,更伤害了企业对Opteron 的信心,以Nehalem 微架构与Tylersburg 平台为死亡交叉点,即使AMD 再如何对外宣称"执行力到位",如2006 年底在德州展示原生4 核,2009 年准时推出Istanbul 等,颓势已无法挽回。

2011~2012年:AMD一拖再拖、由IBM Power4总架构师Chuck Moore操刀的Bulldozer,与Intel同样一再延宕的Sandy Bridge在服务器市场顶上决战,从内到外每个环节几乎都输人的AMD,就如同在卫城作战失败后的德军,从此一蹶不振,连续4个世代丛集多执行绪微架构都被Intel"后P6时代"钟摆压垮,低耗电微架构Jaguar与ARM Cortex-A57的Opteron,对大局完全无足轻重,直到2017年Zen微架构的EPYC问世前,没有一丝一毫翻身的可能性。

对了,为何AMD 没有K9?因为K9 的英文发音是"犬类",AMD 不想当败家之犬,只可惜本名K8L 的K10 也没有成功阻止AMD 退潮。

走音出锤的推土机工地秀

Intel 有钟摆,AMD 当然也有,只是跟Intel 相比,AMD 连续4 个世代的丛集多执行绪微架构,完全是小巫见大巫,而AMD 为了异质多核心大计预先铺设的暗桩,也被Intel的钟摆巨轮辗成碎片。

2011年:推土机(Bulldozer),32nm制程,出师不利的先锋,因为推土机设定集里面的预定对手不是Sandy Bridge,而是前一代Westmere甚至是更早的Nehalem。"刚刚好"经领导K7救世主的Dirk Meyer就在2011年初从执行长大位下台一鞠躬,代表AMD经营阶层对采取双轨路线(推土机搭配山猫)投下的不信任票。

2012年:打桩机(Piledriver),32nm制程(SOI晶圆),微幅改进微架构,主要着眼在分支预测和指令排程,但聊胜于无。这时候,已经传闻AMD准备全面弃守现有产品时程表,全力投入全新x86微架构与开辟ARM服务器战线。

2014年:压路机(Steamroller),28nm制程,AMD终于真正对症下药,疏通指令管线前端的塞车问题,改进指令快取的命中率(2路64kB升级为3路96kB),新增微指令回圈缓冲区,也让丛集多执行绪的两个整数逻辑运算核心拥有专属的指令解码器,但为时已晚,AMD连早已不再闪亮的金鸡母Opteron产品线都放弃导入"新"核心了,仅APU产品线有幸一亲芳泽。

2015年:Excavator(挖土机),28nm制程(当然有所改进),在设计工具端,因引进源自于GPU产品线的高密度函式库,所以有更小的芯片面积和更好的电力效率,至于支援AVX2指令集与DDR4记忆体就不值得特别着墨了。

AMD原始如意算盘:用比较简单的微架构跟你拼核

Copyright © 2017-2020 微波EDA网 版权所有

网站地图

Top