随着云计算的蓬勃产业发展,数十家IDC网络系统对伺服器CPU的要求也是持续走高。适逢有算力大列佩季哈区、操控性更优、生产成本更低的伺服器CPU上市,单厢引发众多网络系统使用者的高度关注。其原因其实比较简单:无论是一个百分点的操控性提高,亦或者一个基点的生产成本降低,网络系统里那么几台伺服器Lendelin下来,也会是一大笔十分不可思议的数字。
过去20年里,云伺服器CPU消费市场始终被AMD的x86构架统治,消费市场占有率甚至一度超过90%。近几年中,AMD始终紧随即,紧追不舍,进攻AMD消费市场。现在,伺服器CPU应用领域无间道一触即发。
伺服器CPU产业发展历史
AMD和AMD是PC制造应用领域最具举世闻名的两个名字。数十年来,她们始终在努力为格斗游戏玩者、消闲网络浏览器和从业者提供速度最慢、机能最强大、机能最丰富的CPU。多年来,她们来回几次激烈竞争。AMD面世了开创性的设计,而AMD则用自己的颠覆性晶片做出澄清。AMD在2005年至2015年期间对旗舰级操控性保持了有力的把握,AMD真正扭转颓势了局面面世其RyzenCPU。
自AMD在1978年面世第二颗x86CPU8086后,CPU的产业发展方向始终都是资源整合更多的x86与内部驱动器,以及更高的TNUMBERGHz。R5操控性的提升除了构架以外很重要的一点是依赖于振幅和内存,而振幅局限于CPU温度和耗电不可能增长博蒙阿,内存局限于CPU面积和生产成本同样不能稳步增长,这样振幅和内存只能依靠积体电路工艺技术的进步来逐步提高。当CPU的R5效率与振幅都到困局后,AMD与AMD都开始向多核产业发展。
AMD从R5到多核之路
2005年5月,AMD面世史上第一个TNUMBERGHzCPUPentium D系列产品,采用90nm工艺技术核心理念,每核心理念保有1MBL2内存,均是800MHz的FSB,随即还面世了带SLI技术的Pentium Extreme Edition 840CPU,TNUMBERGHz四缓存,FSB也提高到了1066MHz,振幅也更高。
后,Pentium DCPU的继任人是十分经典之作的Core 2 DueCPU,而且她们还用当年泡制第一款TNUMBERGHzCPU的表现手法制出了第一款双核CPUCore 2 Quad。
2013年AMD面世的Corei7-980X是第一款6核CPU,核心理念SSGulftown,它如前所述Westmere构架,CPU每核心理念保有256KB L2内存,共享资源12MB L3内存,TNUMBERGHz是3.33GHz,最高睿频3.6GHz。
桌面消费市场的第二颗真八核CPU是AMD在2014年面世的Corei7-5960X,属于22nm的Haswell-E构架,基础振幅3GHz,最高睿频3.5GHz,保有20MBL3内存,属于HEDT的X99平台。
后来,Core i7-6950X成为第一款桌面的十核CPU,生产工艺技术从22nm升级到14nm,核心理念数量从上代Core i7-5960X的8核增加到10核,晶体管数量也从26亿增加到32亿。
2017年,AMD面世了第七代Core X系列产品CPU,包括Skylake-X与Kabylake-X两种不同构架的CPU,SkylakeXCPU多了12核、14核、16核、18核的产品,并且用Core i9取代Core i7成为AMD消费级消费市场上最强CPU的代名词。
AMD的Lakefield项目于2019年正式公开,2020年正式上市,这款产品的实验性质很重,它是第一款采用AMDFoveros 3D堆叠工艺技术的产品,也是第一款采用混合构架的x86五核CPU。从此AMD开启混合构架新时代。
AMD从TNUMBERGHz到96核
AMD的TNUMBERGHzCPUAthlon 64 X2诞生于2005年5月。但与AMD的PentiumD不同,AMD的Athlon 64 X2是在同一块晶片内资源整合了两个K8核心理念,两个核心理念之间可透过System Request Queue实现数据互通,因此执行效率远高于竞争对手产品。
2007年K10构架的双核于11月11日发布,它确实是第一款原生双核CPU,并且首次把L3缓存引入到消费级消费市场,但整体效率不如对手的Core 2 Quad。主流平台的八核CPU,是2017年Zen构架的第一代Ryzen7列CPU,它正式引发了AMD与AMD在CPU消费市场的核心理念数量大战。
2018年发布的第二代锐龙Threadripper,最大核心理念数量已达到32核。到了锐龙Threadripper 3000,CPU被拆分成CCD计算核心理念和IOD输入输出核心理念,解决了每个核心理念之间访问内存和PCI-E时延迟不一的问题,于是2020年,64核的锐龙Threadriper3990X从此诞生。
最近,在AMD面世的新伺服器CPU中,其核心理念已经提高至96核。总的来看,在高操控性计算应用领域,以尽可能得使用多核心理念
伺服器CPU比拼激烈
在2022年投资者大会上,AMD首次披露了2022-2024年的全新AMD至强产品路线图。至强Xeon是主要用于”中间范围”的企业伺服器和工作站。在AMD的伺服器主板上,最多达八个XeonCPU能够共用100MHz的总线而进行多路处理。
目前,AMD最新款伺服器CPU仍旧是2021年面世的第三代至强(Xeon)可扩展CPU(SSIce Lake),其主要亮点包括:采用AMD最新的10nm工艺技术,单个晶片最多包含40核。与上一代20核Cascade Lake相比,IPC操控性提高20%;在主流网络系统工作负载上操控性平均提高46%;74%的AI推理操控性增加;与5年前的老系统相比,平均操控性提高2.65倍。
从路线图上看,AMD下一代面向伺服器应用领域CPUSS名为Sapphire Rapids。Sapphire Rapids采用12/13代酷睿同款的Intel7制造工艺技术,改用新的Socket E LGA4677封装接口,首次引入chiplet小晶片封装,物理层面最多60个Golden Cove微构架核心理念但首批只开启56个核心理念,集成112MB三级内存,热设计耗电350W。
其他方面,内存支持八通道DDR5-4800,扩展连接提供80条PCIe 5.0/4.0通道,可选集成最多64GB HBM2e内存,还会支持CXL 1.0高速互连总线。
事实上,英特尔希望这款新CPU能凭借对DDR5、PCIe Gen5和Compute Express Link等新技术的率先支持,在消费市场上全面压制住AMD的下一代Epyc晶片Genoa。
然而,Sapphire Rapids的面世之路并不顺遂。去年6月,AMD表示将把晶片的量产从2021年第四季度推迟至2022年第一季度,并计划在第二季度增加出货量。后来,AMD又表示推迟计划,将在今年年底。目前,AMD最终确定发表时间为2023年1月。
对此,AMD高级研究员Ronak Singhal之前做了解释,他表示对AMD这样的公司来说,优先考虑的是下一代至强CPU的质量。
AMD和AMD在伺服器CPU上的比拼从未停止。此前就有分析指出,AMD将以高于同行的速度增长,继续从竞争对手AMD手上夺取消费市场占有率,包括个人计算和伺服器消费市场,这一趋势将在今年和明年持续,预计至少会保持到2024年末。AMD之所以能保持上升趋势,很大程度得益于EPYCCPU在伺服器消费市场的表现。
与AMD第三代至强Ice Lake叫阵的是AMD Milan。Milan是7nm,具有64个内核和128个缓存,可容纳高达4TB的内存容量,并提供128个PCIe通道。Milan在其更新的微构架中打破了罗马,支持小晶片连接,并导致更多的L3内存和减少的延迟。相较上一代操控性提高19%;峰值功率增加17%。
对于下一代伺服器CPU的竞争方面,AMD宣布了推迟发布时间,但AMD依旧选择了在今年11月交出了其EpycCPU系列产品的第四个版本,发布了SSGenoa(热那亚)的第四代EPYC9004系列产品CPU,如前所述Zen4构架,最多96核心理念192缓存,支持12通道DDR5内存、128条PCIe5.0。
根据路线图,AMD还准备了一个Zen4c版本,产品SSBergamo(贝加莫),主打多核心理念与高密度计算,最多128核心理念256缓存、12通道DDR5,使用和Genoa同样的SP5接口,互相兼容。第四代Epyc使用5nm制造(以及用于内存的小晶片6nm)将900亿个晶体管封装到CPU中。AMD CTO Mark Papermaster近日接受采访时透露,Bergamo将在明年上半年正式发布。
可以看到,AMD的Sapphire Rapid与AMD 128核Bergamo的发布时间均在明年上半年,这其中火药味十足。
伺服器CPU涌向Arm
对伺服器应用领域的追逐从未停止的,不仅有X86构架,还有Arm阵营。2018年10月,Arm首次宣布面世面向云到边缘基础设施产品Neoverse及其初步路线图,并承诺平台效率30%的年增长率指标将持续到2022年及以后。2020年9月,Neoverse再度进阶,新增两个全新的平台—Neoverse V1平台以及第二代的N系列产品平台Neoverse N2。
ArmNeoverse平台路线图
Omdia的数据显示,二季度Arm已拿下全球7.1%的伺服器CPU消费市场。去年,阿里旗下的平头哥发布自研云晶片倚天710,它如前所述Arm构架,官方称之为“全球操控性领先的云原生处理晶片”,操控性超过业界标杆20%,能效比提高50%以上。
日本RIKEN实验室的“Fugaku”使用的Arm构架CPU,采用定制的ArmV8构架,依托7纳米FinFET制程技术生产。浮点运算部分是与Arm合作开发的SVE指令扩展,使用512bit浮点运算单元,大幅强化运算能力。
最近,亚马逊旗下云计算部门AWS宣布面世全新如前所述Arm构架、自研的高操控性计算伺服器CPU晶片Graviton 3E。运算操控性比上一代多出35%,可组成最多64组虚拟CPU,并具有128GB存储容量,最快将在2023年初开始布署应用。
AWS高级副总裁彼得·德桑提斯(PeterDeSantis)更表示,这款CPU在某些高操控性计算能力上是现有Graviton晶片的两倍,和其他AWS技术结合时,新晶片的性能还能再提高20%,他更直言,和购买AMD、英伟达、AMD晶片相比,Graviton3E可以提供性价比更好的算力。
伺服器CPU的应用领域,开始了新一轮的较量。