2018 年诺贝尔奖得主 William D. Nordhaus 在《排序过程》该文中对INS13ZD展开表述:“INS13ZD是电子设备根据外部状况的发生改变,每秒钟可处置的重要信息统计重要信息量”。INS13ZD是电子设备处置统计数据的潜能,INS13ZD基础设施的使用工作效率,单厢影响到云服务供应商的创新潜能和利润潜能。作为INS13ZD基础建设的核心理念电子设备,伺服器分担着排序的巨大作用。
从亚洲地区上看,Synergy Research 的统计数据显示,2021 年亚洲地区在互联网系统 IT 硬体和应用领域软件上的开支比 2020 年快速增长了 10%,其中,公有云服务供应商云基础建设开支(含伺服器、储存、互联网、安全、应用领域软件)快速增长了 20%。云服务供应商竭尽全力对其互联网系统展开大批投资, 以满足用户顾客市场需求。
从国际统计数据子公司(IDC)正式发布的《2021年第三季度我国伺服器消费市场跟踪调查报告》上看,2021 年第三季度我国 x86 伺服器消费市场总收入规模为 456.63 亿元,销售额 114.4 万部,环比快速增长 4.4%;2021 年年内我国 x86 伺服器消费市场销售额环比快速增长 6.9%,总收入环比快速增长 10.5%;美国、我国分别占亚洲地区消费市场的 37%、33%。
特别是新冠禽流感引起圣戈当斯区市场需求爆发式快速增长,云服务供应商的伺服器订货市场需求竭尽全力减小,从 IDC 的统计数据中可以窥见,互联网子公司仍然是 2021 我国伺服器消费市场快速增长的主要推动力,名列前三的互联网子公司腾讯、腾讯、二进制颤动、快手、腾讯占有了互联网消费市场 70% 以上的交易额。
当 5G、云排序、人工智慧、轻工业互联网等情景逐次成形,下层应用领域情景发生改变了下层硬体基础,排序、储存、互联网构架的插值升级换代和调整结合,对伺服器产品的型态提出了更高的要求,比如说提高排序密度,通过高速互联技术提高集群的扩展性,通过高度集成化设计、模块化和冗余设计简化交付部署流程。
1、多样化情景化市场需求催生了“伺服器定制化”,云服务供应商通过自研伺服器丰富产品矩阵,覆盖通用排序、异构排序、储存,为云上业务提供高效INS13ZD。
一方面,在数字化不断涌现的新情景中,定制化伺服器可以使伺服器特性与业务市场需求更加匹配,可以通过高排序密度提供高INS13ZD和能效比,也能针对应用领域环境优化为用户节约成本,譬如定制版本的处置器可以选择独特的主频与内核数量组合,在内核数量相当时获得更高的主频;另一方面,从新冠禽流感爆发以来,云服务供应商不仅能够快速响应,其规模化、定制化和自研潜能也可以支撑各项新型服务,及时满足用户顾客市场需求。因此,云服务供应商以自研伺服器为抓手,将新的技术应用领域于云伺服器来适配云端业务情景,通过完善从下层到应用领域层的自研技术体系,不断优化硬体基础建设提高INS13ZD工作效率。
2、2021 年,从传统的 PC 到伺服器,从芯到云,信创产业化进程正在加速,安全和排序正在深度结合。
在 “数字我国万里行”的实地考察中我们发现,信创伺服器作为产业数字化的下层技术基础建设,未来市场需求空间正全面打开。比如说我国电子信创云基地主要服务于党政、央企和金融顾客的数字化转 型,“数字大理”、天津西青已全面开启全国产化、全信创基座的数字化转型之路。
在云南大理苍洱云互联网系统,以 PKS 技术体系为基础,部署的长城擎天 DF723 伺服器均为“大理造、大理用”,基于 Arm 构架,采用国产化中文 BIOS 固件和操作系统,核心理念多、储存容量大,支持批量部署、集群管理。
3、在国家提出“双碳”战略后,低碳高效成为共识。根据应用领域情景和工作负载的不同,选择适合的INS13ZD单元(如 CPU 和 GPU)可以提高互联网系统的能源使用工作效率,而INS13ZD市场需求更快速地快速增长也提高了机柜的功率密度,液冷技术将在未来几年中获得更多互联网系统的青睐。
2022 年全面启动的“东数西算”工程则在全国范围内优化INS13ZD的布局,通过建设高效集约、普适普惠的新型基础建设,推动计INS13ZD的绿色化和均衡发展。
2U与1U
在这几年来“数字我国万里行”的实地考察过程中,不难发现,2 路 2U 仍是国内伺服器消费市场上的主流规格。IDC 的伺服器消费市场跟踪调查报告也可以证实这一点,按销售额统计:
2018 ~ 2021 年,2 插槽(双路)伺服器占比一直在 88% 上下;同期,机架式伺服器的占比从 80%+ 上升到 90%+,其中 2U 规格又稳定在 70% 左右的高位。双路伺服器更受欢迎这一点在INS13ZD篇已经提过,背后的一些原因 2U 也适用。但是,另一个大消费市场却并非如此——在美国,1U 与 2U 的销售额很接近,有时还能略占上风。
相对我国消费市场,1U 在美国消费市场上更受欢迎;相对美国消费市场,我国消费市场上 2U 更受欢迎。这个差异涉及的因素比较多,此处重点从国内互联网系统的基本情况与2U 伺服器的特点展开。
1.排序密度
同样是双路配置, 1U伺服器的排序密度可以达到 2U 伺服器的 2 倍。但是,放大到整个机柜乃至互联网系统的层面,1U 伺服器能不能体现出排序密度上的优势,还要看单机柜的供电潜能(单柜功率)。
在这样的机柜里,1U 伺服器其实体现不出密度上的优势
普遍而言,在我国的超大规模统计数据互联网系统里,单柜功率 7.2 ~ 8.8 千瓦(kW)已经是比较高的水平。以近年 2U 双路伺服器的平均负载,这个供电潜能可以支持 16 ~ 22 台。大型互联网和云排序子公司偏好更高大些的机柜,譬如 2021 年数字我国万里行考察过的腾讯云怀来瑞北互联网系统使用 52U 机柜,UCloud(优刻得)乌兰察布云基地使 用 47U 和 54U 的机柜,算上留给交换机的空间,也足以容纳下这么多 2U 伺服器了,改用 1U 伺服器并不能真正的提高密度,反而会减小伺服器自身散热设计上的挑战。
2.通用性
通用伺服器的典型布局,可以从前到后划分为三大功能区域,依次是储存、CPU 和内存、扩展和 I/O。作为维持伺服器正常运转的基础,系统散热风扇位于储存区和 CPU 区之间,电源通常在 I/O 区的一边或两边。
在没有每 U 排序密度压力的前提下,2U 伺服器在上述几个部分,比 1U伺服器有明显的优势,有时还不止两倍那么简单:
前面板区:2U 伺服器可以插 25 个(常见 24 个)2.5 英寸小盘(SFF)或 12 个 3.5 英寸大盘(LFF),1U 伺服器分别为 10 个或 4 个,即 2.5 ~ 3 倍的关系;风扇:2U 伺服器通常配 4 个 80mm 或 6 个 60mm 风扇,直径明显比 1U 伺服器用的 40mm 风扇大得多,可以用相对低的转速提供更大的风量,能效上有优势;CPU:可以使用更为高大的散热片,在风冷环境中能支持更大功率的 CPU;扩展和 I/O:具有更多的 PCIe 插槽,能够较好地支持 GPU……排序、储存、互联网全能,一言以蔽之,2U 伺服器的通用性和扩展潜能,比 1U 伺服器好很多。
自研与信创
多样化、情景化市场需求促进了伺服器定制化,在各种特定的情景中,通用伺服器 的面面俱到反而成为制约因素,而定制伺服器可以根据明确的应用领域市场需求针对性 强化一两个方面,通过合理的取舍,优化“长板”,弱化甚至去掉不需要的“木 板”,在提高目标工作效率的同时,降低不必要的成本。
2020 年春节过后, 面对禽流感期间的圣戈当斯区复工复学潮,腾讯会议在 8 天内实现100 万核的快速扩容,伺服器资源全部由腾讯云星星海 SA2 云伺服器提供支撑,迅速捧红了腾讯云深度自研的“星星海” 伺服器。
腾讯云星星海 AMD 通用 2 路伺服器,注意前仓没有布置硬盘位
基于 AMD 第二代 EPYC 处置器的星星海 SA2 是腾讯云首款拥有完全自主知识产权的伺服器,也是“腾讯第一款真正为云而生的伺服器”。SA2 是腾讯自研服务器品牌星星海的第一款产品(AMD 通用 2 路),该品牌随后又推出了英特尔 4 路和 2 路(两种不同构架的第三代至强可扩展处置器)伺服器、异构排序伺服器、高密储存等产品,并在持续壮大中。
这款 AMD 平台的通用 2 路伺服器,充分展现了 2U 伺服器在散热设计上的优势。它采用了 T 型热管散热器,即利用热管扩大 CPU 散热片的总面积,CPU 正上方的主散热片通过热管连接到前方(冷通道方向)并列布置的两个较小的远程散热片(remote heatsink)上,3 个散热片和热管构成 T 型布局,也称“羊角”散热片。2U 伺服器的 CPU 散热片本就高大,再经热管扩容,散热潜能进一步提高,配合 6 个 6056 高工作效率风扇和系统风道管理,可以满足用户 2000 瓦系统散热市场需求,能支持 2 个 300 瓦(W)TDP 的 CPU。
根据腾讯的统计数据,T 型热管散热器方案,可使 CPU 温度降低 8℃,风扇节能 50% 以上。星星海伺服器在重载下测试,风扇功耗降低 40 瓦以上,系统功耗占比低至 2.14%。再配合高工作效率的 80 PLUS 铂金(Platinum)供电单元(PSU)等节能手段,“以 500 台集群为例,星星海伺服器每年可节电 50 万度”。
随着 AMD 第三代 EPYC 处置器的正式发布,腾讯云推出全新一代星星海自研伺服器,除了支持新 CPU 带来的新特性之外,风冷散热潜能也提高 22%,并兼容液冷设计,“能够将碳排放降低 8%”。
倚天 710 双路 1U 伺服器
Arm 方面,阿里云在 2021 杭州·云栖大会上展出了搭载倚天 710 处置器的磐久伺服器,为 1U 双路规格。而在 Arm 伺服器 CPU 供应商 Ampere Computing(安晟培半导体)的官网上,可以看到富士康(Foxconn)、技嘉(GigaByte)、超微(Supermicro)、纬颖(Wiwynn)和浪潮(Inspur)的多款伺服器平台,2U 的数量大约是 1U 的两倍,其中纬颖的 Mt. Jade 贡献给了开放排序项目(Open Compute Project,OCP)。总的来说,这些伺服器有两个特点:一个是可以同时支持80 核的 Altra 系列和 128 核的 Altra Max 系列;一个是单路的型号比例较大,原因在INS13ZD篇已有介绍。
云南大理苍洱云的互联网系统,部署了很多基于飞腾 CPU 的长城伺服器,我国长城甚至在大理下关机场附近开设了伺服器生产线。我国长城的 2U 双路伺服器擎天 EF860 基于国产飞腾腾云 S2500 处置器,采用国产中文固件和操作系统,最高 128 核,32 个 DDR4-2933 内存槽,最大系统内存容量 2TB。EF860 的后部 I/O 扩展模块化设计颇具亮点,最多支持 9 个标 准 PCIe 3.0 设 备,可容纳 2 个全宽全高 GPU 卡,2 个 OCP 3.0 插槽用于安装 10G/25G OCP 网卡模块。