AI 服务器价格涨近 20 倍!带火哪些芯片?百度CEO李彦宏:大模型即将改变世界 人类需要与机器共生而非二元对立优酷剧集沉浮许留山关店,只是港式甜品没落的缩影机器人+AI,乐森发布全新擎天柱、大黄蜂消费级娱乐机器人“大脑解码技术”实验成功,大模型越来越疯狂了日系车不能说的优惠,这里我来说宝德暴芯x86处理器现身GeekBench 5:坐实就是Intel i3-10105升级天玑8200处理器:vivo S17 Pro现身Geekbenchvivo S17山海青图赏:星辰闪烁,共赴山海AI不实消息导致一厂商股价闪崩 百度李彦宏回应:可能被人曲解引用iQOO Neo8 Pro图赏:赛点来临,定制专属的胜利奥义一年饮冰,难凉热血:一份普通的陌生人社交产品开发笔记Nreal宣布更名XREAL 多项产品将重磅升级Mate 50、P60齐降价 最高降1000元!华为手机为销量拼了:今年安卓阵营之光优派推出新款27寸4K Mini LED显示器:支持96W反向充 2999元

2023-05-27 0 354

ChatGPT 大火后,各大科技企业纷纷加码 AI 大数学模型,作为通用的INS13ZD晶片,英伟达的高端 GPU 开始供不应求。A100 产品价格从去年年底开始暴涨,至今涨幅接近 40%,连上一代 V100 的产品价格也被炒到近 10 万元,中国plus版 A800 更是相当紧缺。

AI 伺服器的涨价很大程度上与这波行情有关,作为INS13ZD的基础设施,无论是训练,却是数学模型推理,AI 伺服器都是生活必需品,且往往需要的不止是两台两台。那么 AI 伺服器是甚么?跟一般伺服器有甚么区别?英伟达的 GPU,为何让 AI 伺服器大涨特涨?除了 GPU,AI 伺服器里还用到甚么样晶片?甚么样晶片能够跟着受益?

01

甚么是伺服器?

如何分辨 AI 服务器?

AI 伺服器由传统伺服器演变而来。伺服器,几乎是办公室打工人手里笔记本电脑的杜博韦,它属于高操控性计算机,存储、处置着互联网上 80% 的统计数据、信息,被称为互联网的灵魂。

如果自动控制、笔记本、智能手机等互联网终端是分布在家庭、办公场所 、公共厕所的移动电话,那么伺服器就是邮局的路由器,把网友们共享的互联网游戏、网站,企业的统计数据等存放其中,又可分为文件伺服器、云计算伺服器、资料库伺服器等。

:ecl-ips.com

相比笔记本电脑,伺服器在稳定性、安全性、操控性等方面都要求更高,毫不夸张蔡伯介,每月双十一若不是有足够牛 X 的伺服器,购物啤酒节会变成 ” 互联网错误 ” 或 ” 请稍后再试 ” 的朋友圈节。

毕竟短短几分钟内,就要处置剁手党们发送到B2C伺服器的几十亿交易订单,再发送到用户进行响应,统计数据流量到达颠峰(2018 年,天猫双 11 支付最大值为 25.6 Aigueperse / 秒,资料库处置最大值为 4200 亿次 / 秒),每月对伺服器的操控性都是一次星毛。

这操作放在 1964 年问世的第一代伺服器System/360 身上大概是无法想象的,那时无论互联网却是并行计算都没问世,当年 IBM 面世它的时候,却是在协助美国太空总署建立阿波罗 11 号的资料库,助力人类文明太空梭。它每秒可计算 100 亿次,产品价格高达 200-300 万美元两台,体积庞大,很多银行采购这样的 IBM 小型机进行投资。

很快在 1965 年,伺服器的产品价格被打了下来,这年 DEC 公司开发了 PDP-8 小型机,掀起了小型机革命。90 年代初,互联网兴起,RISC 架构的伺服器如日中天,英特尔 x86 架构的伺服器让很多小企业甚至是个人用户都能买得起,不到 20 年的时间,英特尔迅速统治了各类计算机市场。

在 AI 伺服器之前,伺服器大致经历了 Wintel 时代、云计算时代两个时代的演变,随着新一代人工智能技术的到来,摩尔定律的 ” 到头 “,CPU 的物理工艺和核心数接近极限,单靠 CPU 提供INS13ZD的传统伺服器,很难满足 AI 对密集型计算的需求。

机器学习和人工智能代表了一个基本的新架构,人工智能需要专用的基础结构进行承载和支撑,AI 伺服器从此应运而生。

谷歌、BAT 等企业面对海量的统计数据,打造一座统计数据中心时,通常都要配备成千上万台伺服器。以用到 A100 的 ChatGPT 为例,其部署的大INS13ZD计算,每个 GPU 或大INS13ZD AI 晶片的INS13ZD大于 100TFLOPS。这时就要给伺服器们上更高的配置,强强联手,搭载 GPU 或者其他类型的 AI 晶片,比如 GPU 就非常擅长做一些 CPU 做不了的密集型统计数据运算。

AI 伺服器和普通伺服器最大的区别,就是 AI 伺服器通常打组合拳,比如CPU+GPU、CPU+TPU、CPU+ 其他的加速卡等,CPU 在 AI 伺服器中,彻底卸下了INS13ZD的包袱,当当领导指挥下就行。

02

两台 AI 伺服器涨价近 20 倍,

凭啥?

两台 AI 伺服器的产品价格,从去年到现在涨了近20 倍。而两台普通伺服器,都换不到 AI 伺服器里的 8 个 GPU,产品价格上相形见绌。大家都在统计数据中心里躺着,凭甚么 AI 伺服器这么金贵,产品价格疯涨?

在 AI 伺服器中,CPU 退居幕后,GPU 等 AI 晶片在其中充当主角做大量运算,INS13ZD无止境,事实上,AI 伺服器通常有且不仅只有一块 GPU

虽然 FPGA、各类 ASIC 晶片也可以做大量运算,但 GPU 强大的通用性使得它更吃香。IDC 统计数据显示,2021 年上半年中国人工智能晶片行业中,GPU 显著成为实现统计数据中心加速的首选,占有 90% 以上的市场份额。

CPU 方面,AI 伺服器一般仅搭载 1-2 块 CPU,GPU 的数量就占上风了,根据 GPU 数量的不同,AI 伺服器进一步分为四路、八路和十六路伺服器,搭载 8 块 GPU 的八路 AI 伺服器最常见。

AI 大数学模型分为训练和推理两种,训练数学模型要求的INS13ZD很高,推理相对要求低一点,但大数学模型总有一天会训练出来,推理却永无止境,比如 ChatGPT 与我们对话就是推理的过程,从INS13ZD总需求上来看,推理可能甚至要高过训练。

INS13ZD的高低最直观的影响就是速度,谁也不想训练一个数学模型要耗上个把年,等 AI 回答个问题,等到人老珠黄。在这个内卷的时代,谁快,谁就有饭吃。

有研究机构测算,以 GPT-4 为例,为满足最高 75352 PFlop/s-day 的INS13ZD,在 5 PFlop/s-day 的计算速度下,20 天完成,需要采购 754 台浪潮 NF5688M6 伺服器(2 CPU + 8 GPU),缩短至 15 天,就要 1005 台,缩短至 5 天完成,就要多达 3015 台!

浪潮 NF5688M6 搭载了两颗 intel ice lake CPU,8 颗英伟达 A800GPU,京东售价约 105 万,按照 CPU 约 5.3 万 / 颗,GPU 约 10.4 万元 / 颗计算,CPU 和GPU 的价值量占比为 10.10% 和79.24%。

说白了,玩家为了大数学模型的运算效率,得加钱,氪金充值。

放在整机上,GPU 的成本却是遥遥领先,无人能敌。普通伺服器和 AI 伺服器的 BOM 表显示,AI 伺服器单机平均售价(ASP)比普通伺服器要高出 5 倍,AI 伺服器对 AI 晶片如英伟达的 A100 需求大,而普通伺服器甚至都不需要用到专业的 AI 晶片。

普通伺服器最贵的 CPU,单机 ASP 14400 美元,不到 AI 伺服器中 GPU 96000 美元的四分之一,而普通服务器 40000 美元的单机总成本 ASP,也不及 AI 伺服器 GPU 这一项成本的一半。讲个笑话,两台普通伺服器,都换不到八路 AI 伺服器里的 8 个英伟达 A100。

这就是 AI 伺服器容易产品价格疯涨的原因,背后成本占比高,单价昂贵的英伟达 A100 等 GPU 几乎成了决定性因素。

挖矿潮过去后,英伟达显然嗅到了生成式 AI 热潮的铜臭味。有业内人士表态,早在去年 6 月开始,英伟达就已经宣布上调 A100 产品价格,涨幅在 20% 左右,由于美国禁令,英伟达plus中国的 A800 版本在 ChatGPT 爆火之前已经出现了涨价,导致市场上出现了众多炒货行为。

虽然国内有宏碁、腾讯、阿里等自研的 AI 晶片,也有部分伺服器厂商使用这些晶片,但整个 AI 伺服器市场,英伟达却是独占鳌头的那个,所以英伟达就成了 AI 伺服器这条涨价线的源头。

ChatGPT 的大火,导致英伟达高端 GPU 产品价格一路上涨。有代理商透露,英伟达 A100 产品价格从去年 12 月开始上涨,截至今年 4 月上半月,5 个月产品价格累计涨幅达到 37.5%;同期 A800 产品价格累计涨幅达 20.0%。

GPU 的持续缺货,进一步影响 AI 伺服器厂商的出货,连带着下游云服务厂商,AI 企业都要受到影响。今年以来,AI 伺服器产品价格大涨的消息不绝于耳。

英伟达也向台积电追加订单,但 GPU 需要的先进制程产能毕竟有限,因此交货周期却是没有幸免拉长,之前拿货周期大约为一个月,现在基本都需要三个月或更长。甚至,部分新订单 ” 可能要到 12 月才能交付 “。

一些云服务厂商开始缩衣减食,严格限制内部对 GPU 的使用量。有厂商表示,” 后悔买少了。” 颇有种汽车缺芯时那种差之一 ” 芯 “,失之万台的感觉。

03

AI 伺服器

还带动了甚么样晶片需求?

无论 GPU 如何带动 AI 伺服器涨价,本质上是 AI 市场需求的体现,就像前两年汽车缺芯一样。这种需求的出现往往伴随的不只是一种晶片的激增。

中金测算,AI 伺服器核心组件按价值量由高到低依次为GPU、DRAM、SSD、CPU、网卡、PCB、高速互联晶片和散热模组等,按 7.5 万台训练型和 17.5 万台推理型伺服器测算,对应市场规模分别为 240 亿美元、88 亿美元、48 亿美元、34 亿美元、5 亿美元、3 亿美元、2.5 亿美元和 1.5 亿美元。

金点睛

而除了 GPU、存储这两个价值量提升比较大的晶片外,接口、网卡、散热、PCB 等的价值量都有提升。相较普通双路伺服器,AI 伺服器核心器件单机价值量提升倍数由高到低依次为GPU(24x)、DRAM(5.3x)、板内互联接口晶片(3.3x)、电源管理(3x)、散热(3x)、PCB(2.4x)、网卡(2.2x)和 SSD(2x)。

排在 GPU 之后,存储晶片,貌似第一个活过来了。

存储晶片(成本占比近 30%)

据 Open AI 测算,2012 年以来全球头部 AI 数学模型训练INS13ZD需求 3-4 个月翻一番,每月头部训练数学模型所需INS13ZD增长幅度高达 10 倍,远超摩尔定律的增长速度,GPT-3 相较 GPT-2 在统计数据存储端从百 G 提升至 40T,在存储量上有约 100 倍的提升。

统计数据中心成为存储增长的重要引擎。TrendForce 最近将 32GB DDR5 DRAM 的 Q2 平均固定交易价格预估值从 75 美元调升至 80-90 美元。分析师指出,应用于 AI 伺服器的 128GB DDR5比 64GB DDR4 贵上10 倍,订单仍持续涌进。

美光的统计数据显示,两台 AI 伺服器DRAM 使用量是普通伺服器的 8 倍,NAND 是普通伺服器的 3 倍。此外,HBM(高带宽内存)也逐步提高在中高端 GPU 中的渗透率,自 2021 年以来在统计数据中心应用中快速增长,2023 年 2 月以来,HBM3 规格 DRAM 产品价格上涨。TrendForce 预测,2023-2025 年 HBM 市场 CAGR 有望成长至 40%-46% 以上。

根据美光测算,统计数据中心整体存储需求约占存储总市场的 31%,2021 年统计数据中心 DRAM 和 NAND 分别约 300 亿美元和 200 亿美元,预计到 2025 年分别增长至 500 亿美元和 300 亿美元,预计到 2030 年分别增长至 1000 亿美元和 700 亿美元,2021 年 ~2025 年合计 CAGR 为 14%。随着统计数据量的大规模增长,存储设备在统计数据中心采购的 BOM 中占比进一步提升,美光曾提及,目前存储晶片在统计数据中心采购中比例约为40%,未来预计将提升至 50%。

CPU(成本占比 7%)

x86、ARM、RISC-V 是 CPU 的三大技术架构,在伺服器市场,x86 CPU市占率超 90% 处于主导地位,而英特尔是 CPU 市场,特别是伺服器领域是绝对的领导者。

Mercury Research 最新公布的统计统计数据显示,2023 年第一季度,英特尔继续在台式 PC、移动和统计数据中心 CPU 市场占据主导地位,在整个 X86 统计数据中心市场,英特尔市场份额为 74.2%,AMD 市场份额为 25.8%。

伺服器用的 CPU 从制程工艺上而言可能都落后于个人笔记本电脑用的一代,但售价往往是其 10 倍以上。但两者逻辑不同,服务器讲究后台运算,它看重功耗和稳定性,以此通过更多的核心数,更大的缓存来提高INS13ZD,而个人笔记本电脑强调影音娱乐体验,频率要求高。

接口晶片(3.3 倍的价值量提升)

PCIe 开关或 PCIe 路由器,主要作用是实现 PCIe 设备互联,PCIe Switch 晶片与其设备的通信协议都是 PCIe。根据 QYResearch(恒州博智)的统计及预测,2021 年全球 PCIe 晶片市场销售额达到了 7.9 亿美元,预计 2028 年将达到 18 亿美元,年复合增长率(CAGR)为 11.9%。博通、微芯科技和祥硕科技为领域龙头。目前全球仅少数几家公司具备 PCIe Switch 晶片技术,核心厂商主要包括博通、微芯科技和祥硕科技三家,共占有全球约 58% 的份额。

数模信号混合晶片,Retimer,功能主要为重新生成信号。在 AI 伺服器中,GPU 与 CPU 连接时至少需要一颗 Retimer 晶片来保证信号质量。很多 AI 伺服器都会配置多颗 Retimer 晶片,例如 Astera Labs 在 AI 加速器中配置了 4 颗 Retimer 晶片。目前谱瑞、Astera labs、澜起科技是 PCIe Retimer 蓝海市场中的三家主要厂商,占据领先地位。

高速串行接口晶片,针对 AI 伺服器中 PCIe 带宽限制对于 GPU 间通信带来的阻碍,以 NVIDIA NVLink 为代表的高速ress Link)等也为伺服器内部的高速串联提供了解决方案。

内存接口晶片,按功能分为两类,分别是寄存缓冲器(RCD)以及统计数据缓冲器(DB)。内存接口晶片是技术密集型行业,需要通过 CPU、内存和 OEM 厂商的全方位严格验证后,方可进行大规模使用,新的玩家很难介入。在 DDR5 世代,全球只有三家供应商可提供 DDR5 第一子代的量产产品,分别是澜起科技、瑞萨电子(IDT)和 Rambus。

电源模块相关晶片(PMIC 晶片,3 倍的价值量提升)

伺服器内部主要使用模块化的开关电源,具有体积小、功率密度高、转换效率高和噪声低等优势。中金预计全球伺服器电源模块的市场规模约 150 亿元。全球主流电源厂商包括台达电子、艾默生和光宝科技等,国内中国长城规模领先。截至目前,我国模块电源商有上百家,格局分散,CR10 小于 60%。

参考资料:

[ 1 ] 到底甚么是 AI 伺服器:世间本无 AI 伺服器,胡克

[ 2 ] AI 浪潮之巅系列:伺服器,INS13ZD发动机,中金点睛

[ 3 ] 行业深度:AI 伺服器中到底需要多少 PCB,国金电子

晶片超人花姐粉丝福利

扫码加好友

领取超强 AI 伺服器资料包

聊行情、买卖晶片、谈合作

相关文章

发表评论
暂无评论
官方客服团队

为您解决烦忧 - 24小时在线 专业服务