原副标题:AI伺服器:烈火烹油
1、生成式人工智慧驱动力亚洲地区AI伺服器消费市场加速快速增长
做为人工智慧产业发展产业发展发展的核心理念基础建设,亚洲地区AI伺服器消费市场加速快速增长。依照IDC统计统计数据,2021年亚洲地区AI伺服器消费市场体量达至156.3万美元,环比快速增长速度为39.06%,得力于人工智慧各金融行业龙头应用领域路径市场需求的坚挺快速增长,AI伺服器消费市场快速增长速度从2020年新冠禽流感的压制下与此同时实现了加速恢复正常,2018年至2021年的年A43EI235E快速增长速度为25.01%,与此同时实现了较快快速增长。IDC预计今年,到2026年亚洲地区AI伺服器消费市场体量将达至347.1万美元,2021年至2026年的年A43EI235E快速增长速度为17.30%,将竭尽全力维持相较较快快速增长的势头。与此同时,亚洲地区AI伺服器的消费市场体量占总体伺服器市场体量的比率将从2021年的15.25%提升至2026年的21.69%,AI伺服器消费市场体量快速增长速度低于总体伺服器消费市场体量的快速增长速度,正式成为亚洲地区伺服器金融行业维持高增长快速增长的核心理念推动力。
生成式人工智慧将正式成为亚洲地区AI服务器消费市场加速快速增长的新势能。随著以GPT数学模型为代表者的的生成式人工智慧大数学模型的加速插值,和以ChatGPT、Microsoft 365 Copilot等为代表者的生成式人工智慧应用领域使用率的剧增,生成式人工智能对AI伺服器的市场供应量已经开始井喷式快速增长。依照IDC统计统计数据,2022年预计今年亚洲地区生成式人工智慧对AI伺服器的追加市场需求体量为8.2万美元,预计今年到2026年其追加市场需求体量将达至109.9万美元,2022年至2026年的年A43EI235E快速增长速度高达91.34%,前两年其它类别AI伺服器的年A43EI235E快速增长速度布季6.15%。预计今年生成式人工智慧对AI伺服器的市场需求占比将从2022年的4.21%加速提升至2026年的31.66%,正式成为亚洲地区AI服务器消费市场加速快速增长的新势能。
逻辑推理型伺服器将渐渐正式成为亚洲地区AI伺服器的非主流。在生成式大数学模型产业发展发展晚期,AI伺服器市场需求以数学模型体能训练居多,因此体能训练型伺服器占有消费民营企业话语权。随著先期生成式AI应用领域的加速产业发展发展,AI伺服器将主要就满足用户统计数据的预测及数学模型输入市场需求,因此逻辑推理型伺服器将渐渐正式成为消费市场非主流。依照IDC统计统计数据,2021年亚洲地区AI伺服器消费市场中57.33%为体能训练型伺服器,但预计今年在2024年逻辑推理型伺服器消费市场体量将首度超越体能训练型伺服器,在2026年逻辑推理型伺服器的消费市场占比将达至53.01%,与体能训练型伺服器的份额差距将持续拉开。
AI云计算及边缘计算将正式成为亚洲地区AI伺服器快速增长速度更快的部署方式。一方面,由于生成式AI大数学模型的模型参数越来越大,其体能训练所需的AI算力已经开始加速快速增长,传统本地部署的算力中心越来越难以满足用户大数学模型的算力市场需求,导致基于云化部署的AI云计算服务市场需求已经开始加速快速增长。另一方面,随著各类物联网设备端生成的统计数据量快速增长速度超过了网络带宽的快速增长速度,在更接近统计数据生成的地方直接进行统计数据运算和预测的市场需求已经开始加速快速增长,这导致基于边缘计算的AI伺服器与此同时实现更快的快速增长速度。依照IDC统计统计数据统计数据,2021年至2026年间,预计今年基于本地集中部署的、云化部署的和边缘计算端部署的AI伺服器消费市场体量的年A43EI235E快速增长速度分别为8.2%、19.8%及26.1%;预计今年2026年亚洲地区AI伺服器中有56.6%基于云化部署,是最非主流的部署方式,20%基于边缘计算部署,是快速增长速度最快的部署方式。
加速计算AI伺服器更符合大体量AI运算的市场需求,正式成为AI伺服器的非主流选择。加速计算AI伺服器是指拥有一个或多个协处理器的AI伺服器,包括GPGPU、FPGA或ASIC协处理器,其更适合处理体量越来越大、算法越来越复杂的深度学习AI数学模型,因此已经正式成为目前AI伺服器的非主流选择。主要就使用CPU进行运算的非加速计算AI伺服器的消费市场体量仍将有一定快速增长,但其主要就用于小型人工智慧数学模型的逻辑推理和部分体能训练负载。依照IDC统计统计数据,2021年亚洲地区AI伺服器中加速计算AI伺服器消费市场体量为91万美元,2026年将快速增长至245万美元,期间年A43EI235E快速增长速度为22%,前两年非加速计算的AI伺服器消费市场体量的年复合快速增长速度布季9.3%。
多因素驱动力下,中国AI算力产业发展发展迎来黄金时期。随著一系列支持性政策的陆续出台、海量统计数据的增加、算法数学模型的复杂化和应用领域场景的深入产业发展发展,中国AI算力体量已经开始持续扩大。依照IDC统计数据,以半精度(FP16)测算中国的AI算力体量,2021年中国AI算力体量达至155.2每秒百亿亿次浮点运算(EFLOPS),2022年达至268.0 EFLOPS,环比快速增长72.7%,预计今年到2026年体量将达至1271.4 EFLOPS,2021年至2026年间中国AI算力体量的年A43EI235E快速增长率达至52.3%,将与此同时实现加速快速增长。做为参考,以双精度(FP64)测算通用伺服器算力,2021年中国通用算力体量为47.7 EFLOPS,预计今年2026年将提升至111.3 EFLOPS,2021年至2026年间的年A43EI235E快速增长速度布季18.5%。
现阶段中国AI伺服器消费市场快速增长速度领跑亚洲地区,未来仍有较大提升空间。我国在AI产业发展产业发展发展晚期更注重算力硬件建设,依照IDC统计统计数据统计数据,2021年中国AI伺服器消费市场体量达至59.2万美元,环比快速增长68.2%,2018年至2021年的年A43EI235E快速增长速度高达52.14%,为亚洲地区快速增长速度的2倍以上,快速增长速度领跑全球;中国AI伺服器占亚洲地区消费市场之比从2018年的21.01%提升至2021年的37.88%,达至3成以上,是亚洲地区AI伺服器消费市场与此同时实现加速快速增长的主要就驱动力者。IDC预计今年未来中国AI伺服器消费市场体量仍将维持较为稳健的快速增长势头,预计今年到2026年消费市场体量达至123.4万美元,2021年至2026年间的年复快速增长速度为15.82%。
2、中国厂商在亚洲地区AI伺服器消费市场中处于领军话语权
中国品牌厂商在亚洲地区AI基础建设厂商中处于领军话语权,2021年与此同时实现了最快快速增长速度。依照IDC统计数据,浪潮信息、新华三(紫光股份)、联想是2021年亚洲地区快速增长速度前三快的AI基础建设(即AI伺服器+AI存储合计)品牌厂商。2021年,浪潮信息AI基础建设营收同比快速增长68.3%,消费市场份额从2020年的14.6%跃升至17.8%,位居亚洲地区第一;新华三营收环比快速增长67.6%,消费市场份额从3.3%上升至4.0%;联想营收环比快速增长57.2%,消费市场份额从4.6%上升至5.2%;中国品牌厂商中只有华为因为受到地缘政治因素的影响,其营收环比下降37.9%,消费市场份额从9.4%下降至4.2%。海外品牌厂商中戴尔份额从16.4%下降至15.7%,惠普份额从9.8%下降至8.9%,IBM份额从6.4%下降至4.2%,总体份额呈现下降状态。若单独考虑AI伺服器的消费市场格局,2021年浪潮信息以20.9%的份额登顶亚洲地区AI伺服器消费市场,联想、新华三、华为消费市场份额分别为5.8%、4.0%及2.9%,位列亚洲地区第4、6、7位。
中国消费市场中,浪潮信息占有AI加速计算伺服器消费市场的半壁江山。依照IDC统计数据,2021年浪潮信息的AI加速计算伺服器在中国消费市场营收环比快速增长61.6%,消费市场份额达至52.4%,连续五年以超过50%的市占率稳居金融行业第一;新华三、宁畅、安擎的AI伺服器收入环比快速增长速度分别为419.0%、300.3%、285.9%,是快速增长速度前三快的厂商,消费市场份额分别为7.8%、7.9%、6.8%,均位居金融行业前五名;华为则因受地缘政治影响,其收入下滑了37.1%,消费市场份额下降至7.7%,位居金融行业第四。
浪潮信息:亚洲地区AI伺服器领军企业
浪潮信息与产业发展巨头进行深入合作,为大型互联网厂商提供高质量的AI伺服器。在近10年前,浪潮信息就与亚洲地区算力芯片巨头英伟达及英特尔建立了联合实验室,以探索与此同时实现性能密集型计算负载的并行化。随后,由于阿里巴巴、腾讯、百度、字节跳动等亚洲地区范围内的互联网龙头厂商在语音识别、图像识别等领域对AI加速运算的市场需求开始加速快速增长,浪潮信息开始为互联网巨头进行产品优化设计服务,为其提供了一系列高质量的AI加速卡及伺服器产品。随著中国互联网巨头公司的加速产业发展发展,浪潮AI伺服器的营收体量也维持了加速快速增长状态,使其成长为亚洲地区及中国消费市场AI伺服器的领军企业。
浪潮信息AI计算产品线齐全,可面向客户市场需求加速推动产品插值。浪潮信息可以提供从单机到集群、从边缘计算端到超大体量统计数据中心端的硬件产品组合,且能够依照消费市场市场需求加速推出最新的AI计算产品。其中NF5688是公司面向超大体量统计数据中心推出高性能、高兼容、强拓展的新一代NVLink AI伺服器,其搭载8颗英伟达A800组成的HGX计算模块和2颗第三代英特尔至强处理器,单机AI计算性能达至5 PFLOPS,兼容非主流的x86+CUDA应用领域开发生态,可以满足用户大体量NLP/CV/NMT/DLRM数学模型的体能训练和逻辑推理市场需求。NF5488同样使用HGX计算模块并搭配2颗64核AMD处理器,具备强大的AI体能训练和逻辑推理能力,可用于图像、视频、语音识别、智能客服等典型AI应用领域场景。NF5468则具备更强的硬件兼容性,可依照用户市场需求灵活搭载英伟达、AMD、英特尔、寒武纪、燧原等进口及国产加速卡。NF5448搭载4颗英伟达Ampere架构GPU和2颗AMD CPU,可以为客户提供更低成本的AI计算服务。NE3412则是公司面向边缘计算场景提供的便携式AI伺服器,可以满足用户边缘AI逻辑推理及统计数据迁移等场景的市场需求。
浪潮信息AI计算产品性能突出,在权威性能测评榜单中多次霸榜夺冠。MLPerf是影响力最广的国际AI计算性能基准测评,由图灵奖得主大卫帕特森联合顶尖的学术机构发起成立。MLPerf每年分别组织AI逻辑推理及AI体能训练性能测试各两次,基于目前应用领域最非主流的AI场景赛道分别进行性能测试,涵盖了自然语言处理(BERT)、智能推荐(DLRM)、语音识别(RNN-T)、图像识别(ResNet)、医学影像分割(3D U-Net)、轻量级目标物体检测(RetinaNet)、重量级目标物体检测(Mask R-CNN)及强化学习(MiniGo)共八大类场景。2021年浪潮信息的AI伺服器共在四次测评中的金融行业龙头场景固定任务赛道上获得44项冠军,占有全部项目总数的54.32%;2022年浪潮信息再次获得49项冠军,占有全部项目总数的62.03%;其中在2022年的两次统计数据中心逻辑推理伺服器性能测评中,公司在32个金融行业龙头项目中获得29项冠军,显示出公司产品AI算力在亚洲地区范围内的领先性。
浪潮信息具备软硬一体的全栈AI能力,可为客户提供场景化的AI解决方案。在丰富的AI硬件之上,公司还提供AIStation人工智慧开发平台。该平台可以与此同时实现GPU资源池化,统一调度企业AI计算资源;与此同时还提供完整的AI软件栈和开发流程,AutoML塔尖可以帮助与此同时实现企业级的自动化AI数学模型构建,提升数学模型开发效率;平台也支持TensorFlow、Pytorch等非主流AI框架拓展分布式体能训练,在resnet50做分布式体能训练测试时,其GPU加速比最高可提升90%;其支持通过统计数据缓存功能大幅提升数学模型体能训练效率,依照resnet50测试统计数据,在70任务并发下,AIStation统计数据缓存功能可以帮助数学模型体能训练效率提升72%。基于公司软硬一体的全栈能力,公司可以为智慧医疗、生命科学、自动驾驶等领域提供场景化的AI解决方案。
紫光股份:全面拥抱AIGC,加速崛起的AI伺服器龙头企业
紫光股份全面拥抱AIGC时代,消费市场份额加速提升。紫光股份旗下子公司新华三是国内数字化解决方案的核心理念供应商,在企业级交换机、企业级路由器、x86通用计算伺服器、GPU加速计算伺服器等众多核心理念产品品类上市占率位居国内前三名,全面参与智慧计算、智能存储、智能联接、网络安全各环节消费市场竞争。公司与英伟达较早便建立了合作伙伴关系,随著AI应用领域的加速产业发展发展,公司选择全面拥抱AIGC的战略,加大对AI伺服器的研发投入,消费市场份额呈现加速提升之势。依照IDC统计数据,2021年公司在中国消费市场的AI伺服器营收环比快速增长速度高达419%,消费市场份额已经跃升至金融行业第三名,是国内快速增长速度最快的AI伺服器公司。
紫光股份拥有多元化的AI伺服器产品线布局,基于H800芯片的高性能AI伺服器已经推出。公司推出了UniServer R5000系列AI伺服器,可覆盖从体能训练到逻辑推理的AI全场景,其中旗舰的R5500系列可以满足用户大数学模型的体能训练市场需求,采用模块化设计理念,整机分为GPU计算模块、CPU计算模块、硬盘模块、风扇模块、电源模块,均可独立插拔维护。R5500 G5是搭载A800 GPU的AI伺服器,CPU计算模块支持2颗英伟达三代至强,GPU计算模块支持HGX A800 8-GPU模组,8块A800 GPU通过6个NVSWITCH与此同时实现400GB/s的全互联,AI算力较上一代可提升多达20倍,可应用领域于语音识别、图像分类、机器翻译等多种人工智慧业务场景。R5500 G6则是搭载H800 GPU的全新AI伺服器,CPU计算模块支持2颗英特尔四代至强或2颗96核AMD芯片,GPU计算模块支持HGX H800 8-GPU模组,算力相较上一代产品与此同时实现3.4倍提升,可用于超大体量的AI大数学模型体能训练。
紫光股份打造了全流程的傲飞智能算力中枢平台。傲飞中枢可以提供AI数学模型体能训练、数学模型评估、数学模型导出、在线逻辑推理等功能,与此同时实现了AI的全流程,从智能标注、智能匹配到智能体能训练和智能调优,和最后与此同时实现智能逻辑推理,且支持最多4096个节点与此同时部署,满足用户大体量AI计算市场需求,更高显著提升AI应用领域开发效率,更好的满足用户科学、交通、能源、教育等金融行业AI计算市场需求。
紫光股份上线了小智AI实验室功能,方便客户体验AI应用领域开发流程。通过使用小智AI实验室,政企客户可以随时随地的使用基于云端的AI加速计算平台,并在技术专家的帮助下加速创建和部署统计数据密集型的AI应用领域原型,从而方便在先期实际AI应用领域开发过程中选择更优、更可靠的软件和基础架构,使政企客户更快的过渡到AI-Native的应用领域环境之中,从而带动公司AI基础建设的销售。
中科曙光:稳步快速增长的老牌智能计算龙头企业
中科曙光是国内高性能智能计算产业发展的开拓者之一。高性能计算HPC被认为是人工智慧技术的发动机,中科曙光是国内高性能计算技术的领军企业,凭借其技术领先优势,提出了基于“HPC+大统计数据处理”的人工智慧开放框架,为大型政企用户提供完整的人工智慧解决方案。其推出了专门面向人工智慧、深度学习、高性能异构计算领域设计的XMachine系列专用伺服器,拥有较高的异构硬件兼容性,可以兼容GPU、FPGA、寒武纪神经网络芯片等各类别加速计算单元,与此同时具备高效率的电源设计、超高密度和超高传输速率等特性。公司AI计算产品目前典型的应用领域项目有咪咕视频AI基础平台、中国移动AI基础平台等。
中科曙光推出容器化人工智慧开发平台,加速AI应用领域落地。公司的容器化人工智慧开发平台解决方案与此同时实现了对深度学习开发环境的加速部署,针对深度学习开发流程,对运算资源按照体能训练任务进行分割和分发,并额外支持容器镜像管理、权限管理、交互界面图形化等功能,以帮助用户更加速的介入人工智慧领域,聚焦实际算法的优化和插值,促进人工智慧技术在各行各业的加速落地。
拓维信息:自主可控的昇腾智能计算生态核心理念参与者
拓维信息是华为昇腾智能计算生态的核心理念参与者。拓维信息于2021年3月正式成为首批昇腾官方授权的AI计算硬件生产合作伙伴,目前公司可以提供“兆瀚”品牌的囊括智能小站、边缘计算伺服器、逻辑推理伺服器、体能训练伺服器、AI集群等在内的全栈式昇腾智能计算硬件,最小的加速卡提供8 TOPS@INT8算力,而最大的AI集群可以提供256-1024 PFLOPS@FP16算力,能够满足用户用户从边缘计算端到大型统计数据中心的多样化算力市场需求。依照公司年报,2022年9月公司获得华为“优秀昇腾整机合作伙伴奖”,2022年11月公司获得华为“2022年度昇腾最佳实践伙伴奖”,是华为昇腾生态最重要的合作伙伴之一。
拓维信息的智能计算产品符合政企客户自主可控市场需求,连续中标标杆项目。公司“兆瀚”智能计算产品采用华为海思研发的自主可控的鲲鹏+昇腾异构计算芯片组,可满足用户政企客户对自主可控智能算力基础建设的建设市场需求,因此在消费市场中享有独特的竞争力,连续中标标杆项目。依照公司公告,2022年12月公司中标全国一体化算力网络国家(贵州)主枢纽中心IT设备采购项目,合同金额1.83亿元;2022年6月其连续中标长沙人工智慧计算中心和重庆人工智慧计算中心的智能计算硬件订单,订单额分别为1.04亿元及2.96亿元。此外公司在运营商伺服器集采中也持续有收获,昇腾智能计算领域,公司在2022年2月以第一名的身份中标中国联通2022人工智能伺服器集采,中标份额44%,中标金额0.63亿元。连续中标国家级智能算力试验区大单,是公司产品实力的直接体现,且依照长沙及重庆市的算力产业发展发展规划,一期项目算力合计为600 PFLOPS,未来几年将不断扩容至2000 PFLOPS,贵州主枢纽计划到2026年算力建设至274 PFLOPS,有望为公司带来持续的收入快速增长。