亚马逊搜索“宝藏团队”利用深度学习赋能业务发展

2023-05-28 0 216

用程序。借助于Amazon云信息技术的服务项目,M5搜寻项目组能运转五亿模块数学模型的广度自学试验。M5搜寻项目组采用多种Amazon云信息技术服务项目构筑、体能训练和布署多逻辑系统的大型机器自学数学模型。如今,M5搜寻项目组整合了统计数据,精简了建立大数学模型的过程,Amazon各个项目组都能采用那些数学模型,为他们的机器自学插件带来广度自学的强大能力。

借助于广度自学借力Amazon各项目组

作为一家保有少于160万雇员的跨行业信息技术子公司,Amazon由许多相同的项目组组成,各团队的销售业务重点和优先选择事项也都各不相同。其中,Amazon搜寻致力开发商品和服务项目以提升Amazon网站上的最终用户新体验。Amazon搜寻生物科学和工程建设负责人Belinda Zeng则表示:”Amazon搜寻是相连相同商品的公路桥,能在相同商品中建立协作,助推销售业务产业发展。为了解释丰富的统计数据集信息,他们构筑了预体能训练数学模型,从而借助于广度自学来增强Amazon的搜寻功能。”

M5搜寻项目组负责Amazon的发现式自学策略,并构筑多逻辑系统大数学模型,支持多语言、多实体和虚拟化。其本质上很多组织工作是试验性的。项目组须要能快速扩充试验,并迅速进入生产阶段,同时体能训练数百个数学模型,每个数学模型都保有少于2亿模块,以及在Amazon云信息技术上有效地扩充基础建设。要同时实现那些并不容易,因此M5搜寻项目组在基础建设软件系统中采用了Amazon EC2,该服务项目能为几乎全部组织工作阻抗提供安全且可调整的排序耗电量。Amazon搜寻首席工程建设师Rejith Joseph则表示:”他们选择Amazon EC2是领跑的可扩充性、统计数据易用性、可靠性和高效率能。

每星期扩充到数百个体能战斗任务

在2020年第三季度,M5搜寻项目组已经开始采用Amazon云信息技术服务项目构筑、体能训练和布署其机器自学数学模型。截至2022年,项目组采用各种Amazon云信息技术服务,每星期扩充至数百个体能战斗任务,涉及大量GPU软件产业上的PB级统计数据。除了采用Amazon S3展开统计数据储存之外,M5搜寻项目组还采用了Amazon FSx,在云内随心所欲启动、运转和扩充功能强大且代普雷的文件系统。该项目组还采用了全代销的格式化服务项目Amazon Batch,可在任何规模下高效率运转格式化排序组织工作台。Amazon搜寻工程建设经理Roshan Makhijani则表示:”通过广泛采用Amazon FSx、Amazon EC2和Amazon Batch的服务项目,他们提升了试验速度。在Amazon云信息技术上展开构筑圣索弗,他们在不到3天的时间里就能扩充到新地区,只要新地区有硬体可用。”

从一已经开始,M5搜寻项目组就与Amazon云信息技术的商品项目组合作解决子公司的头疼问题。例如,统计数据专门化体能训练组织工作台须要海量数据排序资源,采用跨地区排序是出访那些资源的必要手段,但以前没有实际软件系统能灵巧同时实现跨地区排序。Belinda Zeng则表示:”我们与Amazon云信息技术紧密合作,开发了一些新功能,同时实现了跨地区排序,成功解决了这一难题。”此外,项目组不断增长的统计数据需求日益挑战Amazon FSx的极限。通过与Amazon云信息技术合作,M5搜寻项目组解决了所有性能问题,并为持续扩充打下了基础。正是由于那些增强功能,M5搜寻项目组现在仅需1-2周就能扩充机器自学基础建设。

项目组还采用C++库开发了一种自定义软件系统,以建立跨流媒体的Amazon S3 — 即在一个地区储存统计数据并在另一个地区展开流式统计数据传输 — 而不影响体能训练组织工作台的速度。Makhijani则表示:”采用Amazon S3,他们同时实现了他们须要的高吞吐量流媒体软件系统。” 通过选择最优的GPU、CPU以及Amazon云信息技术自研设计的高效率能机器自学推理芯片Amazon Inferentia,M5搜寻项目组成功在机器自学推理过程中降低成本并优化性能。Joseph则表示:”相同数学模型在相同硬体上能提供的吞吐量有所不同,因此,硬体的选择能帮助他们扩充数学模型架构,并针对多种类型的硬体展开优化,同时控制成本。”此外,项目组在EC2 UltraClusters中布署了Amazon EC2 P4d实例,那些实例由云端高效率能排序、网络和云储存构成,以获得最佳的排序和通信吞吐量。Amazon云信息技术广度自学AMI和广度自学容器提供了优化且安全的机器自学框架和工具,使机器自学从业者能在云上加速广度自学,从而精简了EC2实例的配置和布署,并同时实现了扩充。在软件系统中,项目组还采用了Amazon EC2实例的网络接口Elastic Fabric Adapter(EFA),客户能借此在Amazon云信息技术上大规模运转须要高度跨节点通信的应用程序。

此外,M5搜寻项目组在Amazon云信息技术上采用开源广度自学框架PyTorch,用以精简机器自学数学模型开发并将数学模型布署到生产中。具体而言,项目组试验了多种PyTorch库,如分布式统计数据并行和Amazon S3插件,以及PyTorch Profiler和完全分片统计数据并行等工具展开分布式体能训练。如今,Amazon各部门都能借助于广度自学的强大功能,以上能力的运用几乎无所不在。例如,M5搜寻项目组开发了一种机器自学数学模型,能够准确更正客户在搜寻过程中的拼写错误,从而改善搜寻新体验。Zeng则表示:”机器自学应用能帮助系统准确解读客户的真实意图,并提供多样化的相关推荐列表,那些功能都得益于他们预体能训练数学模型中丰富而细致的信息。”

持续提升效率

Amazon搜寻现在已经保有了大规模构筑机器自学数学模型的技术。下一步,项目组计划持续改进其全球软件产业以提升生产力和采用效率。项目组还将采用新的Amazon EC2实例匹配相同的数学模型,既用于体能训练,也用于推理。M5搜寻项目组将继续与Amazon云信息技术合作,优化其基础建设的弹性,提升生产力,并降低体能训练大型数学模型的前置成本。Joseph则表示:”通过采用Amazon云信息技术持续提升效率,他们能释放广度自学和人工智能的无限潜能,最终让他们的客户从中受益。”

相关文章

发表评论
暂无评论
官方客服团队

为您解决烦忧 - 24小时在线 专业服务