AI自己写代码管理数据库?国产数据库怎么看

2023-05-24 0 692

原副标题:AI他们写标识符管理工作资料库?升级换代资料库是不是看

文|欧氏智能化 刘雨琦

“23.44°到23.47°。”

这是在《流浪者火星2》中,Chalancon火星发动机发射试验产生的0.03度长棒,而是这0.03度佐证了“移山方案”的可行性研究。让火星北迁方案从“有可能”转变成了原先历史事实。

于当下那个结点而言,ChatGPT即是那0.03度的长棒。它的出现让很多趋势成为了原先历史事实。这当中,并不而已对通用大数学模型等隐性特征达成一致,而要对当前的控制技术构架有着根本原因性的解构。

资料库的云原生植物化即是当中之一。以往提到云原生植物,不外乎是随着民营企业销售业务产业发展的井喷式需求,将资料库北迁穗序能大幅度更上一层,对云原生植物的探索更多集中在低估值、可扩展性、资源解耦等控制技术优势。

但关键在于,云原生植物与大数学模型的关系,就像新能源与智能化,ARM9多功能不是成本的最优化解,而要AI产业发展的先决条件。

国内外的云巨擘们早就开始了提前布局。在阿里云天池资料库首脑会议中,基于阿里云原生植物资料库Polar DB推出了协同产业发展HTAP资料库;百度若非原生植物资料库TDSQL-CLikeTPC-C破亚洲纪录;蜜蜂集团云原生植物排程资料库CeresDB 1.0正式发布;Amazon Aurora Serverless v2将在中国区域上架。

“今后接触AI之后,销售业务的插值速度会非常慢,销售业务都要为民营企业创造价值。那个过程中明确要求快速插值、平衡、高效率、灵活性,‘又快又平衡’这对控制系统的明确要求是非常矛盾的。那时能够解决那个控制系统问题的构架,是云原生植物构架,所以说那时云原生植物构架是所有控制系统重构的今后。”阿里云资料库软件系统专家李圣陶判断道。

这意味着我们将进入两个全面云原生植物化的黄金时代。不而已资料库的云原生植物,更多应该发生在应用的云原生植物、基础建设的云原生植物中,云原生植物资料库是两个终点,也是助推下两个黄金时代的关键螺丝。

一、AI for DB,DB for AI

云原生植物是迎接智能化黄金时代的基础条件,智能化是云原生植物资料库捷伊油压,二者相得益彰并呈螺旋形上升。

阿里云数据产品销售部负责人李Bazelle认为,这分为两个部分:AI for DB,DB for AI。

目前,AI for DB,智能化控制技术大多运用在资料库的运维的环节,比如异常检测、HA切换、参数调参、多维分析等资料库管理工作服务。

在智能化之前,资料库的运维主要依靠云资源池化、分层解耦(存算分离)和人工服务实现混合资料库的统一管理工作。然而随着数字黄金时代资料库构架和运行环境日趋复杂,资料库种类也从单一产品转转变成混合型商业资料库和开源资料库的组合,依靠人工运维显得捉襟见肘。

AI for DB的核心在于利用机器学习,能给予海量运行数据形成智能化运维数学模型,自动化处理各项任务,例如自动管理工作计算与存储资源、自动防范恶意访问与攻击、主动实现资料库智能化调优等。

AI自己写代码管理数据库?国产数据库怎么看

图源艾瑞研究院

举个简单的例子,参数调参的本质和自动驾驶的参数一样,何时打方向盘、何时踩刹车对控制系统而言都是一些固定的参数设置。传统的调参方式往往是“经验调参”,需要不断试错不断总结,而将机器学习能力应用在运维控制系统里,在资料库运行时,ML便能通过学习和分析,灵活调优,最终在每个结点都能达到最优化的参数设置。

同类型的应用还有很多,比如自定义备份策略、自动在线升级修复BUG、监控自定义报警灯等等。对传统的资料库运维方式大幅提效。

如果说AI for DB解决的是当下效率问题,那DB for AI解决的即是AI2.0黄金时代“入场券”问题。

在AI 2.0黄金时代,DB for AI两个最大的变化是多模态数据处理协同产业发展。包括不限于排程数据、文档数据、宽表数据、结构化和非结构化数据、图数据等等融合在一起,为AIGC所需的多模态数据打下坚实的基础。

此前,数据库按照数据类型被分为各类垂直资料库,这也是同两个民营企业采购多个资料库的原因,而多个资料库之间的不互通,又给了运维平台相当大的挑战,但在AIGC和多模态大数学模型等需求下,对数据类型和质量的明确要求都会提高。

另两个方面的挑战是,对资料库厂商而言,需要提供灵活的数学模型导入能力和接口,可以把第三方以及客户他们的数学模型一键导入,并且支持数学模型的资料库存储和使用,在各种各样的应用中完成所需要的推理。

目前,国内外厂商都已经开始闻风而动。从全球局势来看,多模态数据跑在最前面的仍是微软Azure。Azure Cosmos DB支持文档、键值对、列族和图形数据,并支持Serverless(无服务)选项,用户可以按需付费,不必预配和维护,这使Azure Cosmos DB更加具有灵活性,能快速缩放,大大提高了多模资料库的易用性。

而AWS的多模资料库Amazon Neptune本质上是一种高性能的图形资料库,支持图形数据模型和SPARQL查询语言,虽然支持键值对数据数学模型,但可操作性十分有限。

国内,阿里云在刚刚过去的阿里云天池资料库首脑会议中,发布了Lindorm灵动多模态资料库,据李Bazelle介绍,Lindorm 多模资料库具备多模数据处理能力,还集成了AI能力,能生成视频、图表等AI生成式内容。用户只需写几段SQL语言,即可在资料库内完成数学模型的部署和推理,快速搭建AI应用的平台。

在AIGC蓬勃产业发展的当下,国内多模态资料库的产业发展也将成为通往数据智能化黄金时代的重要支撑。

二、云原生植物走进2.0

受智能化的引力牵引,云原生植物从1.0快速进入了2.0黄金时代。

关于云原生植物2.0黄金时代与1.0最大的区别,李Bazelle认为是“四化”:云原生植物化、平台化、一体化、智能化。而百度云总裁邱岳鹏则认为是:协同产业发展、敏捷调用、数智融合和开箱即用。

即便说法不同,但协同产业发展的趋势是确定无疑的。

在传统资料库中,不同的分类标准资料库的类型不同。比如按照功能分类,分为:OLTP、OLAP;按照数据种类分,分为排程资料库、键值资料库、图资料库等;按照资料库构架分,分为分布式资料库、集中式资料库。

这种复杂程度,也是资料库作为基础软件“三驾马车”难以攻克的关键点之一。

然而在云原生2.0黄金时代,协同产业发展不再而已软硬件的协同产业发展,也不而已数据形式的“大杂烩”,更重要的是TP和AP的协同产业发展提高效率,分布式集中式的协同产业发展降高效率。

在去年,已经有部分厂商如OceanBase、PolarDB、TDSQL-H、TiDB等都实现了 HTAP,几乎成为了新兴资料库的必选项。Gartner也提出HTAP已经成为了全球范围内新一代资料库入场的筹码,兼具AP和TP能力,将打破数据栈的割裂状态,最终让数据集中在简单易用、安全可靠、高性价比的数据平台。

不过,过去的HTAP通常而已同一厂商TP和AP的简单“捏合”,品牌是统一的,但支持交易和分析的时候有不同构架和部署形态来适应负载。李Bazelle也直言:“过去的HTAP的T和H是两个完全独立的引擎,因为MPP(大规模并行处理)和ACID(资料库事物正确执行四要素)的明确要求不同,除非牺牲数据的一致性和可见性,在两个引擎里,又想做行、又想做列的MPP,几乎不可能。”

阿里云的解决办法是基于Polar DB的轻量化,通过内嵌DPS(统计软件)让数据同步、实时可见,将可见性和一致性大幅提升,同时统一的控制台和统一的标准API,尽可能弱化从A到T过程中的消耗,在体感上达到无缝流通。

阿里云天池将云原生植物资料库PolarDB和云原生植物数据仓库AnalyticDB打通融合后,为民营企业提供统一入口,兼具数据处理与分析能力,为用户带来一站式的资料库使用体验。

百度云TDSQL-H在方向上与阿里云大体一致,只不过实现的方式有所不同。百度云针对白天营业状态时TP场景更多,夜间营业状态AP场景更多,进行了动态调整,通过并发控制、内存控制、资源灵活性划分以及参数自动调解等方式,提供完全透明的、单控制系统的HTAP方案。

另一方面,集中式和分布式的界限也在逐渐模糊。

“今后,基于云原生植物构架,集中式和分布式不再如长江、黄河一样泾渭分明,转化可以做得非常平滑,因为资源池化,集中式和分布式也可以一体化。”李Bazelle讲道。

历史事实上,这也是传统资料库的两个核心痛点。集中式和分布式是完全以资料库构架为出发点,而不考虑销售业务需求。客户的明确要求是用尽可能低的成本、尽可能高的效率完成任务,这背后是集中式还是分布式,并不重要。

这与云原生植物的“资源池化”和“资源解耦”能力有很大的关系。

资源池化中的典型代表是湖仓多功能。本质是把MPP和BSP(商业资源资料库)融合起来,无论是在线、离线、调度、混合负载,都可以在同两个数据湖中完成,且做到互不干扰,这是正在发生和接下来HTAP要突破的控制技术。

云原生植物1.0的资源解耦主要是存储和计算的解耦,双并行作业提高效率。而云原生植物2.0则是CPU、内存、存储三层解耦,更容易实现云上资源秒级扩容和高可用、高可靠能力。

基于构架的协同产业发展,云原生植物2.0的另两个特点是平台化。正所谓“合久必分、分久必合”,两个资料库“打天下”解决所有问题的黄金时代已经结束了,取而代之的是用平台化的思维构建多个引擎,基于平台提供一站式的能力和软件系统,这是平台化的核心。

AI自己写代码管理数据库?国产数据库怎么看

总的来说,云原生植物2.0黄金时代,不再是简单的节省成本,而要基于云原生植物构架的广袤空间,对当下的云资料库进行根本性的改造,从而适应非常慢的数据黄金时代。

三、升级换代资料库换道超车

从整个资料库行业来看,把握住了云原生植物趋势,也就抓住了升级换代资料库换道超车的最佳机会。

据中国信通院发布的《资料库产业发展研究报告2021》统计,2025年中国的资料库市场规模将达到688亿元,5年年复合增长率达23.4%。目前,海外巨擘仍占据国内资料库市场较大份额,但升级换代资料库经历多年沉淀,已经具备较强的竞争力。

全球范围内的竞争潜力,都在“云原生植物资料库”这匹黑马上。Gartner预测,到2023年,75%的资料库都要跑在云平台上,且从2019年开始,Gartner便不再将传统资料库的性能纳入评价指标。

AI自己写代码管理数据库?国产数据库怎么看

2022-2021全球资料库厂商排名变化

在这张纷繁复杂的排名变化图中,透露了几个重要信号。

从2011年-2021年,资料库十年变局分为三个重要阶段:

(1)2011年-2013年,传统资料库几乎垄断了整个市场,Oracle、IBM、SAP等传统厂商一骑绝尘;

(2)2013年开始,以AWS为首的云厂商杀入,云资料库进入了一段高速增长期。2014年阿里云进入、2015年华为云进入、2016年百度云和Snowflake进入,至2018年,云厂商们陡坡逆行,从小透明突破到前十的位置;

(3)2018年之后,进入了一段平衡增长期,直至2020年,微软抢占了Oracle长达近10年的霸主地位;2021年,AWS也领先Oracle成为了第三名,前五名中,有三名均是云厂商;前十名中,有7名均是云厂商。

Gartner报告显示,云资料库现在创造了392亿美元的收入,占所有资料库的49%以上。

而以云厂商为代表的云原生植物资料库增长速度之快、突破力之强,在短短五年内彻底打乱了传统资料库的市场格局,同时也保持了较强的持久力。

以谷歌为例,其整体市场增长率几乎翻了三倍,取代了IBM和SAP,成为了全球第四大资料库提供商。Snowflake从诞生起便采用了云原生植物构架,即便在2016年才刚刚问世,也一路突围,目前仅次于百度,成为了云资料库中市值最高的独角兽民营企业。

国际市场云原生植物资料库的突破力在国内市场同理。据IDC统计,2021年H2,本地部署资料库格局仍以Oracle为首,但云部署已经打开局面,且呈现了更加多样化的竞争格局。

AI自己写代码管理数据库?国产数据库怎么看

种种数据表明,云资料库已经从趋势成为了原先历史事实和产业发展前提,也是今后升级换代资料库“去O”的关键手段。

而在智能化黄金时代,资料库走过了第一阶段又立刻向第二阶段启航,以阿里云、华为云、百度云资料库为代表的,更强的云资源、云能力、云平台支撑下资料库,一方面带领升级换代资料库换道超车,另一方面也在为智能化的爆发,做全面准备。

相关文章

发表评论
暂无评论
官方客服团队

为您解决烦忧 - 24小时在线 专业服务