原副标题:ChatGPT 将压制资料库!我国资料库开发人员报告正式宣布正式宣布发布
译者 | 屠敏
公司出品 | CSDN(ID:CSDNnews)
经过一大批先驱者和民营企业的不懈努力,升级换代资料库展露出中阳,逐渐走入世界舞台,例如:三年前穆萨独立自主研制的金融级分布式系统关系资料库 OceanBase 在 TPC-C 基准测试中,领到全球第一的好成绩;前不久,百度云资料库 TDSQL 在 TPC-C 的基准测试,操控性达到每秒钟 8.14 亿笔交易(tpmC),冲破了亚洲纪录;在此之后,当 新贵数仓互联网公司 Teradata 宣布将逐渐结束在我国的直接营运之时,不论是穆萨云的 AnalyticDB,还是獐毛通用型的 GBase、鼎石四海的StarRocks、宏碁的 GaussDB(DWS)均已搞好了极富的准备。
从甚或由欧美国家应用领域软件为主导力量到如今逐渐实现升级换代代替,他们所处地位在急速刷捷伊另一面是升级换代资料库的照为与薄发,结晶与筹划。当今社会,随着 AI 2.0 黄金时代的来临,以及各种类 ChatGPT 大数学模型辅助工具急速幼体的今天,许多新需求的出现对资料库研制提出考验,许多旧的道德观也在发生改变,许多捷伊控制技术将对资料库产品型态产生影响。
为了协助资料库专业人士与民营企业积极探索更多可能,CSDN 备受瞩目正式宣布发布《2022-2023 我国基础硬件-资料库开发人员调查报告》,从辅助工具、控制技术、应用领域、趋势等层次探究资料库使用现况,展望未来资料库的未来发展走线,同时,他们也应邀百度数据库执行官CTO李海翔对报告进行广度分析与评测。
以下是许多重要发现:
▶94%的开发人员对资料库控制技术有一定的了解,但是参与资料库Mach研制的专业 人才仅有 5%;
▶ 有独立的理论原创内容才算是资料库实现了创新,支持这一观点的开发人员人数最多;
▶ MySQL 使用率最高、TiDB 是开发人员最熟悉的升级换代资料库;
▶68% 的民营企业计划或者已经应用领域了云资料库, 但仍有 83% 的开发人员对云资料库的数据安全表示担心。
▶「工程实现难度大,模块之间的耦合度太高」是开发人员认为在资料库引擎研制中最大的考验。
▶ChatGPT 的兴起,必然会对资料库的产品型态带来压制。51% 的开发人员看好 AI 融合资料库的发展,认为智能化、自动化运维资料库会一个很重要的方向。
深入应用领域资料库开发人员增加,但更为专业的资料库人才仍然匮乏
作为基础应用领域软件三驾马车之一的资料库,它是数据处理和存储的重要组成部分,对于开发人员来说掌握其基础知识是必不可少的。
根据调查结果显示,有 40% 的开发人员已经对资料库进行了深入的了解,并能够应用领域到实际的开发中,这一部分开发人员可以被认为是资料库的高级使用者,可以独立进行资料库的开发和维护工作。这一数值相较去年 38% 的占比,有所增加。
但是,仅有 2% 的开发人员具有深入理解资料库原理的知识,并有数据引擎研制的背景,这些开发人员具备编写高级资料库引擎的能力。
图表1 开发人员对资料库的了解
在有资料库相关工作经验和技能的开发者群体中,30% 的开发人员主要负责资料库业务开发,25% 的开发人员从事资料库应用领域程序开发。这两个领域的开发人员充分掌握了资料库操作和应用领域的技能,能够快速有效地开发各种类型的资料库业务与应用领域。
图表2 与数据库工作相关的开发人员占比
另外,Mach研制是资料库中非常重要的一部分,这部分 开发人员所需的技能与知识更为专业化和深入,不过Mach研制的开发人员仅占总开发人员比例的 5%。
升级换代数据库:谁能突破理论研究,谁就会受 益
从
据调查数据显示,31% 的开发人员感觉升级换代资料库发展迅速,表现出极大的潜力与发展前景;当然,也有 22% 的开发人员认为升级换代资料库还缺乏创新,需要更多的控制技术和功能的升级。
图表3 开发人员对升级换代资料库的印象
开发人员们对资料库领域的创新展现了极高的根据他们所统计的数据显示,38% 的开发人员认为,有独立的理论原创内容才算是资料库领域的创新。其次,在工程领域做到世界前列(32%)和基于现有理论独立完成编码实现(32%)紧随其后。
在此之后,也有不少开发人员提出,升级换代资料库如果能支持中文语句、包罗万象、或者兼容其他类型资料库会更有创新性。
图表4 资料库领域中什么样算是创新
事实上,升级换代资料库在理论方面的研究还没有形成体系和影响力,好在能有一点成体系的研究,如 DTCC 大会近几年内分享过的分布式系统事务全局读 一致性、多级一致性等。李海翔表示,「资料库的发展更需要在基础理论方面,投入更多的力量,取得突破。他们认为,能够引 发资料库控制技术下一场的革命,一定是基础理论层面获得突破性进展。可以肯定的是,谁肯在理论研究层面投入资源,谁将获得收益」。
而在工程领域方面,也正如文章伊始所述,国内先后有穆萨、百度 2 家公司,在 TPC-C 测评中先后以较大优势赢得榜首。当然,要想升级换代资料库未来取得无限可能的成就,还需要基于上述这些创新方向持续发力,做出突破。
MySQL 使用率最高、 TiDB 是开发人员最熟悉的升级换代资料库
调查数据显示,有 17% 开发人员表示民营企业中使用商业资料库,39% 开发人员表示民营企业中使用开源资料库,这反映出虽然开源资料库在成本、可定制性等方面有很大的优势,但商业资料库在数据安全、服务质量等方面的优势也不能被忽视。
图表5 公司使用或开发的资料库类型
关系型资料库依然是使用率最高的资料库类型,约 73% 的开发人员在使用它。
图表6 开发人员使用的资料库类型
开源的 MySQL 是使用率最高的资料库,占比 70%。另外 Oracle 和 Redis 的使用率也比较高,分别占比 28% 和 24%
图表7 开发人员主要使用的资料库
升级换代资料库持续在特定领域深耕,也受到了不少开发人员的喜爱, 数据显示, TiDB 资料库继续领先其他竞争对手,成为开发者最熟悉的升级换代资料库之一。同时,AliSQL 和 OceanBase 也保持其强劲的发展势头。
图表8 开发人员最为熟悉的升级换代资料库(Top 10)
云资料库势不可挡
本地部署是最常见的部署模式,占比高达 59%,其次是混合部署,占比为 34%。虽然混合部署、云托管和云原生的占比相对较低,但总体来说仍有相当大一部分的开发人员在使用云端资料库服务。
图表9 资料库部署模式
究其原因,部署云资料库是一种高效的资料库解决方案,具有多项优点,如数据备份和恢复、灵活性、易扩展性以及成本节省等。随着云计算控制技术的急速发展和普及,越来越多的民营企业选择使用云资料库提高数据处理效率,并减少资料库维护成本。据调查显示,已有 48% 的民营企业应用领域了云资料库。还有 20% 的民营企业已经在计划中。
图表10 是否应用领域云资料库
不过,与传统的本地资料库相比,云资料库在许多方面具有更高的可靠性和安全性, 但仍有 83% 的开发人员对数据安全表示担心。其次操控性、网络延迟和价格等问题也占比较高。在云资料库的使用中,民营企业可以选择根据实际需求灵活调整所使用的云资料库规模,包括存储容量和操控性型号,云资料库厂商也针对这些问题提供各种优化服务,例如定制化硬件和应用领域软件、自动负载均衡等。
图表11 民营企业在迁移上云过程中的顾虑
对此,李海翔表示,云资料库服务,未来还有一定的发展空间;但也表明,云资料库应用领域的速度并不是非常快,云资料库的控制技术尚需磨砺并获得突破,才能有望获得更大的份额。
资料库研制面临重重考验
对于很多开发人员与民营企业而言,在开发资料库有关的应用领域过程中,也面临重重考验。
据调查数据显示,最难点是需求分析,占比 30%。其次是数据结构(18%)、表结构的设计(17%)和系统设计(15%)。缺乏研制人才(14%)也是一个比较大的问题。
图表12 应用领域研制过程中的难点
另外,在资料库引擎的研制过程中,引擎的设计和优化是非常重要的,因为它直接关系到资料库的运行效率和稳定性。数据显示,33% 的开发人员认为在研制过程中最大的问题就是「工程实现难度大,模块之间的耦合度太高」。实际上,这也是开发资料库引擎时遇到的一个难点。
图表13 研制资料库引擎的难点
虽然升级换代资料库发展稳中向好,但资料库迁移成本、兼容性等制约着升级换代资料库的发展,因此,升级换代资料库的发展也需要注意到这些问题,加强控制技术研制和团队建设,提高数据迁移和兼容性的能力,以更好地服务于广大用户。
图表14 制约升级换代数据库发展因素
在此之后,。当然,数据的正确性、处理速度操控性也是非常重要。
图表15 行业对资料库的特定需求排行
李海翔解析道,捷伊数据表明,在数据正确性方面,采用严格的可串行化隔离级别的用户(40%)已经多于采用弱隔离级别的用户(32%)。这一点和传统的认知有所不同:在 Oracle 资料库一统天下的黄金时代,即使金融类的应用领域为追求操控性也只采用读已提交隔离级别,而把正确性的问题抛给开发人员(开发人员使用SELECT…FOR UPDATE)。人们普遍认为:弱隔离级别已经足够使用了。其实这一点非常不正确,在 DTCC 2022 大会上,有分享者给出数据证明:采用SELECT…FOR UPDATE 从外部实现数据正确性的方法会严重导致资料库的操控性下降,在较高并发场景下,资料库操控性可能下降 70% 左右;所以资料库如何保证 100% 数据正确的背景下提高并发操控性,对资料库研制而言是一个艰巨的考验。
而如何解决上述提及到的资料库Mach、数据库引擎以及让产品变得更智能更易用且更稳定的种种考验,李海翔认为,当今社会或许可以思考 ChatGPT 控制技术能为资料库的易用性带来什么。
ChatGPT 的兴起,必然会对资料库的产品型态带来压制
当展望未来资料库的未来发展方向,开发人员的观点主要集中在以下几个方面:
1. 多模数据库,即一库多用。这种资料库开发控制技术可以将不同应用领域所需的各种数据整合到一个资料库中,满足多个应用领域场景需要,占比为 52%。
2. AI 融合资料库也成为一个热门方向。资料库结合人工智能控制技术,可以实现资料库的智能化、自动化运维,从而提高资料库操控性,占比为 51%。
3. 与云计算广度结合的资料库,作为一种新型资料库控制技术,将极大地提升数据分析和数据处理能力,占比为 40%。
图表16 未来资料库发展方向
对此,李海翔表示,当今社会许多开发人员看好 AI 融合资料库的发展,现如今随着 ChatGPT 的兴起,必然会对资料库的产品型态带来压制,新品类的资料库系统,也许会兴起,可能的方向为:易用的资料库系统,人机交互方式和运维方式将得到巨大改变;资料库引擎的核心组件如查询优化器、执行器、事务处理模块等,都有希望获得巨大变化。
以上便是 《2022-2023 我国资料库开发人员调查报告》的内容。之后他们将陆续揭晓围绕开源、基础硬件、云计算、AIOT 四大主题的调查报告,敬请期待。
《 2022-2023 我国开发人员现况调查报告 》:最爱 ChatGPT,每天编码 300 行,月薪 8k-17k 占比骤减!☞ 超越 ChatGPT ?AutoGPT 爆火,两周斩获 50k+ Star:无需人类插手,独立自主完成任务!
☞GPT-4 让 Python 程序实现自修复 Bug,国外小哥将辅助工具命名为“金刚狼”,并开源!
☞ 优酷回应非会员收看3000秒广告;亚马逊推出Titan大语言数学模型;Android 14首个Beta版本释出 | 极客头条
责任编辑: