ChatGPT 将冲击数据库!中国数据库开发者报告正式发布

5ac654dfd39b03e47dba83f79d4d3771.gif

作者 | 屠敏

出品 | CSDN(ID:CSDNnews)

经过一批批先行者和企业的努力,国产数据库崭露峥嵘,逐渐走上国际舞台,譬如:三年前阿里自主研发的金融级分布式关系数据库 OceanBase 在 TPC-C 基准测试中,拿到全球第一的好成绩;不久前,腾讯云数据库 TDSQL 在 TPC-C的基准测试,性能达到每分钟 8.14 亿笔交易(tpmC),打破了世界纪录;与此同时,当老牌数仓软件巨头 Teradata 宣布将逐步结束在中国的直接运营之时,无论是阿里云的 AnalyticDB,还是南大通用的 GBase、鼎石纵横的StarRocks、华为的 GaussDB(DWS)均已做好了十足的准备。

从过往由欧美软件为主导到如今逐步实现国产替代,我们所处地位在不断刷新的背后是国产数据库的厚积与薄发,沉淀与酝酿。当下,随着 AI 2.0 时代的到来,以及各种类 ChatGPT 大模型工具不断孵化的今天,一些新需求的出现对数据库研发提出挑战,一些旧的观念也在发生变化,一些新的技术将对数据库产品形态产生影响。

为了帮助数据库从业者与企业探索更多可能,CSDN 重磅发布《2022-2023 中国基础软硬件-数据库开发者调查报告》,从工具、技术、应用、趋势等维度剖析数据库使用现状,展望数据库的未来发展路线,同时,我们也特邀腾讯数据库首席架构师李海翔对报告进行深度分析与点评。 

c2c20e65bec8cb28b9d9600271b527c2.png

以下是一些重要发现:

▶ 94%的开发者对数据库技术有一定的了解,但是参与数据库内核研发的专业人才仅有 5%;

▶ 有独立的理论原创内容才算是数据库实现了创新,支持这一观点的开发者人数最多;

▶ MySQL 使用率最高、TiDB 是开发者最熟悉的国产数据库;

▶ 68% 的企业计划或者已经应用了云数据库, 但仍有 83% 的开发者对云数据库的数据安全表示担心。

▶ 「工程实现难度大,模块之间的耦合度太高」是开发者认为在数据库引擎研发中最大的挑战。

▶ ChatGPT 的兴起,必然会对数据库的产品形态带来冲击。51% 的开发者看好 AI 融合数据库的发展,认为智能化、自动化运维数据库会一个很重要的方向。

8157b1b1edd4ecaaf08d03a6ad248de6.png

深入应用数据库开发者增加,但更为专业的数据库人才仍然匮乏

作为基础软件三驾马车之一的数据库,它是数据处理和存储的重要组成部分,对于开发者来说掌握其基础知识是必不可少的。

根据调查结果显示,有 40% 的开发者已经对数据库进行了深入的了解,并能够应用到实际的开发中,这一部分开发者可以被认为是数据库的高级使用者,可以独立进行数据库的开发和维护工作。这一数值相较去年 38% 的占比,有所增加。

但是,仅有 2% 的开发者具有深入理解数据库原理的知识,并有数据引擎研发的背景,这些开发者具备编写高级数据库引擎的能力。

e150600ac5e63be29d57981c5a45686a.png

图表1 开发者对数据库的了解

在有数据库相关工作经验和技能的开发者群体中,30% 的开发者主要负责数据库业务开发,25% 的开发者从事数据库应用程序开发。这两个领域的开发者充分掌握了数据库操作和应用的技能,能够快速有效地开发各种类型的数据库业务与应用。

a19ec47539cf683363d5b56d486fa83c.png

图表2 与数据库工作相关的开发者占比

另外,内核研发是数据库中非常重要的一部分,这部分开发者所需的技能与知识更为专业化和深入,不过内核研发的开发者仅占总开发者比例的 5%。

1de538482e2cd0ca75a423ac1dabc0f5.png

国产数据库:谁能突破理论研究,谁就会受益

从上述数据中也不难看出,相较往年,关注与参与数据库开发的从业者在稳步增长,这离不开云计算和大数据等技术的加持,也离不开国内创业公司和大型企业纷纷涌入数据库市场的引导。

据调查数据显示,31% 的开发者感觉国产数据库发展迅速,表现出极大的潜力与发展前景;当然,也有 22% 的开发者认为国产数据库还缺乏创新,需要更多的技术和功能的升级。

 4838292a356c140ca60aa3128c796879.png

图表3 开发者对国产数据库的印象

开发者们对数据库领域的创新展现了极高的关注和兴趣。根据我们所统计的数据显示,38% 的开发者认为,有独立的理论原创内容才算是数据库领域的创新。其次,在工程领域做到世界前列(32%)和基于现有理论独立完成编码实现(32%)紧随其后。

与此同时,也有不少开发者提出,国产数据库如果能支持中文语句、包罗万象、或者兼容其他类型数据库会更有创新性。

4f8c7776251c215ca02ceaa0d39b5e9b.jpeg

图表4 数据库领域中什么样算是创新

事实上,国产数据库在理论方面的研究还没有形成体系和影响力,好在能有一点成体系的研究,如 DTCC 大会近几年内分享过的分布式事务全局读一致性、多级一致性等。李海翔表示,「数据库的发展更需要在基础理论方面,投入更多的力量,取得突破。我们认为,能够引发数据库技术下一场的革命,一定是基础理论层面获得突破性进展。可以肯定的是,谁肯在理论研究层面投入资源,谁将获得收益」。

而在工程领域方面,也正如文章伊始所述,国内先后有阿里、腾讯 2 家公司,在 TPC-C 测评中先后以较大优势赢得榜首。当然,要想国产数据库未来取得无限可能的成就,还需要基于上述这些创新方向持续发力,做出突破。

a73e1fb24105090634f4137975bd0d2b.png

MySQL 使用率最高、TiDB 是开发者最熟悉的国产数据库

调查数据显示,有 17% 开发者表示企业中使用商业数据库,39% 开发者表示企业中使用开源数据库,这反映出虽然开源数据库在成本、可定制性等方面有很大的优势,但商业数据库在数据安全、服务质量等方面的优势也不能被忽视。

2b82c7d8ec14c12793f3f3017cf2b4f7.jpeg

图表5 公司使用或开发的数据库类型

关系型数据库依然是使用率最高的数据库类型,约 73% 的开发者在使用它。

 04d74339e9a52060fdd19eb3c9b74884.jpeg

图表6 开发者使用的数据库类型

开源的 MySQL 是使用率最高的数据库,占比 70%。另外 Oracle 和 Redis 的使用率也比较高,分别占比 28% 和 24%

4cb7d514b12d0a78a50af2743d138393.jpeg

图表7 开发者主要使用的数据库

国产数据库持续在特定领域深耕,也受到了不少开发者的喜爱, 数据显示,  TiDB 数据库继续领先其他竞争对手,成为开发者最熟悉的国产数据库之一。同时,AliSQL 和 OceanBase 也保持其强劲的发展势头。

28b6b73c5632d2df74c4b3c88a42c12b.jpeg

图表8 开发者最为熟悉的国产数据库(Top 10)

bda418614849cbe6d729a7cd661a9143.png

云数据库势不可挡

本地部署是最常见的部署模式,占比高达 59%,其次是混合部署,占比为 34%。虽然混合部署、云托管和云原生的占比相对较低,但总体来说仍有相当大一部分的开发者在使用云端数据库服务。 

af7717c983e0f100436f06641a0475bb.jpeg

图表9 数据库部署模式

究其原因,部署云数据库是一种高效的数据库解决方案,具有多项优点,如数据备份和恢复、灵活性、易扩展性以及成本节省等。随着云计算技术的不断发展和普及,越来越多的企业选择使用云数据库提高数据处理效率,并减少数据库维护成本。据调查显示,已有 48% 的企业应用了云数据库。还有 20% 的企业已经在计划中。

3dd629b7b8f31f367baceda6d3457b37.jpeg

图表10 是否应用云数据库

不过,与传统的本地数据库相比,云数据库在许多方面具有更高的可靠性和安全性, 但仍有 83% 的开发者对数据安全表示担心。其次性能、网络延迟和价格等问题也占比较高。在云数据库的使用中,企业可以选择根据实际需求灵活调整所使用的云数据库规模,包括存储容量和性能型号,云数据库厂商也针对这些问题提供各种优化服务,例如定制化硬件和软件、自动负载均衡等。

7e539d3259c203e0c91e0adc55095735.jpeg

图表11 企业在迁移上云过程中的顾虑

对此,李海翔表示,云数据库服务,未来还有一定的发展空间;但也表明,云数据库应用的速度并不是非常快,云数据库的技术尚需磨砺并获得突破,才能有望获得更大的份额。

422280fa3ae22363ef472f2800d0072d.png

数据库研发面临重重挑战

对于很多开发者与企业而言,在开发数据库有关的应用过程中,也面临重重挑战。

据调查数据显示,最难点是需求分析,占比 30%。其次是数据结构(18%)、表结构的设计(17%)和系统设计(15%)。缺乏研发人才(14%)也是一个比较大的问题。

9df02fc0eb4aaed9f2a9ccbda529ad8f.jpeg

图表12 应用研发过程中的难点

另外,在数据库引擎的研发过程中,引擎的设计和优化是非常重要的,因为它直接关系到数据库的运行效率和稳定性。数据显示,33% 的开发者认为在研发过程中最大的问题就是「工程实现难度大,模块之间的耦合度太高」。实际上,这也是开发数据库引擎时遇到的一个难点。

dfebf642fa4c8bc35545b53b0db54d6e.jpeg

图表13 研发数据库引擎的难点

虽然国产数据库发展稳中向好,但数据库迁移成本、兼容性等制约着国产数据库的发展,因此,国产数据库的发展也需要注意到这些问题,加强技术研发和团队建设,提高数据迁移和兼容性的能力,以更好地服务于广大用户。 

c026ef1ebc2522d8b12b1aae0d49b62e.jpeg

图表14 制约国产数据库发展因素

与此同时,数据库需要满足多方面的需求,以更好地服务不同行业和用户的需求。总体来看,数据库需要具备足够稳定和安全性,53% 的开发者更加关注数据库的稳定性。44% 的开发者关注数据库的安全性。当然,数据的正确性、处理速度性能也是非常重要。

814403ee600a0042b78a3f6b49f1f6f5.jpeg

图表15 行业对数据库的特定需求排行

李海翔解析道,新的数据表明,在数据正确性方面,采用严格的可串行化隔离级别的用户(40%)已经多于采用弱隔离级别的用户(32%)。这一点和传统的认知有所不同:在 Oracle 数据库一统天下的时代,即使金融类的应用为追求性能也只采用读已提交隔离级别,而把正确性的问题抛给开发者(开发者使用SELECT…FOR UPDATE)。人们普遍认为:弱隔离级别已经足够使用了。其实这一点非常不正确,在 DTCC 2022 大会上,有分享者给出数据证明:采用 SELECT…FOR UPDATE 从外部实现数据正确性的方法会严重导致数据库的性能下降,在较高并发场景下,数据库性能可能下降 70% 左右;所以数据库如何保证 100% 数据正确的背景下提高并发性能,对数据库研发而言是一个艰巨的挑战。

而如何解决上述提及到的数据库内核、数据库引擎以及让产品变得更智能更易用且更稳定的种种挑战,李海翔认为,当下或许可以思考 ChatGPT 技术能为数据库的易用性带来什么。

ae9cece49ca0c8ed6f2384249507577d.png

ChatGPT 的兴起,必然会对数据库的产品形态带来冲击

当展望数据库的未来发展方向,开发者的观点主要集中在以下几个方面:

1. 多模数据库,即一库多用。这种数据库开发技术可以将不同应用所需的各种数据整合到一个数据库中,满足多个应用场景需要,占比为 52%。

2. AI 融合数据库也成为一个热门方向。数据库结合人工智能技术,可以实现数据库的智能化、自动化运维,从而提高数据库性能,占比为 51%。

3. 与云计算深度结合的数据库,作为一种新型数据库技术,将极大地提升数据分析和数据处理能力,占比为 40%。 

e7fe18048a72edca6d4bdc5f8f73f066.jpeg

图表16 未来数据库发展方向

对此,李海翔表示,当下许多开发者看好 AI 融合数据库的发展,现如今随着 ChatGPT 的兴起,必然会对数据库的产品形态带来冲击,新品类的数据库系统,也许会兴起,可能的方向为:易用的数据库系统,人机交互方式和运维方式将得到巨大改变;数据库引擎的核心组件如查询优化器、执行器、事务处理模块等,都有希望获得巨大变化。

以上便是《2022-2023 中国数据库开发者调查报告》的内容。之后我们将陆续揭晓围绕开源、基础软硬件、云计算、AIOT 四大主题的调查报告,敬请期待。

相关阅读:

  • 《2022-2023 中国开发者现状调查报告》:最爱 ChatGPT,每天编码 300 行,月薪 8k-17k 占比骤减!

0b77e748fe3b6fd076ad75964c660f17.gif

 
☞超越 ChatGPT ?AutoGPT 爆火,两周斩获 50k+ Star:无需人类插手,自主完成任务!
☞GPT-4 让 Python 程序实现自修复 Bug,国外小哥将工具命名为“金刚狼”,并开源!
☞优酷回应非会员收看3000秒广告;亚马逊推出Titan大语言模型;Android 14首个Beta版本释出 | 极客头条

878d7aad2fb18f1ad993208672fd76ae.jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/19374.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

这里有一份教你每天用领英获取20个询盘的免费课程,手慢无

于2023年3月22日,我们圆满完成了深圳宝安的外贸分享交流会,时隔两个月即将迎来我们的广州场。 在上次深圳会议,有幸邀请到江西省跨境电商协会会长莅临 给大家分享了: 如何帮助传统制造业从“0”开始做外贸、如何借助平台为企业…

文心一言 VS 讯飞星火 VS chatgpt (27)-- 算法导论5.1 2题

二、请描述 RANDOM(a,b)过程的一种实现,它只调用 RANDOM(0,1)。作为a和b的函数,你的过程的期望运行时间是多少? 文心一言: 假设我们有一个伪随机数生成器,可以生成在[0,1)范围内的随机数。那么我们可以使…

文心一言 VS 讯飞星火 VS chatgpt (31)-- 算法导论5.2 3题

三、利用指示器随机变量来计算掷n 个骰子之和的期望值。 文心一言: 为了计算掷n个骰子之和的期望值,我们需要先了解一个重要的概念:指示器随机变量。 指示器随机变量是一种特殊的随机变量,它只有两个取值:0和1。通常…

Prompt提示工程的艺术: 解码 ChatGPT

随着ChatGPT的横空出世,prompt提示工程突然就成了一个时髦的技能,prompt的核心是制定科学有效的提示,以便于我们可以从大语言模型中得到更精确的输出。简单说,就是如何从任何人工智能模型中获得更好的输出结果。 做到这一点需要两…

一周 AIGC 丨马云回国首谈 ChatGPT,AIGC 用于旅游宣传片

图片来源:由无界AI生成 今天,在海外“流浪”近 1 年的马云回国的消息刷屏,被众多媒体解读为是对中国民营企业的一个重大的标志性事件。眼光一向超前的马云自然不会错过 ChatGPT 话题。他说:“ChatGPT 这一类技术已经对教育带来挑战…

AI怎么把游戏变好玩?米哈游出手了

《原神》发布两年半后,游戏新贵米哈游终于出新,上线了《崩坏:星穹铁道》。新游戏的一大亮点是内置了一个“图生图”的AIGC工具,用户可上传任何图片,生成对应风格的游戏角色“三月七”。 广大玩家脑洞大开,短短一周时间…

游戏人,卷得过AI吗?

将深燃设为“星标⭐” 第一时间收到文章更新 深燃(shenrancaijing)原创 整理 | 李秋涵 2023年,AI的热潮席卷各行各业。相比于大语言模型ChatGPT,AI绘画火得更早,目前看来,在市场上的应用也来的更早。 根据此…

RunningCheese Firefox 71.0 正式版 [1225]

RunningCheese Firefox V10 正式版开发前后经历4年才推出,全新的架构让 Firefox 焕发了第二春,有史以来最棒的 Firefox,高速流畅,一别卡顿。在速度比肩 Chrome 浏览器的同时,还保留了 Firefox 的强大功能,正…

ChatGPT+打印机自动写作业?都是科技与狠活

近日,有网友在Tik Tok上分享了一段视频,他通过ChatGPT加3D打印技术,成功实现了自动写作业。 自动写作业!这不是所有学生的梦寐以求的待遇吗? 小编的脑海中立刻闪过了《哈利波特》中会自动写字的羽毛笔,不过…

“高仿 Twitter” 1 天拿下 3000 万用户,惹马斯克发律师函:你个“山寨货”!...

整理 | 郑丽媛 出品 | CSDN(ID:CSDNnews) 上线 4 小时用户数破 500 万、7 小时破 1000 万,不到 24 小时破 3000 万……这般势如破竹的用户增长量,来自 Meta 旗下、号称“Twitter 的绝佳代替品”的 Threads。 为此&…

2023-03-13:给定一个整数数组 A,坡是元组 (i, j),其中 i < j 且 A[i] <= A[j], 这样的坡的宽度为 j - i。 找出 A 中的坡的最大宽度,如果不存在,返回 0

2023-03-13&#xff1a;给定一个整数数组 A&#xff0c;坡是元组 (i, j)&#xff0c;其中 i < j 且 A[i] < A[j]&#xff0c; 这样的坡的宽度为 j - i。 找出 A 中的坡的最大宽度&#xff0c;如果不存在&#xff0c;返回 0。 示例 1&#xff1a; 输入&#xff1a;[6,0,8,…

目前工资最高的几家外包公司汇总!(2023最新版)

点击上方“芋道源码”&#xff0c;选择“设为星标” 管她前浪&#xff0c;还是后浪&#xff1f; 能浪的浪&#xff0c;才是好浪&#xff01; 每天 10:33 更新文章&#xff0c;每天掉亿点点头发... 源码精品专栏 原创 | Java 2021 超神之路&#xff0c;很肝~中文详细注释的开源…

机器人语音生成技术的发展是否存在潜在风险?

机器人语音生成技术的发展引发了广泛的关注和期待&#xff0c;它使得机器可以像人类一样流利地说话。Meta、谷歌和其他科技公司的AI模型正在不断演进&#xff0c;能够从文本中生成逼真的语音。然而&#xff0c;这项技术的快速进步也带来了一些潜在的风险&#xff0c;引发了许多…

科技云报道:ChatGPT应用爆火,安全的大数据底座何处寻?

科技云报道原创。 毫无疑问&#xff0c;AIGC正在给人类社会带来一场深刻的变革。 而剥开其令人眼花缭乱的华丽外表&#xff0c;运行的核心离不开海量的数据支持。 ChatGPT的“入侵”已经引起了各行各业对内容抄袭的担忧&#xff0c;以及网络数据安全意识的提高。 虽然AI技术…

ChatGPT日活超千万/ 小米回应汽车设计图纸泄露/ 疑英伟达RTX 4090 Ti原型显卡曝光…今日更多新鲜事在此...

日报君 发自 凹非寺量子位 | 公众号 QbitAI 大家好&#xff0c;今天是节后复工第二天&#xff0c;1月29日星期日&#xff5e; 和日报君来看看&#xff0c;今天科技圈有哪些新鲜事吧。 小米回应汽车设计图纸泄露&#xff0c;称非最终文件 近日&#xff0c;疑似小米首款车型的设计…

一套系统让打工人瑟瑟发抖,监控员工离职动态。

金磊 杨净 发自 凹非寺量子位 | 公众号 QbitAI 前脚投简历&#xff0c;后脚就被精准裁员。 一位网友最近就爆出了这样一段真实经历&#xff0c;而且还称被领导教育了一通&#xff1a; 别以为你上班干啥我都不知道&#xff0c;你啥时候想走我都一清二楚&#xff01; 随之引发热议…

ChatGPT 有了自己的“电脑”,是机会还是风险?

人工智能即将到来&#xff0c;我们根本不知道结果会是什么&#xff0c;所以我们的责任是推动人工智能取得积极的成果&#xff0c;让我们的生活变得更加美好。 原文链接&#xff1a;https://stratechery.com/2023/chatgpt-learns-computing/ 未经授权&#xff0c;禁止转载&#…

ChatGPT文心一言逻辑大比拼(一)

❤️觉得内容不错的话&#xff0c;欢迎点赞收藏加关注&#x1f60a;&#x1f60a;&#x1f60a;&#xff0c;后续会继续输入更多优质内容❤️ &#x1f449;有问题欢迎大家加关注私戳或者评论&#xff08;包括但不限于NLP算法相关&#xff0c;linux学习相关&#xff0c;读研读博…

ai+口语,一款超不错以chatgpt做出来的小程序!

chatgpt 在最近这个gpt发展的热火朝天的时候&#xff0c;我们可以看到很多很多ai生成的软件出现在我们面前&#xff0c;对于我们来说我们在这段时间可以利用到这些软件去更好的提升自己想要提升的方面&#xff0c;那么我今天主要讲的是ai口语组合起来的一个小程序去说说 小程…

2022阿里巴巴内推码,欢迎来投

人狠话不多&#xff0c;快到我这来。 可以帮你查查流程啥的。