二十年大数据到 AI,图灵奖得主眼中的数据库因果循环

最近,MIT 教授 Michael Stonebraker 和 CMU 教授 Andrew Pavlo (Andy) 教授联合发表了一篇数据库论文。Michael Stonebraker 80 高龄,是数据库行业唯一在世的图灵奖得主,Andy 则是业界少壮派里的最大 KOL。

file

一老一少,当今数据库届最王炸的组合,合作写的论文题目是

file

作为业界顶流,当然是不会刷「An Empirical Comparison of xxx」的水文。不过 What Goes Around Comes Around 的标题也着实特别,中文翻译过来是「种瓜得瓜,种豆得豆」,「因果报应」,而后面又跟了一个 Around。其实这是一篇续作,在差不多 20 年前,Stonebraker 教授和另一位教授,UC 伯克利的 Joseph M. Hellerstein 曾经合著了一篇

file

而 Andy 其实也是 Stonebraker 教授那篇文章的粉丝。

file

当年论文的起因是当时数据库界兴起了一股反关系型,反 SQL 的浪潮。而在两位教授眼里,其实是历史的倒退,于是忍不住写了一篇科普文,好心劝大家这些看着时髦的东西之前已经玩过一轮了。

file

而这次论文的时间点也刚好,站在云和 AI 交叉点之间。下面做一些论文的摘录。

介绍

首先呼应了一下当年的论文,列出了数据库到 2005 年的演进史。

file

然后列出了近 20 年的发展,分别从数据模型/查询语言(Data Models & Query Languages),以及系统架构(System Architectures) 两部分入手。

file

file

数据模型和查询语言

file

继续呼应当年的论文,事实证明当年的论文判断都没有错。NoSQL 只是一时狂热,当年的 NoSQL 要么都挂了,活下来的,也都老老实实地加上了类 SQL 的语法。

file

谈到被 AI 带起来的向量数据库,论文的观点是传统的关系型数据库和向量数据库,会和当年的 NoSQL 一样,双向奔赴。

系统架构

file

列存系统因为优越的性能颠覆了整个数据仓库。

file

云改变了整个数据库架构,也是所谓的云原生数据库。

图片

云模式也诞生了新的商业模式,以及开源厂商和云厂商间新的商业竞争。

file

file

数据湖从一个看似糟糕的主意,经过各种中间件加持,变得可以接受了(数据量那么大,也没有办法)。

file

NewSQL 同时吸收传统关系型数据库和 NoSQL 的优点。

file

硬件加速,无足轻重。

file

区块链数据库,币圈交易所自己都不用。

教授的总结

file

Oracle,MySQL,Mongo,流行难道是原罪?

file

file

file

小心大公司开源的数据库,人家只是为了晋升,还请你们不要当真。

file

上手体验很重要,瞧瞧人家 DuckDB。

file

file

ORM 是不错,但到头来 SQL 也还是逃不过。

file

file

数据库结合 AI,长期乐观,短期怎么交差?

个人点评

前后两篇 What Goes Around Comes Around 都很值得一读。我是在 2010 年前后读到了第一篇,由那篇论文才得以系统性地了解数据库的发展史。而最近的这篇,一方面有近 20 年数据库的发展更新,一方面也有对第一篇里的复盘,所以包含了更多的商业洞见。历史对将来总是有借鉴意义,比如对于向量数据库的展望,我们可以参考之前 NoSQL 数据库的发展。但未来又总是无法预测,即使是全球最顶尖的教授,在当年的第一篇论文里,Open-Source 和 Cloud 两个词的出现次数均为 0。

file

file

而 open-source 和 cloud 是近 20 年里,推动数据库行业前进最核心的两个因素。在新的这篇,open-source 和 cloud 分别出现了 17 和 42 次。

file

file

另外值得一提的,是在这次新的论文中,也提到了国内数据库厂商,向量数据库赛道的 Milvus 和 NewSQL 的 TiDB。

file

file

从大型机,小型机,到互联网,云计算,每一次信息行业的变革,数据库都不会缺席。当下的数据库虽然暂时被淹没在了 AI 的浪潮中,但未来可期。毕竟当年我们只能看到 NoSQL,但也没想到后面更大的云和开源。

file

希望 Stonebraker 老爷子保重身体,20 年后完成三部曲。

2005 What Goes Around Comes Around. Michael Stonebraker, Joseph M. Hellerstein
https://15721.courses.cs.cmu.edu/spring2020/papers/01-intro/whatgoesaround-stonebraker.pdf

2024 What Goes Around Comes Around… And Around… Michael Stonebraker, Andrew Pavlo
https://db.cs.cmu.edu/papers/2024/whatgoesaround-sigmodrec2024.pdf


💡 更多资讯,请关注 Bytebase 公号:Bytebase

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/373531.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

获超九成Gartner用户力推!FortiGate连续五年斩获“客户之选”称号

近日,Gartner Peer Insights™ 网络防火墙客户之选报告发布,Fortinet 连续第五年荣登这项权威榜单。该评选结果源于广大用户对 Fortinet 防火墙产品的真实反馈,是客户选择 Fortinet 的重要参考依据,也是FortiGate能够占据全球防火…

玩鸣潮提示错误代码126:加载x3daudio1_7.dll失败无法打开的多个详细有效解决方法分享

玩游戏期间你是否也有遇到过找不到x3daudio1_7.dll无法继续执行代码打不开游戏?那么遇到这个问题要怎么办?有什么方法能解决?今天详细给大家介绍一下如何解决找不到x3daudio1_7.dll文件或x3daudio1_7.dll丢失的多个不同方法! 第一…

数据开源 | Magic Data大模型高质量十万轮对话数据集

能够自然的与人类进行聊天交谈,是现今的大语言模型 (LLM) 区别于传统语言模型的重要能力之一,近日OpenAI推出的GPT-4o给我们展示了这样的可能性。 对话于人类来说是与生俱来的,但构建具备对话能力的大模型是一项不小的挑战,收集高…

three-platformize 微信小程序 uniapp 使用截图功能

最近需要将3d场景进行截图,但是网上的各种各样,看的我一团乱麻,因此在解决完后就将这些简单的分享一下; 原理:将3维场景的那个canvas中的像素提取出来,找一个空的canvas二维画布放上去,然后用二…

【鸿蒙学习笔记】Stage模型

官方文档:Stage模型开发概述 目录标题 Stage模型好处Stage模型概念图ContextAbilityStageUIAbility组件和ExtensionAbility组件WindowStage Stage模型-组件模型Stage模型-进程模型Stage模型-ArkTS线程模型和任务模型关于任务模型,我们先来了解一下什么是…

Pearson 相关系数的可视化辅助判断和怎么用

Pearson 相关系数的可视化辅助判断和怎么用 flyfish Pearson 相关系数 是一种用于衡量两个连续型变量之间线性相关程度的统计量。其定义为两个变量协方差与标准差的乘积的比值。公式如下: r ∑ ( x i − x ˉ ) ( y i − y ˉ ) ∑ ( x i − x ˉ ) 2 ∑ ( y i −…

RK3568平台(opencv篇)opencv处理图像视频

一.读取图像文件并展示 灰度图像: 灰度图需要用 8 位二进制来表示,取值范围是 0-255。用 0 表示 0(黑色), 用 255 表示 1(白色),取值越大表示该点越亮。 RGB 彩色图像:…

计算机网络浅谈—什么是 OSI 模型?

开放系统通信(OSI)模型是一个代表网络通信工作方式的概念模型。 思维导图 什么是 OSI 模型? 开放系统互连 (OSI) 模型是由国际标准化组织创建的概念模型,支持各种通信系统使用标准协议进行通信。简单而言,OSI 为保证…

【问题记录】VsCode中以管理员权限运行Powershell

问题展示 今天在尝试运行nodemon命令的时候出问题,显示没法识别,经过分析发现是管理员权限的问题,由于是在vscode里面进行开发,因此特此进行配置。 方法一 直接在vscode命令行中输入如下命令: Start-Process powers…

如何查询并下载韩国签证

登录大韩民国签证门户网站(https://www.visa.go.kr),点击“查询/签发”- “办理进度查询及打印”。 2) 输入护照号码、英文姓名及出生日期后点击查询。 3) 若签证通过,办理状态信息栏下面会显示签证信息。 4)点击“签证…

人生苦短,我用Python+Docker

今天用一个简单的例子,介绍下如何使用Docker进行Python部署。 前期准备 本地需要有Python环境; 一个Linux的服务器并已经装好Docker ; 能把代码上传到服务端的工具。 本文的本地环境是Win10Python3.12,服务器使用Ubuntu的云服…

springboot通江银耳销售管理系统-计算机毕业设计源码15998

摘要 随着人们健康意识的增强,银耳这种传统的中药食材备受关注。而通江银耳是四川省通江县特产,中国国家地理标志产品。四川省通江县是银耳的发源地,中国银耳之乡,通江银耳因主产于此而得名,以其独到的质厚、肉嫩、易炖…

Objective-C 中的 isa 不再是简单的结构体指针

了解 Objective-C 中的 isa 指针内存结构 在 Objective-C 中,isa 指针是对象和类之间的重要桥梁。它不仅帮助运行时系统识别对象的类型,还参与了一些内存和性能优化。本文将深入讲解 isa 指针的内存结构,包括其在早期和现代实现中的演变。 …

彩虹小插画:成都亚恒丰创教育科技有限公司

彩虹小插画:色彩斑斓的梦幻世界 在繁忙的生活节奏中,总有一抹温柔的色彩能悄然触动心弦,那就是彩虹小插画带来的梦幻与宁静。彩虹,这一自然界的奇迹,被艺术家们巧妙地融入小巧精致的插画之中,不仅捕捉了瞬…

海外金融机构银行保险证券数字化转型营销销售数字化成功案例讲师培训师讲授开户销售营销客户AI人工智能创新思维

金融机构需要数字营销的主要原因 数字银行、直接存款和移动网络的兴起让客户无需前往当地分行即可轻松办理银行业务。这些举措不仅提升了用户体验,也迫使银行向数字化世界迈进。 金融服务公司需要在数字营销渠道上保持稳固的地位,以免落后于大型机构。…

man手册的安装和使用

man手册 - HQ 文章目录 man手册 - HQ[toc]man手册的使用Linux man中文手册安装man中文手册通过安装包安装通过apt安装 配置man中文手册README使用说明配置步骤 man手册的使用 首先man分为八个目录,每个目录用一个数字表示 1.可执行程序2.系统调用3.库函数4.特殊文…

2024亚太杯中文赛数学建模B题word+PDF+代码

2024年第十四届亚太地区大学生数学建模竞赛(中文赛项)B题洪水灾害的数据分析与预测:建立指标相关性与多重共线性分析模型、洪水风险分层与预警评价模型、洪水发生概率的非线性预测优化模型,以及大规模样本预测与分布特征分析模型 …

[Linux]安装+使用虚拟机

首先下载(提取码 : ssjf)虚拟机(应该是必须要下载17的了 , 我刚开始下载了15,16的在解决了不兼容的问题后频繁出现蓝屏的 ) 刚开始我遇见了 小问题 --》 在查看了以下两篇blog就解决了 虚拟机无法打开,…

防火墙安全策略用户认证综合实验

基础配置 1,交换机配置(LSW5) 划分vlan10和vlan20,将g0/0/1与与防火墙化为trunk干道,使用防火墙路由模式(子接口),g0/0/2和g0/0/3化为access链路,分别连接生产区&#xf…