KaiwuDB CTO 魏可伟:回归用户本位,打造“小而全”的数据库

8月16日,KaiwuDB 受邀亮相第十四届中国数据库技术大会 DTCC 2023。KaiwuDB CTO 魏可伟接受大会主办方的采访,双方共同围绕“数据库架构演进、内核引擎设计以及不同技术路线”展开深度探讨。

在这里插入图片描述
以下是采访的部分实录 ↓↓↓

40 多年前,企业的数据量还没有如此庞大,会选择把关键业务数据放在关系型数据库中。随着软硬件的发展,计算和存储成本不断降低,数据库技术进入新的发展阶段。以 IoT 场景为例,这是一个由各种新技术相互交错形成的“泛”行业,看似宽口进,实则门槛高。

IoT 与 5G、工业 4.0、工业物联网、车联网、人工智能等形成“组合拳”,为各个行业的数字化转型赋能,但也导致业务系统的复杂性攀升。当数据来自时序、文档、空间、图等多个数据源,各数据源又面向不同的数据库系统、接口服务等,导致最终的数据采集不完整,出现数据不一致的现象。

所谓“术业有专攻”,专库专用在一段时间里成为“专宠”,但也造成了数据孤岛。通常情况下,一家企业使用的关系型数据库是 A 家,时序数据库又是 B 家,同时可能还有 C 家的 AI 平台。这意味着企业需要拥有身兼多种技能的开发运维人才;否则,一旦涉及到新功能及多个产品之间的协同,就会影响迭代速度。

如果能用一套数据库去替换原来多套不统一的数据库类型,来解决业务的复杂性以及开发和运维成本不断攀升的问题,那企业面临的很多问题也将迎刃而解。多模数据库可能就是一个好答案。

一、多模架构,用“小而全”为用户减负

“从传统关系型数据库主导市场,到 NoSQL 数据库兴起,再到时序数据库,图数据库,向量数据库百花齐放,今天的多模数据库旨在化繁为简,支持多种数据模型统一管理。”魏可伟表示,多模式数据库是数据管理系统不断演进的结果,多种类型的数据库系统混用带来的开发和运维压力,使得企业不得不做出新的选择。

当前,业内主流的多模数据库可大致归结为 2 种路线:

  • 粘合式

即大而全的平台式多模,把各种不同类型的数据处理引擎,包括关系引擎,集成在一起,上层以中间件的形式对外提供一个统一接口,进行数据的分发、转换等工作。

然而现实情况是,很多大而全的功能在实际业务场景中根本用不上。具体到上层的引擎,为了实现多模的能力,粘合式路线会把所有引擎都拉到一个中间层,再做数据搬动,给开发和运维带来极大的压力。

  • 生长式

以关系型数据库为主,为了处理图、文档等 NoSQL 数据扩展出新的能力;同时,除了关系型数据库厂商,图数据库、空间数据库厂商也在基于自己的本行向新的能力扩展,这都属于生长式。

这种模式相对适用于有一个传统应用,又想基于原有应用做少量的异构数据扩展的情况。比如:金融行业的交易处理是日常应用,同时需要扩展少量的空间数据库满足业务需求,这种业务场景更适合用生长式数据库。

但生长式多模架构在后期扩展能力上存在一定局限,此前主体数据库架构可能根本就不支持新功能的扩展。

有别于上述两种情形,KaiwuDB 自研原生多模系统,从顶层设计上天然具备横向融合、纵向精专的能力。依托"就地计算"、"原生 AI"等核心技术,KaiwuDB 快速支持时序数据、内存数据、关系型数据等在同一数据库中统一汇存、处理及 AI 智能分析。

其中,最大特色是统一的 SQL 语法、统一的数据库命令、统一的开发运维工具、统一的安全认证,能够将不同数据库功能充分融合,实现一库多用,进而降低用户的使用成本,用魏可伟的话说,就是“小而全”。

KaiwuDB 一直在思考多模架构到底做到何种程度才能满足 IoT 领域用户的需求而又能做到简单易用?

首先,时序数据处理的性能和扩展能力一定是高要求,同时要想办法降低存储成本;其次,要提供符合 IoT 数据特征的数据管理工具以及数据库自治的能力;最后,要以分析为先、以 AI 为先,能够从海量数据中挖掘出数据价值,为 IoT 业务场景提供专业的服务。

此种背景下,KaiwuDB 给自己的定位是,在设计上有横有纵,打造一个“又融又专”的多模架构。

  • “融”

指针对不同的数据类型,开发能发挥最大性能的专用数据处理引擎,例如 KaiwuDB 时序引擎,利用“就地计算”技术可以实现每秒数百万级的数据写入,毫秒级响应千万级数据的分析查询。

  • “专”

指融合多个专用引擎以支持 IoT 业务场景,在多个专用引擎之间形成统一的优化,统一的管理,同时又根据 IoT 数据处理的特点建立“快速通道”。

比如,在数据写入场景中,KaiwuDB 会优先考虑时序数据的写入性能并做优化,从而实现专用时序数据库的时序数据处理性能。

这就与传统“粘合式”和“生长式”的数据库形成本质区别。再有,KaiwuDB 会为时序数据到关系数据分析的内部“ETL”流程“打开快车道”,从而提升性能并节约资源。

站在用户本位,以数据库创新技术简化应用,让产品功能无限地贴近用户需求,是 KaiwuDB 这一新生代数据库持续努力的方向。

二、AI 引擎,为企业插上数智化升级翅膀

相较于对热点大模型技术的趋之若鹜,KaiwuDB 强调“原生 AI”的概念。

在 AI for DB 方向上,KaiwuDB 利用 AI 引擎实现数据库自治。比如,在时序数据场景中,会以时间维度进行数据的聚合分析,这背后的一项关键技术是智能预计算——即利用 AI 大脑预判用户会对哪些内容会做聚合分析,提前把结果计算好。
这一能力可快速实现结果反馈,极大程度提升性能;在生命周期管理方面,也可以通过 AI 对用户使用情况做出预判,如果 AI 预判用户对某一类数据不再频繁调用,可以自动挪到冷存储上,降低资源占用。

在 DB For AI 研发方向上,KaiwuDB 的“原生 AI“概念并非要打造 TensorFlow 这样的 AI 框架,即:不是去做算法,而是在多模的框架下拥抱生态,为用户提供更好的消费 AI 的能力,这种能力可以概括为“ModelOps in DB”。

ModelOps in DB 的理念是:让用户通过数据库更好地使用 AI,通过数据处理拉近数据科学家和开发运维人员的距离。通过 ModelOps in DB,能够提高模型训练和预测的性能,保证数据的安全性,更能够利用数据保持模型的准确性。

例如,当用户把数据拉出到 AI 平台训练模型,用来做业务预测,刚开始的时候可能准确率很高,但随着时间的推移会产生漂移现象,也就是模型准确率会下降。这是因为用来训练模型的数据已经过时,而通过原生 AI 的能力,在数据库中就可以第一时间发现漂移现象,做出相应的反应。

“大模型给我们一个非常有意思的启发,如果自然语言变成数据库角度的一个接口,多模会变成一个更自然的选择。” 魏可伟分析道,SQL 生态已经发展了几十年,有很多成熟的工具构建,是一个关键的数据库接口。站在大模型的风口,我们再去看多模的未来,各种专用引擎会在自然语言的交互方式下统一起来,人人都可以在低门槛的状态下使用数据库,这应该会是多模的终极形态。

在 KaiwuDB 技术团队中,有很多开发人员致力于 AI 方向,解决 AI 落地的消费性问题,这也是 AI 和数据库结合的关键点。

未来,KaiwuDB 除了在异构数据跟 AI 结合的方向上进行努力,在用户关注的重要场景上持续发力,也会关注大模型的支持,比如:引入向量数据库,在现有的多模架构上,再多出一模。

今天,在 AI 技术推动下,数据处理能力也在不断演进,诸多企业正在把数据对象里的信息抽取,无论是什么对象,或者无论是什么实体所包含的语义信息,都可以变成一个向量,然后再进行分析。而嵌入向量功能的数据库,会更好地支持 AI 应用。因此,AI 和数据库正以相互作用的形态,共同进步,释放用户的数据消费潜力。

写在最后

未来,不管是多模数据库本身的发展,还是与 AI 的结合,KaiwuDB 都将坚持回归用户本位,专注于打造一款“小而全”的数据库产品。在面对国内外用户对于产品性能与产品性价比“既要又要”的挑战下,KaiwuDB 也将不忘初心,秉承“匠心”精神走出自己的新路子,给市场与用户带来更多的可能。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/101379.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Lua之Lua源文件批量转换为luac字节码文件

准备的工具:luac.exe CSDNhttps://mp.csdn.net/mp_download/manage/download/UpDetailed Unity版: using System; using System.Collections; using System.Collections.Generic; using System.IO; using UnityEditor; using UnityEngine;public static class Bat…

Postman 如何进行参数化

前言 Postman作为一款接口测试工具,受到了非常多的开发工程师的拥护。 那么做为测试,了解Postman这款工具就成了必要的了。 这篇文章就是为了解决Postman怎么进行参数化的。 全局变量 全局变量是将这个变量设置成整个程序的都可以用,不用去…

Coremail参与编制|《信创安全发展蓝皮书——系统安全分册(2023年)》

信创安全发展蓝皮书 近日,Coremail参与编制的《信创安全发展蓝皮书—系统安全分册(2023年)》重磅发布。 此次信创安全发展蓝皮书由工业和信息化部电子第五研究所联合大数据协同安全技术国家工程研究中心重磅共同发布。 本次蓝皮书涵盖信创系…

开发一个npm组件包

vue项目初始化 vue create mytest 启动项目以后 组件开发 开发的组件写在 package中 如下如例 开发一个 listpage的组件 里面放了一个a链接注册组件配置打包 "package": "vue-cli-service build --target lib ./src/package/index.js --name managerpage -…

大数据——一文熟悉HBase

1、HBase是什么 HBase是基于HDFS的数据存储,它建立在HDFS文件系统上面,利用了HDFS的容错能力,内部还有哈希表并利用索引,可以快速对HDFS上的数据进行随时读写功能。 Hadoop在已经有一个HiveMapReduce结构的数据读写功能&#x…

【数据分析】波士顿矩阵

波士顿矩阵是一种用于分析市场定位和企业发展战略的管理工具。由美国波士顿咨询集团(Boston Consulting Group)于1970年提出,并以该集团命名。 波士顿矩阵主要基于产品生命周期和市场份额两个维度,将企业的产品或业务分为四个象限…

LabVIEW模拟化学反应器的工作

LabVIEW模拟化学反应器的工作 近年来,化学反应器在化学和工业过程领域有许多应用。高价值产品是通过混合产品,化学反应,蒸馏和结晶等多种工业过程转换原材料制成的。化学反应器通常用于大型加工行业,例如酿酒厂公司饮料产品的发酵…

多维时序 | MATLAB实现SCNGO-BiLSTM-Attention多变量时间序列预测

多维时序 | MATLAB实现SCNGO-BiLSTM-Attention多变量时间序列预测 目录 多维时序 | MATLAB实现SCNGO-BiLSTM-Attention多变量时间序列预测预测效果基本介绍模型描述程序设计参考资料 预测效果 基本介绍 多维时序 | MATLAB实现SCNGO-BiLSTM-Attention多变量时间序列预测。 模型描…

Hadoop集群搭建(hadoop-3.3.5)

一、修改服务器配置文件 1、配置环境变量 vim /etc/profile #java环境变量 export JAVA_HOME/usr/local/jdk/jdk8 export JRE_HOME$JAVA_HOME/jre export CLASSPATH$JAVA_HOME/lib:$JRE_HOME/lib:$CLASSPATH export PATH$JAVA_HOME/bin:$JRE_HOME/bin:$PATH #hadoop环境变量 …

SQLSTATE[IMSSP]: The active result for the query contains no fields.

我的是SQL server 报错场景,代码: $psendmx_sql"SET IDENTITY_INSERT PSENDMX ON;INSERT INTO psendmx (DJBH,MIBH,MXBH,SPDM,GG1DM,GG2DM,SL,SL_2,CKJ,ZK,DJ,DJ_1,JE,HH) VALUES {$mx_values};SET IDENTITY_INSERT PSENDMX OFF;"; $a$db_er…

线性代数的学习和整理---番外1:EXCEL里角度,弧度,三角函数

目录 1 角的度量:角度和弧度 1.1 角度 angle 1.1.1 定义 1.1.2 公式 1.1.2 角度取值范围 1.2 弧长和弦长 1.3 弧度 rad 1.3.1 弧长和弧度定义的原理 1.3.2 定义 1.3.3 取值范围 1.3.4 取值范围 1.4 角度,弧度的换算 1.5 EXCEL里进行角度和…

k8s ingress (二)

k8s ingress (二) Ingress介绍 在前面课程中已经提到,Service对集群之外暴露服务的主要方式有两种:NodePort和LoadBalancer,但是这两种方式,都有一定的缺点: NodePort方式的缺点是会占用很多集群机器的端口&#xff0…

Apollo自动驾驶:引领未来的智能出行

自动驾驶技术正日益成为当今科技领域的焦点,它代表着未来出行的一大趋势,而Baidu公司推出的Apollo自动驾驶平台则在这一领域中展现出强大的领导地位。本文将深入探讨Apollo自动驾驶技术的关键特点、挑战以及它对未来智能出行的影响。 Apollo自动驾驶平台…

SpringBoot(二)

###SpringBoot原理分析 ###SpringBoot监控 ###SpringBoot项目部署 #SpringBoot自动配置 Condition:(条件) Condition是在Spring4.0增加的条件判断功能,通过这个功能可以实现选择性的创建Bean操作 SpringBoot是如何知道要创建…

设计模式-观察者模式

观察者模式 ● 行为设计模式,允许对象存在的一种一对多的关系 ● 当一个对象发生变化,所有依赖他的对象都会得到通知并自动更新。 ● 在这种模式中,发生状态变化的对象叫作“主题”,依赖他的对象被称为“观察者” 观察者例子的简…

【VS】InstallerProjects.vsix下载 Microsoft Visual Studio Installer Projects (2022)

InstallerProjects.vsix 是微软官方提供的winform程序打包工具,但是国内下载安装有时候比较慢。虽然只有5m左右,但是国内就是下载不下来。现将官网地址和下载后的百度网盘共享地址展示如下:方便大家使用 官方地址:https://market…

再JAVA中如何使用qsort对类进行排序?

目录 结论&#xff1a; 解析&#xff1a; 结论&#xff1a; import java.util.Arrays;class Person implements Comparable<Person>{public String name;public int age;public Person(String name, int age) {this.name name;this.age age;}Overridepublic Stri…

# Lua与C++交互(二)———— 交互

C 调用lua 基础调用 再来温习一下 myName “beauty girl” C想要获取myName的值&#xff0c;根据规则&#xff0c;它需要把myName压入栈中&#xff0c;这样lua就能看到&#xff1b;lua从堆栈中获取myName的值&#xff0c;此时栈顶为空&#xff1b;lua拿着myName去全局表中查…

通讯录管理系统

1、简介 最近在学习C&#xff0c;通过观看黑马的教程进行学习&#xff0c;本文主要对通讯录管理系统的内容进行代码复现笔记&#xff0c;方便以后复习与使用&#xff0c;也方便大家复制使用&#xff0c;节约学习时间。 2、显示函数界面 2.1 函数框架 #include<iostream&…

冠达管理:非银金融是什么?

非银金融&#xff08;Non-banking Financial Institutions&#xff0c;简称非银&#xff09;是指除了传统的银行以外的其他金融机构。与银行不同的是&#xff0c;非银金融机构没有颁发钱银的权利&#xff0c;但在金融市场中发挥着重要的效果。在全球范围内&#xff0c;非银金融…