深耕文档型数据库12载,SequoiaDB再开源

1月15日,巨杉数据库举行SequoiaDB新特性及开源项目发布活动。本次活动回顾了巨杉数据库深耕JSON文档型数据库12年的发展历程与技术演进,全面解读了SequoiaDB包括在高可用、安全、实时、易用性四个方向的技术特性,宣布了2024年面向技术社区的开源计划。此次发布活动不仅是对SequoiaDB性能的全面介绍,更是对十余年来始终坚守以JSON文档型数据库内核为技术底座的发展历程的深刻回顾。不忘来时路,方知向何行,巨杉数据库也将在2024年新年伊始,迎来新的篇章,开启新的征程!

稳健发展,行业影响力不断提升

回顾过去,巨杉数据库自2011年研发内核、2012年公司成立,至2013年推出SequoiaDB v1.0版本,再到如今已走过十二个春秋。历经12年的洗礼,巨杉数据库也取得了令人瞩目的成就。目前,巨杉数据库已经在超过100家大型银行及金融机构的核心生产业务规模应用,覆盖各行业的企业用户总数超过1000家。在金融行业,其客户群体涵盖国有银行、股份制银行、省级农信、城商行、保险、证券等

金融机构,同时还积极扩展政府、汽车、新能源等多个行业客户,赢得了广泛的市场认可。其中超过50家企业的应用时间已超过6年,最长的系统运行时间甚至达9年。 自成立以来,公司实现稳健发展,行业影响力不断提升,数据量及业务接入保持持续增长态势。

守正创新,发展JSON文档型内核

巨杉数据库SequoiaDB以 JSON 文档型数据库内核为技术底座,通过分布式架构为众多客户提供了多元化的业务和全方位的支持。 正是因为对技术创新的坚持以及对市场需求的洞察,巨杉数据库始终坚守JSON文档型内核,在持续迭代中实现创新发展。

在JSON基础能力方面 ,从最初 v1版本,实现 CURD 原子性的操作以及基础的ACID支持,到 v2 版本逐步提升对LOB大对象的存储能力,标志着巨杉数据库具备“多模数据”处理能力,同时支持存储过程、聚集计算等特性。在 v3.0 版本中,进一步提供自增序列全文检索、基于时间点的数据恢复和兼容部分 Mongo 语法。跨越4.0版本,到v5.0 版本,SequoiaDB 着力提升稳定性能,对于统计信息、访问计划、存储等进行了大量优化,提供死锁检测等功能,并进一步地兼容 Mongo 3、 Mongo 4 的语法。

在分布式管理方面, 从基础的多分区原生分布式架构,逐步提供读写分离、主子表、策略访问、多中心容灾、精细化容灾等特性,持续增强分布式能力。 在安全性方面, 涵盖从基础的鉴权、加密到信创的各类能力。此外,推出了SCM内容管理引擎,专注于非结构化数据和多模数据处理的统一数据生命周期管理。 在易用性方面, 通过SAC运营的管理平台,全面提升DBA运维的便捷性。

十二年来,巨杉数据库基于JSON文档型数据底座和分布式架构的不断更新与迭代,为企业提供可靠的数据处理和存储解决方案,帮助企业优化业务效率,提升客户满意度。

广泛拓展,基于文档型技术的应用场景

在中国乃至全球范围内,“CM场景”是文档型技术应用中重要且突出的场景。基于处理多变的数据结构和庞大的数据量的迫切需求,催生了“CM内容管理平台”,同时极大地推动了SequoiaDB技术的创新。巨杉数据库持续跟进客户需求,进行技术迭代,实现从1.0 到 5.0 的跨越式发展。 巨杉数据库为金融银行客户提供,稳定、可靠、可持续扩展的「CM内容平台」成为「银行影像平台」及「非结构化管理平台」的数据基础设施,目前已吸纳超过100家客户使用该场景。可以说,基于文档型技术并应用于“CM内容管理平台”场景是巨杉数据库取得的最为显著的成果之一,这一场景也持续为巨杉数据库贡献了超过85%的客户及营收,成为业务的主打业务场景。

此外, 文档型数据库在在线业务系统、实时数据湖、IoT领域以及AGI人工智能等领域也得到广泛应用。JSON灵活的格式适合各种在线业务系统,尤其是面向需要快速迭代开发的各类APP的业务应用,基于文档型数据库的开发,可以显著提升团队的研发效率。在实时数据湖方面,巨杉数据库借助JSON灵活的数据处理能力,已助力多家客户构建全量历史数据平台,支持跨系统、跨业务的实时高并发数据查询。

Vector Search基于文档型技术,探索AGI数据应用新边界

AGI 通用人工智能的发展,将进一步推动JSON文档型数据类型的应用(实际上,本次发布活动中,Vector Searche部分的讲解也是通过AI技术合成的)。

传统AI应用中,需要存取及处理的是,海量的半结构化「 CM 内容管理」数据、「动态标签」数据,以及各类非结构化对象数据。这些都正是 SequoiaDB 过去12年聚焦及取得显著成果的领域技术,而 AGI 全新的爆发性发展,必将对 JSON 文档型技术,带来全新的机遇及技术挑战。当前,业界领先的 Open AI、文心一言等大模型平台中,JSON 已经被指定为对内,及对外,函数调用的,标准数据传输格式。

另外,我们可以看到 “向量数据” 在 AGI 通用人工智能发展中得到了关键的应用,需要更有效的数据库处理能力。

向量数据的存放格式天然就可以用 JSON 结构表示,非常适合通过文档型数据库处理。然而,单独使用向量数据,并不能解决业务的全景问题。在业务过程中,向量数据还必须与其他业务数据进行组合使用,才能发挥其价值。因此 SequoiaDB 也正在探索, 为文档型数据库提供 「Vector Search 向量搜索」能力,为保存到 SequoiaDB 的向量数据,提供高效的查询能力,这一特性将在2024年与大家见面。

要注意的是,我们并不需要发展独立的向量数据库产品,而是基于深耕了12年的 JSON 文档型数据库底座技术为基础,进行向量查询能力的扩展,这将可以帮助企业,驱动实体世界的更多数据,和 AGI 通用人工智能进行有效链接,释放全量数据价值。

四大特性,释放全量数据价值

巨杉数据库基于JSON文档型底座对SequoiaDB 进行了全面升级,此次发布活动全面解读了SequoiaDB 的四大特性——高可用、安全、实时和易用。

 高可用: 文档型数据库处理的数据,包括了结构化的元数据、半结构化的标签数据,以及非结构化的对象数据。对于PB级大数据或上百节点规模的大集群,在面对重大灾难时的数据可靠性、数据一致性和系统可用性时都面临着巨大挑战。精细化容灾能有效地帮助客户实现针对这些数据的多中心容灾,从而提升整体系统的高可用和数据高可靠能力。

安全: 巨杉数据库不仅在技术上通过国密算法和硬件加速来平衡安全与性能,还提供了跨国内外不同芯片、不同操作系统的混合部署能力。这意味着巨杉数据库可以实现集群的异构部署,平滑地进行硬件资源的替换,对上层业务系统做到完全透明,保障业务连续性。

实时: 巨杉数据库凭借JSON文档型数据结构的Schema灵活性,为企业提供了全量数据底座。DDL的实时变更、横向扩展能力,以及高性能的并发点查能力等都颠覆了传统ODS数据贴源层的界限,使得ODS能够服务于实时业务,满足对客实时数据查询和企业内部跨业务数据实时汇总的需求。

易用: 巨杉数据库进一步增强了SAC的监控、告警和管理等功能。一站式的数据管理工具,极大地方便了DBA的管理工作,提高了问题排查的效率并简化了对系统的监控管理,从而为业务带来更高的稳定性和效率。

开 放、开源共赴新篇章

新年伊始,巨杉数据库也将谱写崭新篇章。发布会介绍,巨杉数据库决定将在2024年Q1再次发布开源版本,不仅希望获得社区同仁的参与和监督,让产品未来发展更透明;同时也承担历史责任,希望通过开源的方式吸引更多合作伙伴,共同发展中国的分布式文档型数据库生态链,促进业务的快速迭代和开发效率的提升。近期,SequoiaDB新版本的源代码将通过Gitee、GitCode及GitHub再次开源。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/242963.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Qt事件过滤

1.相关说明 监控鼠标进入组件、出组件、点击组件、双击组件的事件,需要重写eventFilter函数 2.相关界面 3.相关代码 #include "widget.h" #include "ui_widget.h"Widget::Widget(QWidget *parent): QWidget(parent), ui(new Ui::Widget) {ui-&…

Vue——计算属性

文章目录 计算属性computed 计算属性 vs methods 方法计算属性完整写法 综合案例:成绩案例 计算属性 概念:基于现有的数据,计算出来的新属性。依赖的数据变化,自动重新计算 语法: ①声明computed配置项中,一个计算属性…

Mac NTFS 磁盘读写工具选哪个好?Tuxera 还是 Paragon?

在使用 Mac 电脑时,我们经常需要读写 NTFS 格式的硬盘或 U 盘。然而,由于 Mac 系统不支持 NTFS 格式的读写,因此我们需要借助第三方工具来实现这个功能。而在市场上,Tuxera 和 Paragon 是两款备受推崇的 Mac NTFS 磁盘读写工具。那…

C++入门学习(八)sizeof关键字

sizeof 是 C 和 C 中的一个运算符&#xff0c;用于确定特定类型或对象的内存大小&#xff08;以字节为单位&#xff09;。 1、查看数据类型占据内存大小 #include <iostream> using namespace std; int main() {short a 1;int b 1;long c 1;long long d 1;cout<…

超级菜鸟怎么学习数据分析?

如果你有python入门基础&#xff0c;在考虑数据分析岗&#xff0c;这篇文章将带你了解&#xff1a;数据分析人才的薪资水平&#xff0c;数据人应该掌握的技术栈。 首先来看看&#xff0c;我在搜索数据分析招聘时&#xff0c;各大厂开出的薪资&#xff1a; 那各大厂在数据领域…

论文阅读_CogTree_推理的认知树

英文名称: From Complex to Simple: Unraveling the Cognitive Tree for Reasoning with Small Language Models中文名称: 从复杂到简单&#xff1a;揭示小型语言模型推理的认知树链接: http://arxiv.org/abs/2311.06754v1代码: https://github.com/alibaba/EasyNLP作者: Junbi…

Unity学习-逐帧图集动画制作

首先在文件部分创建一个Sprite Library Asset 然后点击创建出来的文件 点下面的加号添加对应的图 添加完成之后点一下Apply 然后新建一个物体 添加这三个组件 其中SpriteLibrary里面 把你刚刚创建的图集文件拉过来 Sprite Resolver选择对应的动作和图片 然后开始制作动画 An…

Jupyter-Notebook无法创建ipynb文件

文章目录 概述排查问题恢复方法参考资料 概述 用户反馈在 Notebook 上无法创建 ipynb 文件&#xff0c;并且会返回以下的错误。 报错的信息是: Unexpected error while saving file: Untitled5.ipynb attempt to write a readonly database 排查问题 这个是一个比较新的问…

项目解决方案:某城区(区县)社会面视频监控资源接入汇聚解决方案

目 录 一、概述 二、建设目标及需求 1.建设目标 2.需求分析 2.1 总体需求 2.2 需求细化 三、方案设计 1.设计依据 2.设计原则 3.设计方案 3.1.方案描述 3.2.组网说明 四、产品介绍 1.视频监控综合资源管理平台介绍 2.视频录像服务器和存储 2.1…

Python语法进阶——类

Python中的数据类型都属于类。int、str、list都是Python定义好的数据类型类。 print(type(list))#<class type> print(type(list()))#<class list> 一、自定义数据类型 一、语法 class 类名():pass #类名 要求首字母大写 #()可写可省略。 #pass在这里只是用来保证…

代码随想录算法训练营第三天 | 链表理论基础 203.移除链表元素 707.设计链表 206.反转链表

链表理论基础 链表是一种通过指针串连在一起的线性结构&#xff0c;每一个节点由两部分组成&#xff0c;一个是数据域&#xff0c;一个是指针域&#xff08;存放指向下一个节点的指针&#xff09;。最后一个节点的指针指向 null。链表的存储方式&#xff1a;数组在内存中是连续…

【C++干货基地】namespace超越C语言的独特魅力(文末送书)

&#x1f3ac; 鸽芷咕&#xff1a;个人主页 &#x1f525; 个人专栏: 《C干货基地》《粉丝福利》 ⛺️生活的理想&#xff0c;就是为了理想的生活! 引入 哈喽各位铁汁们好啊&#xff0c;我是博主鸽芷咕《C干货基地》是由我的襄阳家乡零食基地有感而发&#xff0c;不知道各位的…

PDshell16逆向PostgreSQL 工程显示字段comment备注

现状&#xff1a;当刚逆向成功的表结构是没有原来表结构中的&#xff0c;comment备注如下 然后pd逆向工程的sql已经返回了这个备注的含义 解决方案&#xff1a; 1、设置显示注释列 tools——Display Preferences…如下 勾选-按照下面得方式勾选这三个 复制这里的VBS脚本&a…

Java 基础面试题 String(二)

Java 基础面试题 String&#xff08;二&#xff09; 文章目录 Java 基础面试题 String&#xff08;二&#xff09;String#equals() 和 Object#equals() 有何区别&#xff1f;字符串常量池的作用了解吗&#xff1f;String s1 new String("abc");这句话创建了几个字符…

医学图像的图像处理、分割、分类和定位-1

一、说明 本报告全面探讨了应用于医学图像的图像处理和分类技术。开展了四项不同的任务来展示这些方法的多功能性和有效性。任务 1 涉及读取、写入和显示 PNG、JPG 和 DICOM 图像。任务 2 涉及基于定向变化的多类图像分类。此外&#xff0c;我们在任务 3 中包括了胸部 X 光图像…

响应式Web开发项目教程(HTML5+CSS3+Bootstrap)第2版 例4-7 datalist

代码 <!doctype html> <html> <head> <meta charset"utf-8"> <title>datalist</title> </head><body> <input id"address" list"addressList"> <datalist id"addressList"…

Kafka-多线程消费及分区设置

目录 一、Kafka是什么&#xff1f;消息系统&#xff1a;Publish/subscribe&#xff08;发布/订阅者&#xff09;模式相关术语 二、初步使用1.yml文件配置2.生产者类3.消费者类4.发送消息 三、减少分区数量1.停止业务服务进程2.停止kafka服务进程3.重新启动kafka服务4.重新启动业…

第十七期长江沙龙:“大海遗子”——秦岭细鳞鲑

洄游是生命延续的本能&#xff0c;有这样一种鱼&#xff0c;本该是大海孕育的孩子&#xff0c;却从海洋中洄游到淡水中&#xff0c;它们充分利用其惊人的跳跃能力&#xff0c;逐渐演变成为了山溪中的“精灵”&#xff0c;向世界充分展示了它们奋勇向上的拼搏精神。 1月20日&am…

【数据结构与算法】归并排序详解:归并排序算法,归并排序非递归实现

一、归并排序 归并排序是一种经典的排序算法&#xff0c;它使用了分治法的思想。下面是归并排序的算法思想&#xff1a; 递归地将数组划分成较小的子数组&#xff0c;直到每个子数组的长度为1或者0。将相邻的子数组合并&#xff0c;形成更大的已排序的数组&#xff0c;直到最…

2024年回炉计划之排序算法(一)

算法是计算机科学和信息技术中的重要领域&#xff0c;涉及到问题求解和数据处理的方法。要学习算法&#xff0c;你可能需要掌握以下一些基本知识&#xff1a; 基本数据结构&#xff1a; 了解和熟练使用各种数据结构&#xff0c;如数组、链表、栈、队列、树和图等。数据结构是算…