数据库管理-第256期 Oracle DB 23.6新特性一览(20241031)

数据库管理256期 2024-10-31

  • 数据库管理-第256期 Oracle DB 23.6新特性一览(20241031)
    • 1 AI向量搜索:新的向量距离度量
    • 2 混合向量索引
    • 3 分区:本地邻近分区向量索引
    • 4 持久邻近图向量索引
    • 5 稀疏向量
    • 6 邻居图向量索引的事务支持
    • 7 特征提取算法的向量格式输出
    • 8 JSON关系二元性视图的OGG复制
    • 9 JSON关系二元性视图的隐藏字段
    • 10 JSON关系二元性视图的内联扩增
    • 11 JSON集合视图
    • 12 JSON复制
    • 13 JSON查询索引路径子集
    • 14 对JSON集合表的复制支持
    • 15 Oracle Data Redaction增强
    • 16 无会话事务
    • 总结

数据库管理-第256期 Oracle DB 23.6新特性一览(20241031)

作者:胖头鱼的鱼缸(尹海文)
Oracle ACE Pro: Database(Oracle与MySQL)
PostgreSQL ACE Partner
10年数据库行业经验,现主要从事数据库服务工作
拥有OCM 11g/12c/19c、MySQL 8.0 OCP、Exadata、CDP等认证
墨天轮MVP、年度墨力之星,ITPUB认证专家、专家百人团成员,数盟会长老会成员,OCM讲师,PolarDB开源社区技术顾问,HaloDB外聘技术顾问,OceanBase观察团成员,青学会MOP技术社区(青年数据库学习互助会)技术顾问
圈内拥有“总监”、“保安”、“国产数据库最大敌人”等称号,非著名社恐(社交恐怖分子)
公众号:胖头鱼的鱼缸;CSDN:胖头鱼的鱼缸(尹海文);墨天轮:胖头鱼的鱼缸;ITPUB:yhw1809。
除授权转载并标明出处外,均为“非法”抄袭

演示文稿1_01.png
今天在上海参加Oracle PAB(Partner Advisory Bording)会议,获取到很多Oracle数据库的第一手资料,也看到了Oracle从19c开始不断的在RU中增加新功能,之前也在第225期中介绍过23.5的新增特性,这里再次简单介绍下23.6的新增特性。

1 AI向量搜索:新的向量距离度量

在23.6中,AI向量搜索新增了一个名为Jaccard distance的距离度量。这一特性允许用户在向量之间使用新的距离度量。

2 混合向量索引

混合向量索引,Hybrid Vector Index (HVI),是一种新的索引,允许用户使用全文搜索和语义向量搜索的组合轻松索引和查询他们的文档,以实现更高质量的搜索结果。
混合向量索引(HVI)通过单个索引DDL简化了将文档转换为进行向量相似性搜索和文本搜索的表单的过程。
混合向量索引提供了一个统一的查询API,允许用户运行文本查询、向量相似性查询或利用这两种方法的混合查询。这让用户可以轻松定制搜索体验并增强搜索结果。

3 分区:本地邻近分区向量索引

Partition-Local Neighbor Partition Vector Index
此功能启用了邻近分区向量索引的本地索引,优化了分区表的搜索性能。此功能在概念上为每个分区创建一个专用的向量索引,允许使用分区键过滤器的查询仅搜索相关的索引分区。因此,向量搜索更有效,在查询大型分区数据集时,响应时间显著降低。
大型企业数据集经常按关系属性进行分区,以优化性能。通过启用本地邻近分区向量索引,用户可以通过分区修剪从增强的可扩展性和加速的查询性能中受益。这种方法还确保了更高效的数据生命周期管理,使其成为处理大规模企业工作负载的理想选择。

4 持久邻近图向量索引

HNSW向量索引是一种驻留在内存中的多层图索引。重新启动时重新创建内存图所需的时间可以通过具有图的磁盘检查点镜像来改善。此功能添加了检查点格式以及框架,以获取磁盘检查点,然后使用它来重新创建内存中驻留的图结构。
重新启动后获取索引访问计划可能需要很长时间。基于更高优先级磁盘检查点的重新加载执行可以缩短重启后获取索引访问计划所需的时间。

5 稀疏向量

稀疏向量,Sparse Vectors,是通常具有大量维度的向量,但只有少数维度具有非零值。这些向量通常由稀疏编码模型(如SPLADE和BM25)生成。从概念上讲,稀疏向量中的每个维度都表示特定词汇表中的一个关键字。对于给定的文档,向量中的非零维度值对应于该文档中出现的关键字(及其变体)。
稀疏向量,如SPLADE和BM25等模型生成的向量,在关键字敏感性和域外搜索的有效性方面通常优于BERT等模型的密集向量。这种卓越的性能在精确关键字匹配至关重要的应用中尤其有价值,例如在法律或学术研究中。此外,稀疏向量通常用于混合向量搜索,它们可以与密集向量一起使用,以组合语义搜索和关键字搜索,并提供更相关的搜索结果。

6 邻居图向量索引的事务支持

HNSW索引是向量数据的内存层次图索引。在23.4和23.5中,对于在向量列上构建了HNSW索引的表,不允许使用DML。此功能允许在此类表上执行事务。此外,使用HNSW索引的向量搜索查询将根据其读取的快照看到事务一致的结果。即使在Oracle RAC上也能保证事务一致性,其中HNSW索引在群集中的所有实例上都是重复的,DML发生在群集中一个或多个实例上,并且可以在群集中任何实例上执行搜索查询。
HNSW索引是Oracle在23ai中提供的最快的向量搜索索引。因此,客户希望使用HNSW索引进行搜索查询,同时对底层表中的关系列或向量列进行DML修改。由于DML可能会使内存中的HNSW索引结构过时,因此在该项目中添加了特殊协议,以确保为客户提供事务一致的结果。

7 特征提取算法的向量格式输出

Vector Format Output for Feature Extraction Algorithm
特征提取算法产生一组特征,表示低维潜在空间中的投影。输出通常是数字和密集的。向量类型表示是自然的选择。
特征提取算法代表了一种对关系数据进行向量化的原则性方法。向量化表示可用于相似性搜索。

8 JSON关系二元性视图的OGG复制

此功能允许开发人员使用Oracle GoldenGate技术将JSON关系二元性视图数据复制为JSON文档,而不是关系表,从Oracle数据库复制到目标Oracle或非Oracle数据库。
JSON数据的复制是从非Oracle数据库到Oracle数据库的高可用性、故障转移和实时迁移的重要功能。
Oracle GoldenGate复制到非Oracle数据库,如MongoDB(文档数据库)或Redis(NoSQL键/值存储),既简单又高效,能够从JSON关系二元性视图复制JSON文档。
开发人员不需要编写复杂的JSON和SQL转换来为关系和基于文档的更新塑造数据,也不需要付出在目标数据库上重建应用程序对象的成本。

9 JSON关系二元性视图的隐藏字段

JSON关系二元视图下的表中的列可以映射到隐藏字段;也就是说,视图支持的文档中不存在的字段。
JSON关系二元视图支持的JSON文档中生成的字段可以使用隐藏字段的值。
如果二元视图支持的JSON文档不需要为每个底层列都有一个字段,特别是对于仅用于计算的列,那么它可以更简单。

10 JSON关系二元性视图的内联扩增

JSON关系二元视图生成具有对象的JSON文档,这些对象的字段映射到底层关系表的列。
可以通过添加计算字段来增强对象。例如,您可以声明一个JSON字段totalCompensation,其值由一个SQL表达式计算得出,该表达式将BONUS和SALARY列的值相加。另一个例子是将订单中所有行项目的价格加起来。计算字段是只读的。
二元视图的用户可以使用增强向应用程序传达更多信息。例如,如果你知道嵌套数组的大小,那么你可以在迭代数组之前分配适当的空间。字段计算(例如采购订单总计)可以在数据库中完成,而不是在多个客户端应用程序中单独完成。因为计算字段可以使用掩码运算符,所以可以在对象中隐藏一些信息,这是一种类似于编校的功能。

11 JSON集合视图

JSON集合视图是特殊的只读数据库视图,在名为DATA的JSON类型列中公开JSON对象。
JSON集合视图在概念上接近JSON关系二元性视图,但由于它们是只读的,因此限制较少。

12 JSON复制

CREATE/ALTER TABLE语句的logical_replication_clause子句被扩展为允许在补充日志记录下禁用和启用部分JSON更新。
部分JSON更新使复制更高效,因为需要复制或修改的数据更少。更改可以在远程复制,而不是发送所有更新的数据。使用此功能,您将在相同的硬件上体验到更好的性能,从而降低硬件成本。

13 JSON查询索引路径子集

JSON Search Index Path Subsetting
创建JSON搜索索引时,您可以指定要包含或排除在索引之外的字段:路径子集。
路径子集可以减小搜索索引的大小并提高其性能。

14 对JSON集合表的复制支持

JSON集合表可以使用GoldenGate启用逻辑复制。支持JSON关系二元视图之间的复制,以及MongoDB等第三方产品之间的复制。
复制是在Oracle数据库之间工作的基本数据库功能。它还用于促进从MongoDB等第三方数据库到Oracle数据库的在线迁移。

15 Oracle Data Redaction增强

此版本包括对Oracle Data Redaction的许多增强功能,例如优化现有功能和消除以前的限制。
Oracle Data Redaction的这些增强功能改善了整体体验。

16 无会话事务

管理事务需要在整个生命周期中将连接和会话资源绑定到事务。因此,只有在事务结束后才能释放会话或连接。这通常会导致会话/连接利用不足。在无会话事务中,启动事务后,您可以在事务的生命周期内灵活地暂停和恢复事务。会话或连接可以释放回池中,并可由其他事务重用,因此能够有效地复用事务和会话/连接。
无会话事务为应用程序提供了跨会话/连接(单实例或RAC)挂起和恢复事务的能力,而不需要外部事务管理器,也不需要应用程序协调提交和恢复协议。数据库管理事务生命周期,包括提交和恢复。应用程序性能和吞吐量受益于提交延迟的减少,因为需要更少的客户端-服务器往返。由于不需要外部协调,使用无会话事务可以大大简化中端或应用层基础设施,与外部协调事务(如XA)相比,可以显著减少停机时间。

更多关于23.6的相关信息可以通过以下网页获取并进入对应官方文档查看细节:
https://docs.oracle.com/en/database/oracle/oracle-database/23/nfcoa/ru_23_6.html#GUID-74910-1

总结

Oracle DB 23ai是下一个LTS版本,与以往Oracle DB版本功能固定不同,23ai(包括19c)任然在不断扩展新的特性。
老规矩,知道写了些啥。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/464797.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

智能诊断系统:AI可以辅助临床诊断,提高疾病诊断的准确性和效率

​ 大家好,我是Shelly,一个专注于输出AI工具和科技前沿内容的AI应用教练,体验过300款以上的AI应用工具。关注科技及大模型领域对社会的影响10年。关注我一起驾驭AI工具,拥抱AI时代的到来。 AI工具集1:大厂AI工具【共2…

GCC编译器的`-Wall`、`-Wextra`和`-pedantic`选项解读

gcc是广泛使用的开源编译器,-Wall、-Wextra和-pedantic是gcc中用于控制警告信息的选项,以下是详细介绍: -Wall(启用大部分警告) 功能:-Wall 选项用于启用一系列常用的警告信息,这些警告能帮助…

[RocketMQ 5.3.1] Win11 + Docker Desktop 本地部署全流程 + 踩坑记录

时间比较仓促,部署Linux的过程我就简写啦。 0. 我的系统版本(供参考) Windows 11 专业版 24H2, Build 26100.2161 Experience: Windows Feature Experience Pack 1000.26100.32.0 JDK: OpenJDK Amazon Corretto 21.0.4.7.1 1. 在WSL2上安…

基于SpringBoot的植物园管理小程序【附源码】

基于SpringBoot的植物园管理小程序 效果如下: 系统登录页面 管理员主页面 商品订单管理页面 植物园信息管理页面 小程序主页面 小程序登录页面 植物信息查询推荐页面 研究背景 随着互联网技术的快速发展和移动设备的普及,线上管理已经成为各行各业提高…

qt QDragEnterEvent详解

1、概述 QDragEnterEvent是Qt框架中用于处理拖放进入事件的一个类。当用户将一个拖拽对象(如文件、文本或其他数据)拖动到支持拖放操作的窗口部件(widget)上时,系统会触发QDragEnterEvent事件。这个类允许开发者在拖拽…

《C#语法一篇通》,有20万字,需8MB字节,宜48小时阅读,没准会继续完善

本文摘录了C#语法的主要内容,接近20万字。 所有鸡汤的味道都等于马尿! 如果你相信任何所谓的鸡汤文章,智商堪忧。 计算机语言没有”好不好“之说,骗子才会告诉你哪个语言好,学好任何一本基础语言(C&#…

帆软报表新增一行数据后保存,删除选中数据

表格数据显示 1、建立数据库连接 2、建立查询语句,把需要显示的字段对应在界面上 3,关于自增序号如何设置,双击序号单元格,插入公式 4、如果有外键的,要进行下拉显示时,设置形态,显示中文保存…

MySQL-如果你在添加外键时忘加约束名,如何找到系统默认的约束名

问题 在你添加约束的时候,一般都会为其取名以方便后期的修改,但是如果你忘记了呢,如何找到系统默认的约束名 解决方法 -- 查找约束名 SELECTCONSTRAINT_NAME FROMINFORMATION_SCHEMA.KEY_COLUMN_USAGE WHERETABLE_NAME emp ANDREFERENCED_T…

【MongoDB】MongoDB的聚合(Aggregate、Map Reduce)与管道(Pipline) 及索引详解(附详细案例)

文章目录 MongoDB的聚合操作(Aggregate)MongoDB的管道(Pipline操作)MongoDB的聚合(Map Reduce)MongoDB的索引 更多相关内容可查看 MongoDB的聚合操作(Aggregate) 简单理解&#xff…

【dvwa靶场:XSS系列】XSS (DOM) 低-中-高级别,通关啦

一、低级low 拼接的url样式&#xff1a;​​​​​​​ http://127.0.0.1/dvwa/vulnerabilities/xss_d/?default 拼接的新内容 <script>alert("假客套")</script> 二、中级middle 拼接的url样式&#xff1a;​​​​​​​ http://127.0.0.1/dvwa/vuln…

Android13 系统/用户证书安装相关分析总结(二) 如何增加一个安装系统证书的接口

一、前言 接着上回说&#xff0c;最初是为了写一个SDK的接口&#xff0c;需求大致是增加证书安装卸载的接口&#xff08;系统、用户&#xff09;。于是了解了一下证书相关的处理逻辑&#xff0c;在了解了功能和流程之后&#xff0c;发现settings中支持安装的证书&#xff0c;只…

React 组件生命周期与 Hooks 简明指南

文章目录 一、类组件的生命周期方法1. 挂载阶段2. 更新阶段3. 卸载阶段 二、函数组件中的 Hooks1. useState2. useEffect3. useContext4. useReducer 结论 好的&#xff0c;我们来详细讲解一下 React 类组件的生命周期方法和函数组件中的钩子&#xff08;hooks&#xff09;。 …

软考(中级-软件设计师)数据库篇(1101)

第6章 数据库系统基础知识 一、基本概念 1、数据库 数据库&#xff08;Database &#xff0c;DB&#xff09;是指长期存储在计算机内的、有组织的、可共享的数据集合。数据库中的数据按一定的数据模型组织、描述和存储&#xff0c;具有较小的冗余度、较高的数据独立性和扩展…

FITS论文解析

在本文中&#xff0c;作者探讨了如何将复杂的频域特征提取与简单的线性模型&#xff08;如DLinear&#xff09;结合&#xff0c;以优化时间序列预测任务的效率和解释性。本文的核心思想是利用频域处理和DLinear的简化结构来达到高效的预测能力&#xff0c;同时保留对复杂特征的…

Ubuntu 搭建Yapi服务

新手上路&#xff0c;小心开车 1. 安装mongo数据库 第一步&#xff1a;docker pull mongo 拉取mongo镜像&#xff1b; 第二步&#xff1a;启动mongo镜像 docker network create yapi_networkdocker run -d \-p 27017:27017 \--name mongodb \-e MONGO_INITDB_ROOT_USERNAMEya…

【进度猫-注册/登录安全分析报告】

前言 由于网站注册入口容易被黑客攻击&#xff0c;存在如下安全问题&#xff1a; 暴力破解密码&#xff0c;造成用户信息泄露短信盗刷的安全问题&#xff0c;影响业务及导致用户投诉带来经济损失&#xff0c;尤其是后付费客户&#xff0c;风险巨大&#xff0c;造成亏损无底洞…

JAVA 插入 JSON 对象到 PostgreSQL

博主主页:【南鸢1.0】 本文专栏&#xff1a;JAVA 目录 ​编辑 简介 所用&#xff1a; 1、 确保 PostgreSQL 数据库支持 JSON&#xff1a; 2、添加 PostgreSQL JDBC 驱动 3、安装和运行 PostgreSQL 4、建立数据库的连接 简介 在现代软件开发中&#xff0c;由于 JSON 数据…

前端通过nginx部署一个本地服务的方法

前端通过nginx部署一个本地服务的方法&#xff1a; 1.下载ngnix nginx 下载完成后解压缩后运行nginx.exe文件 2.打包你的前端项目文件 yarn build 把生成的dist文件复制出来&#xff0c;替换到nginx的html文件下 3.配置conf目录的nginx.conf文件 主要配置server监听 ser…

深度学习基础知识-损失函数

目录 1. 均方误差&#xff08;Mean Squared Error, MSE&#xff09; 2. 平均绝对误差&#xff08;Mean Absolute Error, MAE&#xff09; 3. Huber 损失 4. 交叉熵损失&#xff08;Cross-Entropy Loss&#xff09; 5. KL 散度&#xff08;Kullback-Leibler Divergence&…

如何在BSV区块链上实现可验证AI

​​发表时间&#xff1a;2024年10月2日 nChain的顶尖专家们已经找到并成功测试了一种方法&#xff1a;通过区块链技术来验证AI&#xff08;人工智能&#xff09;系统的输出结果。这种方法可以确保AI模型既按照规范运行&#xff0c;避免严重错误&#xff0c;遵守诸如公平、透明…