《向量数据库指南》——向量数据库是小题大作的方案？

《向量数据库指南》——向量数据库是小题大作的方案？

news/2024/12/26 12:56:55/文章来源:https://blog.csdn.net/qinglingye/article/details/133828441

假设大语言模型需要 10 秒钟才能生成一条结果，即需要存储的单条新记忆。那么我们获得 10 万条记忆的时间周期将为：100000 x 10 秒 = 1000000 秒——约等于 11.57 天。而即使我们用最简单的暴力算法（Numpy 的点查询），整个过程也只需要几秒钟时间，完全不值得进行优化！也就是说，我们就连近似最近邻搜索都不需要，更不用说向量数据库了。

那么我们应该如何为自己的项目选型？吴英骏老师认为，对于任何大模型应用，是否需要选用矢量数据库，完全取决于该应用对于矢量存储与查询的依赖程度。

“对于需要存储大量矢量的场景，如海量图像检索、音视频检索等，很显然使用矢量数据库可以获得更加强大、专业的功能，而对于数据量并没有那么大的场景来说，还不如使用 Numpy 等 Python 库计算来的高效、便捷。实际上，在矢量数据库这个赛道上，也分为轻量级矢量数据库以及重量级矢量数据库等，到底是选择 PostgreSQL 上的 pgvector 插件还是选择一个专用的分布式矢量数据库，也是需要对于特定应用做出具体分析之后再做出决策。”

这个说法也符合如今 AutoGPT 项目的真实选择，使用 np.dot 进行嵌入比较：

And

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/163943.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

微信小程序会议OA系统

微信小程序会议OA系统

Flex弹性布局 Flex弹性布局是一种 CSS3 的布局模式，也叫Flexbox。它可以让容器中的元素按一定比例自动分配空间，使得它们在不同宽度、高度等情况下仍能保持整齐和密集不间隙地排列。在使用Flexbox弹性布局时，首先需要创建一个容器和若干个…

阅读更多...

VSCode搭建ESP32 ESP-IDF开发环境-Windows

VSCode搭建ESP32 ESP-IDF开发环境-Windows

陈拓 2023/10/09-2023/10/14 1. 安装Windows系统下的ESP32 ESP-IDF开发环境见《Windows系统安装ESP32 ESP-IDF开发环境》 Windows系统安装ESP32 ESP-IDF开发环境-CSDN博客Windows系统安装ESP32 ESP-IDF开发环境。https://blog.csdn.net/chentuo2000/article/details/1339225…

阅读更多...

SpringMVC之全局异常拦截器

SpringMVC之全局异常拦截器

在SpringMVC自动装配核心类之WebMvcAutoConfiguration内部实例化EnableWebMvcConfiguration过程中会触发其父类WebMvcConfigurationSupport内部初始化HandlerExceptionResolver。 1.WebMvcConfigurationSupport public class WebMvcConfigurationSupport implements Applicat…

阅读更多...

用户登录管理中的Bug修复与技术思考

用户登录管理中的Bug修复与技术思考

目录 1 前言2 问题提出3 问题分析和解决4 技术分析和改进5 结语 1 前言在开发管理软件平台为美术馆时，我们致力于提供一个多系统集成平台，其中包括艺术品管理、志愿者管理和数字资产管理等子系统。为了确保用户享有流畅的体验，我们采用了一…

阅读更多...

volatile-两大特性（可见性、有序性）、内存屏障

volatile-两大特性（可见性、有序性）、内存屏障

6.1 被volatile修饰的变量有两大特点 ● 特点：○ 可见性○ 有序性：有排序要求，有时需要禁重排● 内存语义：○ 当写一个volatile变量时，JMM会把该线程对应的本地内存中的共享变量值立即刷新回主内存中○ 当读一个vola…

阅读更多...

【小黑嵌入式系统第四课】嵌入式系统硬件平台（二）——I/O设备、通信设备（UARTUSB蓝牙）、其他（电源时钟复位中断）

【小黑嵌入式系统第四课】嵌入式系统硬件平台（二）——I/O设备、通信设备（UARTUSB蓝牙）、其他（电源时钟复位中断）

上一课： 【小黑嵌入式系统第三课】嵌入式系统硬件平台（一）——概述、总线、存储设备（RAM&ROM&FLASH) 文章目录一、I/O设备1. 定时器/计数器2. ADC和DAC3. 人机接口设备3.1 键盘3.2 LCD显示器3.3 触摸屏二、通信设备1. 通…

阅读更多...

京东店铺公司名爬虫

京东店铺公司名爬虫

内容仅供学习参考，如有侵权联系删除先通过京东非自营的店铺名拿到的公司名，再通过公司名称去其他平台拿到联系方式（代码省略） from aioscrapy.spiders import Spider from aioscrapy.http import Request, FormRequest import dd…

阅读更多...

Maven安装教程

Maven安装教程

目录不喜欢废话，直接上教程！ 第一步：下载maven 第二步：环境配置第三步：配置maven 配置maven包括配置本地仓库的位置，配置镜像，配置JDK，都在settings.xml里面配置配置本地仓…

阅读更多...

互联网Java工程师面试题·Java 总结篇·第九弹

互联网Java工程师面试题·Java 总结篇·第九弹

目录 75、阐述 JDBC 操作数据库的步骤。 76、Statement 和 PreparedStatement 有什么区别？哪个性能更好？ 77、使用 JDBC 操作数据库时，如何提升读取数据的性能？如何提升更新数据的性能？ 78、在进行数据库编程时&a…

阅读更多...

卷积神经网络手写字符识别 - 深度学习计算机竞赛

卷积神经网络手写字符识别 - 深度学习计算机竞赛

文章目录 0 前言1 简介2 LeNet-5 模型的介绍2.1 结构解析2.2 C1层2.3 S2层S2层和C3层连接 2.4 F6与C5层 3 写数字识别算法模型的构建3.1 输入层设计3.2 激活函数的选取3.3 卷积层设计3.4 降采样层3.5 输出层设计 4 网络模型的总体结构5 部分实现代码6 在线手写识别7 最后 0 前言…

阅读更多...

【Solution】商品秒杀之Redis缓存与MQ异步优化以及超卖一人一单等问题的解决

【Solution】商品秒杀之Redis缓存与MQ异步优化以及超卖一人一单等问题的解决

目录一、Demo开始前准备 1、数据库准备 2、项目准备 3、全局唯一id生成器二、秒杀业务基本实现 1、秒杀基本业务逻辑 2、秒杀接口设计 3、秒杀业务代码实现 4、超卖问题产生三、保证线程安全解决超卖少卖问题 1、超卖产生的原因 2、加锁方案：乐观锁 …

阅读更多...

基于SSM的传统文化网站

基于SSM的传统文化网站

末尾获取源码开发语言：Java Java开发工具：JDK1.8 后端框架：SSM 前端：Vue 数据库：MySQL5.7和Navicat管理工具结合服务器：Tomcat8.5 开发软件：IDEA / Eclipse 是否Maven项目：是目录…

阅读更多...

使用Portainer图形化工具轻松管理远程Docker环境并实现远程访问

使用Portainer图形化工具轻松管理远程Docker环境并实现远程访问

文章目录前言1. 部署Portainer2. 本地访问Portainer3. Linux 安装cpolar4. 配置Portainer 公网访问地址5. 公网远程访问Portainer6. 固定Portainer公网地址前言 Portainer 是一个轻量级的容器管理工具，可以通过 Web 界面对 Docker 容器进行管理和监控。它提供了可…

阅读更多...

【C/PTA】顺序结构专项练习

【C/PTA】顺序结构专项练习

本文结合PTA专项练习带领读者掌握顺序结构，刷题为主注释为辅，在代码中理解思路，其它不做过多叙述。 7-1 是不是太胖了据说一个人的标准体重应该是其身高（单位：厘米）减去100、再乘以0.9所得到的公斤数。已…

阅读更多...

搜维尔科技：“虚实结合” 体验式人机验证技术，助力通用汽车开启研发新篇章

搜维尔科技：“虚实结合” 体验式人机验证技术，助力通用汽车开启研发新篇章

虚拟现实(VR)技术为制造业带来了巨大的可能性。它使工程师能够以真实世界的比例完整体验他们的设计,就像身临其境一样。通过在VR中模拟制造过程,可以发现并解决许多问题,从而避免在实际生产中投入大量资源后才发现问题。VR模拟使不同团队之间的沟通和协作变得比较直观和高效。这…

阅读更多...

【数据结构】830+848真题易错题汇总（自用）

【数据结构】830+848真题易错题汇总（自用）

【数据结构】830848易错题汇总(10-23) 文章目录【数据结构】830848易错题汇总(10-23)选择题填空题判断题简答题：应用题：算法填空题：算法设计题：(待补) 选择题 1、顺序栈 S 的 Pop(S, e)操作弹出元素 e，则下列(C )是正…

阅读更多...

互联网Java工程师面试题·Java 总结篇·第十弹

互联网Java工程师面试题·Java 总结篇·第十弹

目录 82、JDBC 能否处理 Blob 和 Clob？ 83、简述正则表达式及其用途。 84、Java 中是如何支持正则表达式操作的？ 85、获得一个类的类对象有哪些方式？ 86、如何通过反射创建对象？ 87、如何通过反射获取和设置对象私有字段的值…

阅读更多...

基于SSM+Vue的体育馆管理系统的设计与实现

基于SSM+Vue的体育馆管理系统的设计与实现

末尾获取源码开发语言：Java Java开发工具：JDK1.8 后端框架：SSM 前端：Vue 数据库：MySQL5.7和Navicat管理工具结合服务器：Tomcat8.5 开发软件：IDEA / Eclipse 是否Maven项目：是目录…

阅读更多...

紫光同创FPGA实现UDP协议栈网络视频传输，带录像和抓拍功能，基于YT8511和RTL8211，提供2套PDS工程源码和技术支持

紫光同创FPGA实现UDP协议栈网络视频传输，带录像和抓拍功能，基于YT8511和RTL8211，提供2套PDS工程源码和技术支持

目录 1、前言免责声明 2、相关方案推荐我这里已有的以太网方案紫光同创FPGA精简版UDP方案紫光同创FPGA带ping功能UDP方案紫光同创FPGA精简版UDP视频传输方案 3、设计思路框架OV5640摄像头配置及采集数据缓冲FIFOUDP协议栈详解MAC层发送MAC发送模式MAC层接收ARP发送ARP接收ARP缓…

阅读更多...

【Linux】如何判断RS-232串口是否能正常使用

【Linux】如何判断RS-232串口是否能正常使用

1.RS-232串口短接使用RS-232协议的串口引脚一般如图下所示为了让串口能够接收到自己发出的串口数据，需要将输出端和输入端（RXD和TXD）进行短接操作： 短接完成后，才能实现自发自收的功能（走其他协议的串口清…

阅读更多...

最新文章

推荐文章