【万亿赛道!向量数据库--AI 大模型技术底座解决方案深度分析 2024】

文末有福利!

向量数据库作为新型技术,发展时间较短,开源和上云是目前的主流趋势。在向量数据库领域早期的探索,主要是以Zilliz、Weaviate和Pinecone等初创型公司引领。

在AI大模型未被普遍应用之前,该产品的需求较少,因此,初创型公司开发的向量数据库产品多以开源的形式培育社区生态,以及上云的方式扩大用户覆盖面。

随着向量数据库在AI大模型中应用的重要性逐渐被挖掘,各厂商加大了该领域的研发。

以腾讯云、华为云和星环科技为代表的厂商在非结构化数据的向量检索工具已经具有一定技术积累的基础上,也于近期推出了向量数据库产品。

表 4:向量数据库开发公司和产品列表

(一)向量数据库技术快速迭代,商业化在探索和尝试阶段

Zilliz是向量数据库领域的先驱。Zilliz公司成立于2017年,是行业中较早探索和研发针对非结构化数据的向量搜索引擎及相关工具。其开发的Milvus向量数据库产品于2019年10月开源,为业内公司在该领域技术的探索提供了丰富技术资源。从Milvus1.0即提供了相似性度量、ANN索引等核心算法以及支持分布式架构,升级到Milvus2.0支持多云架构部署、简易的操作查询界面以及数据编辑历史查询,Zilliz为向量数据库行业贡献了较多的核心技术,并引领开源社区的发展。目前Milvus应用的领域包括计算机视觉、自然语言处理、音频搜索和化学分子式分析等。

图 25:Milvus向量数据库架构图

Zilliz的向量数据库产品主要基于公有云提供SaaS服务,按资源使用量来收费。用户可根据业务场景,预估数据量和节点规模,选择免费版(适用于新手用户开发单一项目)、标准版(适用于少于5人的小团队)和企业版(适用于规模以上的企业)的向量数据库产品。
在这里插入图片描述

免费版本的向量数据库主要是吸引更多用户尝试使用,为后续转化成为付费用户打好基础。标准版和企业版起步价分别为65美元/月、99美元/月,在使用时间范围内根据计算资源和存储资源的使用量来收费。目前Zilliz的向量数据库主要通过亚马逊AWS、谷歌云等公有云厂商来提供SaaS服务。此外,Zilliz根据客户定制化需求也提供虚拟私有云部署的SaaS服务供客户灵活选择。

表 5:Zilliz 向量数据库收费标准

注:CU 是 Compute Unit 的缩写,代表部署服务的物理节点

Weaviate积极拥抱开源、上云等主流技术趋势。Weaviate成立于2019年,早期主要的技术开发专注于向量化的能力,即将各类不同的数据转化成为向量数据。后续,Wearviate的向量数据库在多租户协同、检索效率等方面提升。

Weaviate向量数据库产品也是采用开源的形式。2022年9月,用户下载量达到150万次的情况下,推出了Weaviate Cloud Services,通过公有云的形式向用户提供向量数据库的能力。2023年10月,Weaviate 1.22版本发布,物件式存储、异步向量检索等功能有一定提升。

图 26:Weaviate向量数据库产品功能示意图

Weaviate的向量数据库产品根据Embedding数量和资源使用量来收费。Weaviate的向量数据库的收费方式分为两种:基于Weaviate Cloud的SaaS服务;基于第三方公有云平台(谷歌云、亚马逊AWS和微软Azure)的SaaS服务。

基于Weaviate Cloud的SaaS服务分为标准版、企业版、商务专业版,起步价分别为25美元/月、135美元/月、450美元/月;在此模式下,用户根据存储在平台上的Embedding的数量来付费。Embedding的数量是有向量的维度和数据对象的数量共同决定。而在基于第三方公有云平台的SaaS收费模式中,用户根据计算资源(CPU数量)和存储资源(存储空间大小)的使用量来付费。

表 6:Weaviate 向量数据库收费模式

Pinecone首创的混合搜索和存储功能,提升向量数据库性能效果显著。

Pinecone在原始数据编码为向量数据的阶段采用多种编码方式,不同编码方式的向量数据在大模型的检索过程中有快慢之分。混合搜索引擎可以筛选出检索速度最快的向量嵌入方式作为结果反馈。而混合存储则是将原本在内存中存储的向量索引部分转移在磁盘上进行存储。2021年9月,Pinecone通过引入混合搜索和存储功能后,将向量检索的成本减少了10倍。我们认为Pinecone公司对于数据在AI大模型全周期中的流程优化方面较一般公司研究更为深入,已经有较深的技术积累,其开发的向量数据库发展前景向好。

图 27:Pinecone 向量数据库产品架构图

Pinecone在公有云环境中提供容器化的SaaS服务,按照容器的数量和容量收费。

在公有云环境下,容器是融合了CPU、内存和硬盘等资源的基础单元,是实现云端资源弹性伸缩的关键。Pinecone在主流公有云平台(亚马逊AWS、谷歌云、微软Azure)上提供的向量数据库产品的收费价格根据容器类型、数量、容量以及云服务器平台决定。

目前,Pinecone推出免费版(单一容器)、标准版和企业版的向量数据库产品。标准版和企业版的起步价分别为0.096美元/小时和0.144美元/小时。此外,Pinecone根据客户定制化需求也提供虚拟私有云部署的SaaS服务供客户灵活选择。

表 7:Pinecone向量数据库收费模式(以标准版为例)

星环科技的向量数据库产品满足AI大模型对于检索实时性、精准性和跨模态的需求。

2023年5月,星环科技发布向量数据库产品Transwarp Hippo。与开源的向量数据库不同,Hippo具备高可用、高性能、易拓展等特点,支持多种向量搜索索引、数据分区分片、数据持久化、增量数据摄取、向量标量字段过滤混合查询等功能,有效地解决了AI大模型的知识时效性低、输入能力有限、准确度低等问题,让大模型更高效率地存储和读取知识库,降低训练和推理成本。我们预计,星环科技的向量数据库产品Hippo,作为AI大模型的基础软件工具,在各领域智能化的升级中是必备的软件基础设施。星环科技的Hippo向量数据库具备的优势如下:

  • 高性能检索:Hippo支持多进程架构与GPU加速,可以充分发挥并行检索能力;同时支持多类索引,满足不同业务场景;支持检索速度和内存使用的特定优化,支持寄存器级算法优化。

    ‍‍

  • 多模型联合分析:基于多模型统一技术架构,向量数据与关系型数据、图数据、时序数据等多种模型数据进行统一存储管理,通过统一接口实现数据跨模型联合分析。

    ‍‍

  • 接口多样化:提供类SQL语法支持;提供标准的Python、Restful、Java API。

  • 分布式部署:具备分布式部署能力,满足大规模集群部署需求;通过Raft算法确保数据的强一致性;同时提供故障迁移,数据修复等数据保障能力。

‍‍

  • 云原生系统:Hippo采用全面容器化部署,支持服务的弹性扩缩容;同时具备多租户和强大的资源管控能力。

  • 企业级安全:Hippo 可提供基于SASL的用户认证能力,以及基于SSL/TLS的数据加密传输。

图 28:星环科技分布式向量数据库Transwarp Hippo产品架构图

星环科技的向量数据库产品快速迭代,针对不同场景,已推出多个版本。自2023年5月星环推出向量数据库Hippo 1.0以来,星环科技持续投入,根据不同应用场景推出了三个版本的产品:社区版、存储密集版和高性能版。其中社区版Hippo仅需单台服务器即可安装部署,百万级向量数据量推荐配置仅需4核8G。

面向存储需求较大的场景,存储密集版Hippo可支持单台服务器2000万条向量的存储;面向计算要求较高的场景,高性能版Hippo可支持单台服务器1000 QPS(Queries-per-second)的数据反馈。我们认为,星环科技的向量数据库Hippo的应用覆盖面广泛,下沉到具体应用场景推出的标准化产品更加符合行业客户需求,未来发展前景看好。

表 8:星环科技Transwarp Hippo 向量数据库版本

星环科技的向量数据库产品按照软件授权的模式收费。根据《关于星环信息科技(上海)股份有限公司向特定对象发行股票申请文件的审核问询函的回复》中的信息,向量数据库产品均价预测为15万元/套。我们认为,基于公有云的SaaS收费模式在中美之间存在一定差异,Hippo采用的软件授权一次性收费的模式更加符合我国较大比例的国企、央企以及金融机构的付费习惯。此外,由于Hippo是分布式的部署方式,下游客户或因数据量的增加而产生持续扩容的需求。因此,向量数据库产品的销售数量有望随着用户数据量的增长而增长。

表 9:星环科技数据分析大模型建设项目相关产品定价

腾讯云基于多年积累的向量引擎技术,推出了向量数据库VectorDB。2023年7月,腾讯云发布自研向量数据库产品Tencent Cloud VectorDB。VectorDB是源自腾讯内部的赋能工具OLAMA向量引擎,在其基础上对于AI运算、检索方面进行升级而来。

如何系统的去学习大模型LLM?

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

作为一名热心肠的互联网老兵,我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。

但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

所有资料 ⚡️ ,朋友们如果有需要全套 《LLM大模型入门+进阶学习资源包》,扫码获取~ , 【保证100%免费

在这里插入图片描述

篇幅有限,部分资料如下:
👉LLM大模型学习指南+路线汇总👈

💥大模型入门要点,扫盲必看!
在这里插入图片描述
💥既然要系统的学习大模型,那么学习路线是必不可少的,这份路线能帮助你快速梳理知识,形成自己的体系。
在这里插入图片描述

👉大模型入门实战训练👈

💥光学理论是没用的,要学会跟着一起做,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
在这里插入图片描述

👉国内企业大模型落地应用案例👈

💥《中国大模型落地应用案例集》 收录了52个优秀的大模型落地应用案例,这些案例覆盖了金融、医疗、教育、交通、制造等众多领域,无论是对于大模型技术的研究者,还是对于希望了解大模型技术在实际业务中如何应用的业内人士,都具有很高的参考价值。 (文末领取)

在这里插入图片描述
💥《2024大模型行业应用十大典范案例集》 汇集了文化、医药、IT、钢铁、航空、企业服务等行业在大模型应用领域的典范案例。

在这里插入图片描述

👉LLM大模型学习视频👈

💥观看零基础学习书籍和视频,看书籍和视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。 (文末领取)

在这里插入图片描述

👉640份大模型行业报告👈

💥包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。
在这里插入图片描述

👉获取方式:
这份完整版的大模型 LLM 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

😝有需要的小伙伴,可以Vx扫描下方二维码免费领取🆓

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/375405.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

某某会员小程序后端性能优化

背景 某某会员小程序后台提供开放平台能力,为三方油站提供会员积分、优惠劵等api。当用户在油站加油,油站收银会调用我们系统为用户发放积分、优惠劵等。用户反馈慢,三方调用发放积分接口性能极低,耗时30s; 接口情况…

VSCode神仙插件——Codeium (AI编程助手)

1、安装&登录插件 安装过程中会让你登录Codeium账户,可以通过Google账户登录,或者可以注册一个Codeium账户(如果没有弹出让你登录账户的界面,可以等安装结束后在右下角找到登录的地方) 右下角显示如下图所示&#…

Vue3打包发布,刷新出现的空白页面和错误

Vue3打包发布出现的错误:Failed to load module script: Expected a JavaScript module script but the server responded with a MIME type of text/html. Strict MIME type checking is enforced for module scripts per HTML spec. 第一次点击访问到这个路径&…

45 mysql truncate 的实现

前言 truncate 是一个我们也经常会使用到的命令 其作用类似于 delete from $table; 但是 他会比 delete 块很多,这里我们来看一下 它的实现 delete 的时候会逐行进行处理, 打上 删除标记, 然后 由后台任务 进行数据处理 truncate table 的实现 执行 sql 如下 …

C++:从C语言过渡到C++

在这篇博客中,我将会介绍从C语言过渡到C的一些基础知识。 目录 C起源 C的关键字 输出hello,world ​编辑 命名空间 1.什么是命名空间 2.namespace的作用 3.域作用限定符 4.命名空间的使用 IO流 缺省参数 函数重载 引用 1.引用的定义 2.引…

汽车零配件行业看板管理系统应用

生产制造已经走向了精益生产,计算时效产出、物料周转时间等问题,成为每一个制造企业要面临的问题,工厂更需要加快自动化,信息化,数字化的布局和应用。 之前的文章多次讲解了企业MES管理系统,本篇文章就为大…

solidity实战练习1

//SPDX-License-Identifier:MIT pragma solidity ^0.8.24; contract PiggyBank{constructor()payable{emit Deposit(msg.value);//触发事件1//意味着在部署合约的时候,可以向合约发送以太币(不是通过调用函数,而是直接在部署合约时发送&#…

中职网络安全wire0077数据包分析

从靶机服务器的FTP上下载wire0077.pcap,分析该文件,找出黑客入侵使用的协议,提交协议名称 SMTP 分析该文件,找出黑客入侵获取的zip压缩包,提交压缩包文件名 DESKTOP-M1JC4XX_2020_09_24_22_43_12.zip 分析该文件&…

26.Labview波形图、XY图、强度图使用精讲

我们如何使用Labview显示曲线或者制作出下面这种我们想要的曲线并随着我们输入值的变化而变化呢? 本文详细讲解一下每种波形图的使用方式,帮助大家深入了解波形图的使用技巧。 文章中所有程序均可在百度网盘下载,下载方式:复制下…

elasticsearch源码分析-04集群状态发布

集群状态发布 cluster模块封装了在集群层面执行的任务,如集群健康、集群级元信息管理、分片分配给节点、节点管理等。集群任务执行之后可能会产生新的集群状态,如果产生新的集群状态主节点会将集群状态广播给其他节点。 集群状态封装在clusterState中&…

python作业二

# 二进制转化为十进制 num input("num:")def binaryToDecimal(binaryString):he 0length len(binaryString)for i in range(length):he int(binaryString[i]) * 2 ** (length - i - 1)return heprint(binaryToDecimal(num))代码运行如下: import math…

ADC 性能规格-静态性能- (2) - 偏移误差( offset error)和满标度增益误差(full scale gain error)

偏移误差(Offset error) 失调(Offset) 定义:失调是指ADC输出数字代码中零位与实际模拟输入零位之间的差异。简单来说,就是当输入信号为零时,ADC输出的数字代码并不一定是零,这个偏差就是失调。影响:失调会影响ADC的整体精度,因为它在整个输入范围内引入了一个固定的偏…

攻防世界 Web_python_template_injection(flask模版注入)

学习文章:https://www.freebuf.com/column/187845.html https://blog.csdn.net/weixin_54515836/article/details/113778233 flask的渲染方法有render_template和render_template_string两种。 render_template()是用来渲染一个指定的文件的。使用如下 return re…

一文读懂DNS和CDN

一.什么是DNS DNS(Domain Name System)全称为域名系统,是一个将域名和IP地址相互映射的分布式服务,他的作用就是把一个域名解析成为IP地址。我们平时输入的网址(或者域名)不能被计算机直接识别,…

操作系统——内存管理(面试准备)

虚拟内存 单片机没有操作系统,每次写完代码,都需要借助工具把程序烧录进去,这样程序才能跑起来。 另外,单片机的CPU是直接操作内存的物理地址。 在这种情况下,想在内存中同时运行两个程序是不可能的,如果第…

Python数据分析案例49——基于机器学习的垃圾邮件分类系统构建(朴素贝叶斯,支持向量机)

案例背景 trec06c是非常经典的邮件分类的数据,还是难能可贵的中文数据集。 这个数据集从一堆txt压缩包里面提取出来整理为excel文件还真不容不易,肯定要做一下文本分类。 虽然现在文本分类基本都是深度学习了,但是传统的机器学习也能做。本案…

【论文速读】《面向深度学习的联合消息传递与自编码器》,无线AI的挑战和解决思路

这篇文章来自华为的渥太华无线先进系统能力中心和无线技术实验室,作者中有大名鼎鼎的童文。 一、自编码架构的全局收发机面临的主要问题 文章对我比较有启发的地方,是提到自编码架构的全局收发机面临的主要问题: 问题一:基于随…

【算法笔记自学】第 9 章 提高篇(3)——数据结构专题(2)

9.1树与二叉树 #include <cstdio>int main() {int n, m;scanf("%d%d", &n, &m);printf(n m 1 ? "Yes" : "No");return 0; } 9.2二叉树的遍历 #include <cstdio> #include <vector> using namespace std;const int…

高精度定位与AI技术的深度融合——未来智慧世界的钥匙

引言在当今迅速发展的科技时代&#xff0c;精确定位和人工智能&#xff08;AI&#xff09;技术正在快速推动各领域的创新与变革。高精度定位结合AI技术所产生的融合效应&#xff0c;正在加速智慧城市、智能驾驶、智能物流以及许多其他领域的实现。这篇文章将详细探讨高精度定位…

科技云报道:产业为根大模型应用为擎,容联云推动企业营销服场景重塑

科技云报道原创。 “没有应用&#xff0c;光有一个基础模型&#xff0c;不管是开源还是闭源&#xff0c;一文不值。”在2024世界人工智能大会&#xff08;WAIC 2024&#xff09;现场&#xff0c;百度创始人、董事长兼首席执行官李彦宏直言。 国产大模型的种类越发丰富&#x…