给大模型持久记忆!GitHub 2万星向量数据库云服务升级,国内云产品7月上线

允中 发自 凹非寺
量子位 | 公众号 QbitAI

一个在GitHub上标星超2万的数据库,究竟是什么来头?

原来,这正是最近大火的向量数据库之一、首个在这一赛道开源产品Milvus

自大模型爆火以来,它的关注度也一路飙升,官方显示,目前Milvus已经拥有超过1000+企业用户。

ac0c7750e6ee368c38babafec6658323.png

而就是这么一个GitHub上最流行的向量数据库,背后公司Zilliz已经完成了1.13亿美元融资。

Zilliz专注于研发面向AI应用的向量数据库系统,旗下有Milvus、Zilliz Cloud等产品,目的是为开发者提供易用性强、性价比高的向量数据库服务。

这两天,Zilliz Cloud发布2.0重磅更新,更是带起一波业界对向量数据库的讨论热潮。

大模型技术进展日新月异,向量数据在风口浪尖上也起起伏伏,不少人说它是给AI提供长期记忆的必备基建,也有人认为提高大模型上下文长度才是未来方向。

这不,还有谷歌工程师专门为此摆摊舌战群儒。

b64c1775e024136a77eea0187c368518.png

众说纷纭之下,情况究竟如何?不如来听听向量数据库一线从业者怎么说。

我们联系到了Zilliz创始人兼CEO星爵,希望和他聊一聊向量数据库对于这一轮AI浪潮的意义,以及它背后变革的方式。

星爵认为,大模型的出现给AI带来了新的计算范式CVP Stack,向量数据库是不可或缺的关键:

其中,“C”代表大模型(ChatGPT)负责向量计算;“V”代表向量数据库(vector database),负责向量存储;“P”代表Prompt工程,负责向量交互。

ca618f2551be5fe7ce2e62cd7ad58b04.png

不仅如此,他还系统解答了在大模型发展过程中,向量数据库具体起到的作用,以及作为向量数据库头部公司的Zilliz,又要如何应对这一轮AI变革浪潮。

在不更改原意的基础上,量子位对与星爵的交流内容进行了整理,希望能为大家带来一些思考与启发。

大模型的数据基础设施

提问:最近向量数据库很火,能不能先简单科普一下?

星爵:向量数据库是一种为了高效存储和索引AI模型产生的向量嵌入(embedding)数据而专门设计的数据库。

在传统的关系型数据库中,数据通常以表格的形式存储,而在向量数据库中,数据以向量的形式存储。向量(embedding)是一组数值,可以表示一个点在多维空间中的位置。向量数据库非常擅长处理大量的高维embedding数据,这种数据在机器学习和深度学习应用中很常见。

提问:在最近半年里,向量数据库被广泛应用于大模型领域。向量数据库在大模型领域具体有哪些应用?

星爵:诸如GPT、Bard、Claude和LLaMA这样的大模型可以产生海量向量嵌入数据来表达复杂的语义关系,但模型本身的存储空间有限,无法持久保存这些数据。

向量数据库就像一块外置的记忆块,可以长期存储这些数据,供模型随时调用。向量数据库在LLM领域的应用主要可以分为以下几类:

1、管理私有数据和知识库

开发者可以方便高效地将自己的领域数据集或者私有数据集转换成向量格式,让大模型直接操作,而无需将这些数据暴露给模型训练方,有效保护了数据隐私和产权。

2、为大模型提供实时数据更新。

通过向量数据库可以为大模型提供实时的数据更新,解决大模型“胡言乱语”的问题,而无需频繁重训模型。这比直接fine-tune模型的成本低很多。

3、实现大模型的个性化和增强。

开发者可以在向量数据库中添加上下文和自己的数据来扩展大模型的感知能力,实现个性化应用。

4、提供智能体的记忆。

智能体是大模型的一个新兴应用场景,用于构建具有独立智能的虚拟人物、虚拟代理甚至人形机器人。向量数据库不仅可以帮助智能体记忆其感知的历史数据和上下文,帮其做出智能决策,还能使其根据长期记忆来实现自我演进。

5、保存大模型的处理结果。

向量数据库可以持久保存大模型处理过的数据,进行离线分析和挖掘。而不像大模型那样,用过即弃。比如说,开源项目GPTCache可以将大模型的查询结果缓存至向量数据库,避免重复计算,提高查询效率,这有点像CDN和Redis对网站数据的作用。

6、构建更复杂的AI系统。

在很多场景下,我们需要将多个大模型和向量数据库串联,实现更强大的功能。其中,多个大模型甚至是多模态模型共同负责处理语义,向量数据库负责数据流转。

对于大模型应用开发者来说,向量数据库是一个非常重要的基础设施,可以在最大限度发挥大模型威力的同时保护数据隐私,实现更丰富的功能。LLM和向量数据库共同推动AIGC的发展,二者缺一不可。

全面拥抱大模型

提问:我们了解到,Zilliz Cloud在两周前于硅谷发布了全面的产品更新和升级。这次产品升级背后的动机是什么?

星爵:我们的出发点是all-in大模型应用开发

在过去的几年里,我们的开源产品Milvus和商业产品Zilliz Cloud被广泛应用于计算机视觉、NLP、推荐系统、搜索引擎、自动驾驶和生物制药等领域。在过去的半年里,向量数据库经历了它的iPhone时刻,数百万LLM应用开发者涌入,LLM应用开发成为了向量数据库的杀手级应用场景。众多的LLM应用开发者给我们带来了大量新兴的需求,我们决定拥抱这些变化,为LLM应用开发提供更全面、更便利的支撑。

提问:能不能具体介绍下Zilliz Cloud做了哪些更新和升级?

星爵:首先,引入了对RESTful API的全面支持。我们看到新进的LLM开发者大多具有丰厚的Web应用和移动应用开发背景,他们熟悉基于RESTful API将多个服务的能力串起来打造强大的应用。有了RESTful API,开发者可以便捷地将「LLM+向量数据库+提示词」三者连接起来,打造LLM应用程序。我们将这种新开发范式称为CVP Stack,能极大提高开发效率。举个例子说,明道云的一位工程师使用RESTful API一天就完成了Zilliz Cloud和对方平台的整合。

其次,提供了动态schema。此前向量数据库采用静态schema的方式,需要开发者在建表时根据业务定义数据的schema,这对于大型企业的成熟业务而言是一种常见的处理方式。然而,当下AIGC应用多处于早期快速迭代阶段,面向业务效果,需要频繁调整向量数据库内的字段,对于这类需求,反复重建schema结构以及频繁的数据重导入会严重影响产品的迭代速度。为此我们引入了动态schema,支持用户根据开发需要动态灵活地进行数据处理。

再者,新增了JSON数据类型的支持。JSON是目前最流行且最灵活的数据表示方式之一,被广泛地应用于应用程序开发中。我们将MongoDB的基础能力搬进了向量数据库,用户在Zilliz Cloud上可以将JSON与embedding这两种超强能力相结合,实现基于JSON与embedding向量的混合数据表示和处理。

另外,我们还引入了Partition Key,支持基于Partition Key的高效数据过滤;增加了组织和角色的概念,支持基于Role-Based Access Control(RBAC)的多粒度访问控制;增加了全面的LLM生态支持,深度整合了OpenAI、Claude、Cohere、LLaMA、Bard、Dolly、LangChain、LlamaIndex和Semantic Kernel等热门项目。

提问:我们看到Zilliz Cloud之前只提供专有集群一种产品,此次新增了Serverless和云上私有部署两种产品。这背后的原因是什么?

星爵:Zilliz Cloud面向不同阶段的用户提供多种用户计划。

841f1e81c8b038acc3563feea80e2fa3.png

基于Serverless的入门计划

为每位用户提供一个免费的Serverless实例,开箱即用,可支持百万条数据规模的向量检索,适合个人开发者和小型开发团队使用。

专有集群产品

面向大型开发团队和企业,专注高性能、高可用、高可扩展性、智能运维和优化、数据安全以及敏捷技术支持等企业级特性,并提供性能型、容量型、经济型三类实例类型,满足企业不同维度的业务需求。

自托管计划

允许用户在其虚拟私有云(VPC)上部署我们的向量数据库服务,提供完全控制,它是注重隐私、数据安全和合规的大型企业的理想选择。

通过提供不同形态的产品,我们希望满足LLM开发者在不同发展阶段的需要,让每一个开发者、每一个开发团队、每一个企业都能方便地使用向量数据库服务,加速实现AI数据基础软件的普及化。

向量数据库市场的竞争和趋势

提问:今年以来,多家向量数据库初创公司获得了大额融资,一些大厂也纷纷把向量数据库的研发列入日程。你怎么看待日益升温的竞争?

星爵:竞争意味着市场确认和机会。竞争的加剧说明向量数据库的价值得到了市场的广泛认可,其市场机会和潜力得以证实。与此同时,激烈的竞争也在一定程度上推动了技术的进步,这对消费者和整个行业而言都大有裨益,是一件实打实的好事。

当然,这种竞争环境迫使公司更加关注客户的需求。这意味着我们必须密切关注市场趋势,并适应这些变化,以提供客户真正需要的解决方案。我们必须不断创新和优化我们的产品和服务。这对LLM开发者和整个行业来说都是有益的。我相信在一个健康的生态系统中,有多个玩家是至关重要的。这为开发者和客户提供了选择,也为行业设置了标准。

在Zilliz,我们作为向量数据库行业的先行者和开拓者,尤其欢迎这种竞争。我们将继续致力于推动向量数据库技术的发展,并与其他参与者一起,为用户提供最先进的工具和服务。

提问:刚才你提到了行业标准,在关系型数据库领域有TPC-C和TPC-H这样的benchmark,向量数据库领域有类似的benchmark么?

星爵:目前还没有标准的benchmark,这给开发者和企业在向量数据库产品对比和选择时造成了很多的疑惑和困难。

为此,我们近期开放了一套开源的向量数据库评测工具VectorDBBench(https://github.com/zilliztech/VectorDBBench)。

该工具包含一套标准化数据集,结合多个典型场景,覆盖数据插入与索引构建、向量查询、混合查询、数据容量等多个能力维度,同时支持用户自定义的数据集与测试场景。

我们欢迎开发者们参与到这个开源benchmark的开发和迭代中来,希望VectorDBBench能发展成为像ClickBench这样的行业标准。

提问:你认为向量数据库赛道未来竞争的核心是什么?

星爵:向量数据库作为一款数据库产品,“更大更快更便宜”是未来发展的核心趋势。更大是指能处理更大的数据量,这意味着支持百亿条数据甚至更高的可扩展性;更快是指更高的性能,包括毫秒级的响应时间和高达数万的QPS;更便宜是指更少的资源消耗更高的性价比,在相同资源消耗的情况下提供更强大的性能。

我们的Zilliz Cloud基于Milvus开源项目,这是全球现在唯一一款真正分布式的向量数据库系统,能提供数百亿条向量数据的毫秒级查询。得益于Milvus的云原生架构,Zilliz Cloud高效地实现了多租户能力,在相同的实例配置下,性能远超其他竞品。举个例子说,在基于VectorDBBench的评测中,Zilliz Cloud性能是Pinecone的两倍以上,综合性价比超过Pinecone三倍以上。

国内云产品即将推出

提问:Zilliz Cloud现在已经支持了AWS和GCP,有没有计划支持国内云平台?

星爵:我们计划在今年7月上旬推出国内的云服务产品,首期预计会支持阿里云、百度云、腾讯云和金山云,并将逐步覆盖国内更多的云厂商。Zilliz Cloud国内云产品定价相比海外产品将会有较大幅度的下调,致力于为国内用户提供最高性价比的全托管向量数据库服务。

Zilliz Cloud:
https://zilliz.com/cloud

Milvus:
https://milvus.io
https://github.com/milvus-io/milvus

VectorDBBench:
https://github.com/zilliztech/VectorDBBench

GPTcache:
https://github.com/zilliztech/GPTCache

—  —

点这里👇关注我,记得标星哦~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/31481.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ModaHub魔搭社区:给大模型持久记忆!GitHub2万星向量数据库服务升级,国内7月上线

一个在GitHub上标星超2万的数据库,究竟是什么来头? 原来,这正是最近大火的向量数据库之一、首个在这一赛道开源产品Milvus。 自大模型爆火以来,它的关注度也一路飙升,官方显示,目前Milvus已经拥有超过1000+企业用户。 而就是这么一个GitHub上最流行的向量数据库,背后公…

如何设计一个面向开发者全生命周期成本的全托管向量检索服务产品?

向量数据库的新趋势已然开始显现! 2023 年初,我曾预测过今年向量数据库发展的八大趋势《向量数据库的下一站,2023 的 8 个预测》,其中提到:向量数据库会出现分叉和分层,离线与在线将共存,单机与…

4 个月、2 万颗星,1 个恒纪元

1, 10,000 15,000 20,000 Milvus 以 4 个月 5 千星的速度迈入 20,000 Star 项目的队列,这意味着有越来越多的开发者看到并认可 Milvus,为 Milvus 进入 AIGC 恒纪元注入了更多力量。 01.从“什么是向量数据库”到“大模型记忆体” 2019 年,我们…

给大模型持久记忆!GitHub 2万星向量数据库云服务升级,国内云产品下周上线

一个在GitHub上标星超2万的数据库,究竟是什么来头? 原来,这正是最近大火的向量数据库之一、首个在这一赛道开源产品Milvus。 自大模型爆火以来,它的关注度也一路飙升,官方显示,目前Milvus已经拥有超过1000企…

开源铸剑,五载匠心!Zilliz Cloud云服务盛装登场,引领向量数据库云时代!

2023 年注定是属于大模型和向量数据库的巅峰时刻。国内大模型的发展也迎来前所未有之机遇,“百模”激战正酣。在刚闭幕的世界人工智能大会上,国内外科技公司全线加入,三十余款大模型集中亮相,“国家队”尘埃落定,并正式…

璀璨五年,磨砺一剑!Zilliz Cloud云服务国内正式登场,定义大模型时代向量数据库的新纪元!...

2023 年注定是属于大模型和向量数据库的巅峰时刻。国内大模型的发展也迎来前所未有之机遇,“百模”激战正酣。在刚闭幕的世界人工智能大会上,国内外科技公司全线加入,三十余款大模型集中亮相,“国家队”尘埃落定,并正式…

头部大模型公司进京赶考,向量数据库成为应考神器

日前,由品玩主办的「模型思辨」国内大模型产业生态研讨会在北京举办,Zilliz 与 360 集团、阿里巴巴、昆仑万维等来自大模型产业链的头部公司及投资机构参会,会上 Zilliz 创始人兼首席执行官星爵、360 集团创始人周鸿祎、昆仑万维创始人方汉等…

毛利率新高、现金流转正,“单纯”的金山云充满想象空间

‍数据智能产业创新服务媒体 ——聚焦数智 改变商业 5月23日,金山云发布了2023年一季度财报。根据财报显示,金山云Q1营收为18.6亿元,同比下滑14.2%,净亏损6.1亿元。尽管营收和利润较去年同期表现较差,但是毛利率达到了…

数字化价值赋能金融,CSDN行业技术峰会·金融科技深圳站圆满落幕

出品 | CSDN(ID:CSDNnews) 随着移动互联网、大数据、云计算、人工智能等科技的普及和应用,金融行业也开始向数字化、智能化、个性化的方向转变,为用户提供更加便捷、快速、个性化的服务。创新技术如何赋能金融行业&…

一起了解代驾出行综合运营方案解决服务商

对于代驾出行综合运营方案解决服务商你在市面上了解多少呢,下面就让我们一起来看看吧。 基于中国互联网出行行业-代驾项目为依托,成立互联网代驾全链路服务商;核心运营业务:第三方品牌运营服务、平台中心化流量赋能、自研全场景代…

6岁的招聘界“ChatGPT”|企业家俱乐部“创业者下午茶”第八期——AI得贤招聘官创始人方小雷

您知道吗?中国6年前就有“ChatGPT”产品了? 南京大学上海校友会企业家俱乐部“创业者下午茶”本期来到位于徐汇区漕河泾开发区宝石园的AI得贤招聘官总部,听创始人01级商学院方小雷校友解构“招聘界的ChatGPT”,看AI如何赋能招聘。…

从通达信中获取得到股票、期货等金融标的的分时数据。

首先下载一个通达信 下载一个普及版的,点击进去右上角有一个免费下载,下载了以后进入软件,无论是游客登录还是注册登录都可以。 点击最上面一栏的选项,然后找到盘后数据下载 点击拓展市场行情分钟线,可以选1分钟的&…

同花顺_代码解析_技术指标_O

本文通过对同花顺中现成代码进行解析,用以了解同花顺相关策略设计的思想 目录 OBOS OBV OBVFS OI指标 OSC OBOS 超买超卖指标 大盘指标。 输出超买超卖指标:上涨家数-下跌家数的N日异同移动平均 输出MAOBOS:OBOS的M日简单移动平均 1.指标上升至80时为超买&…

通达信接口大全:火线竞价器,最近很伙的指标!

最近很火的火线竞价器,拿出来分享给大家!用于竞价参考用的,竞价类指标,数据类型。数据类竞价指标,不能无脑买入的,必须人工筛选是否符合形态与热点。指标有一定时效性和局限性,谨慎使用,据此操作…

股票怎么量化选股?怎么在通达信接口运行公式?

股票量化选股交易方式是现在很多投资者都普遍使用的一种交易方式,通过量化的作用,将自己的选股策略在通达信接口输入,这便可以高效的快速的实现自动选股的功能,那么,它是怎么运行的呢? mport java.io.IOEx…

同花顺_代码解析_技术指标_Z_1

本文通过对同花顺中现成代码进行解析,用以了解同花顺相关策略设计的思想 目录 ZJ_01 ZJ_02 ZJ_05 ZMMZB ZNZ_ASR ZNZ_BYQD ZNZ_CBAND ZNZ_CBW ZNZ_CBXQD ZNZ_CKD ZNZ_CMACD ZNZ_CMGL ZNZ_CYBB ZJ_01 波段之星 "波段之星"指标为图形化指标。…

当AI学会创作,是否应该感到担忧?

当AI学会创作,是否应该感到担忧? 0. 前言1. 人工智能与 AIGC1.1 人工智能简介1.2 人工智能与 AIGC1.3 步入 AIGC 时代 2. 文本生成模型3. 代码生成模型4. 图像生成模型小结与展望 0. 前言 近来,随着 Open AI 发布的新一代 AI 聊天机器人 Cha…

chatGPT帮我写了三个平台的代码,还不止

在全世界都在吹chatGPT的时候,我也被卷了进来。 本人代码出身,在这里演示下他的强大,不懂代码的,可以忽略具体代码,看看他帮我干了什么? 直接登录体验(国内已经做了处理,直接使用即…

实时聊天组合功能,你了解吗?

你有兴趣安装实时聊天组合功能吗?如果您选择了SaleSmartly(ss客服),您的实时聊天插件可以不仅仅只是聊天通道,还可以有各种各样的功能,你不需要包含每一个功能,正所谓「宁缺勿滥」,功…

声纹识别之说话人验证speaker verification

目录 一、speaker verification简介 二、主流方案和模型 1、Ecapa_TDNN模型 2、WavLm 三、代码实践 1、Ecapa_TDNN方案 a、模型结构 b、loss c、数据处理 d、模型训练和评估 e、说话人验证推理 2、WavLm预训练方案 a、模型结构和loss b、数据处理 c、模型训练 …