如何设计一个面向开发者全生命周期成本的全托管向量检索服务产品?

向量数据库的新趋势已然开始显现!

2023 年初,我曾预测过今年向量数据库发展的八大趋势《向量数据库的下一站,2023 的 8 个预测》,其中提到:向量数据库会出现分叉和分层,离线与在线将共存,单机与分布式向量数据库将一同发展。如今,这些趋势日渐明朗,轻量级向量数据库如 Chroma 的推出,传统数据库转型为向量数据库的例子如 PGVector,以及 Snowflake 收购 Neeva 进军非结构化数据领域等,都在实践中验证了我的预测。

更令人激动的是,随着 ChatGPT 席卷而来的大语言模型 AIGC 浪潮,越来越多的预言正逐步变为现实。我们见证了向量数据库与传统数据库的融合,目睹了新版 Zilliz Cloud Serverless 向量数据库的诞生,也看到了过去一年中向量数据库开发者对推进性能和成本优化的努力。

AIGC 的爆发推动了向量检索的发展,自然也带来了大量的新需求。向量数据库的用户群体不再局限于算法工程师,还扩展到应用开发者和后端工程师。这种变化既促进了向量数据库的迭代,也挑战着我们对向量数据库的现有认知,鞭策我们更加深入地挖掘用户需求。

在过去六个月的时间里,我深刻地体会到产品的发展离不开用户需求驱动的真理。作为产品的设计者和开发者,必须始终以用户为中心,积极倾听他们的需求,并集中精力降低软件开发的全链路成本,而非过度追求极致性能或过分炫技。在这种背景下,降低开发者的综合使用成本已成为 Zilliz Cloud 和开发团队过去的主要使命。

alt

01.我们为什么需要 Zilliz Cloud?

2022 年底, Zilliz Cloud 1.0 在 AWS 上线。2023 年 6 月,升级版 Zilliz Cloud 在 AWS 和 GCP 上线。这期间我一直在思考一个关键问题,即【如何准确传达基础软件的产品价值】。

在传统的深度学习流程中,人们通常会过度强调数据和模型的价值,往往忽视了基础设施包括存储在整个业务流程中的重要作用。2023 年随着大模型的出现,应用开发范式发生了巨大变化,模型的泛化能力大幅增强,AI 应用的开发门槛大幅降低。在此背景下,从业者必须重新审视和评估向量数据库的价值。如何让用户用得起、用得爽、用得放心成为我们首要的关注点。

在我看来,云服务和基础设施应该将考虑的重点放在如何降低 AI 应用开发者的全生命周期应用成本上面,这不仅仅是单纯的向量检索速度和存储成本的问题,更多的是帮助用户专注于他们自身的业务逻辑,更快速地进行版本开发和迭代,降低用户维护的心智成本。这就要求我们提高基础设施层的抽象层次,降低对开发者底层知识了解程度的需求。

对于用户来说:

  • 动态 Schema 比固定 Schema 更具优势,因为它为用户提供了更大的灵活性和自由度。

  • Serverless 优于容量规划,因为它能够根据用户的需求自动调整资源,从而使用户无需担心底层资源的管理。

  • 原生分布式比分库分表更具优势,因为这大大减少了用户的运维操作。

  • 自动优化优于 Knob Tuning,因为它可以帮助用户自动选择最优的执行策略,无需用户进行繁琐的参数调整。

如果说 Milvus 2.0 的诞生初心是做全球领先的向量数据库,是我们借助开源力量对 AI 普惠的一次尝试,那么 Zilliz Cloud 的诞生初心则是做开箱即用的向量检索云服务。Zilliz Cloud 是我们自身对于 AI 普惠的再次探索,向量数据库云服务 + 大模型将构建 AI 的成本大幅降低,使得非互联网传统企业和创业公司具备了构建基于 AI 创新的应用成为可能。

alt

目前,更新版的 Zilliz Cloud 支持了动态 Schema、OpenAPI、多租户 Parititon key 等能力,大大降低开发的成本。同时,在硬件成本和维护成本方面我们也进行了优化,详细内容可参考后续文章。

02.Zilliz Cloud 的未来规划

虽然向量数据库及其托管服务还处于孵化初期,但我坚信每一款赢得开发者认可的向量数据库都必然拥有独特的价值。Zilliz Cloud 自诞生之日起,就坚定地以提高开发者的开发效率为己任,帮助用户深挖非结构化数据中蕴藏的巨大潜力。我们鼓励并欢迎任何新的想法和建议,期待与大家共同探索向量检索的下一步。

以下,我想列举一些在 Zilliz Cloud 未来可能呈现的新功能:

  • 专门针对非结构化数据处理的流程管线(Pipeline):不仅包含文档增强,问答机器人等基本能力,也将包括更加丰富的多模态数据处理能力,进一步赋能非结构化数据处理应用。

  • 提供更为复杂的聚合函数支持:包括但不限于 Count、Min、Max 以及 GroupBy 等,为数据分析提供更为广泛且深入的能力。

  • 推出下一代标量查询引擎和向量检索引擎,性能成本提升至现有引擎的 3 倍。

  • 支持稠密向量和稀疏向量混合打分模式,并支持粗排精排,进一步增强召回效果。

  • 实现根据存储容量自动扩缩容:提高向量数据库的弹性,适应业务量的变化,进一步降低用户的维护心智。

  • 提供更加丰富的数据服务能力,包括从开源的 ES、MongoDB 进行数据迁移,增量数据订阅,主备容灾,以满足各种不同的数据处理需求。

  • 进一步扩大服务范围,我们将在日本,新加坡,欧洲等地区增设更多可用区:我们期待能为全球更多用户提供优质的服务。

以上就是我作为开发者和设计者对 Zilliz Cloud 的一些思考,当然,如果大家有其他的功能需求也可加入我们的用户交流群进行反馈。

最后预告一下,近日我们即将在国内上线 Zilliz Cloud 云服务,届时将支持阿里云、百度智能云、金山云、腾讯云。目前我们已支持申请试用,企业用户 PoC 申请或其他商务合作请联系 business@zilliz.com。


  • 如果在使用 Milvus 或 Zilliz 产品有任何问题,可添加小助手微信 “zilliz-tech” 加入交流群。

  • 欢迎关注微信公众号“Zilliz”,了解最新资讯。

本文由 mdnice 多平台发布

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/31478.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

4 个月、2 万颗星,1 个恒纪元

1, 10,000 15,000 20,000 Milvus 以 4 个月 5 千星的速度迈入 20,000 Star 项目的队列,这意味着有越来越多的开发者看到并认可 Milvus,为 Milvus 进入 AIGC 恒纪元注入了更多力量。 01.从“什么是向量数据库”到“大模型记忆体” 2019 年,我们…

给大模型持久记忆!GitHub 2万星向量数据库云服务升级,国内云产品下周上线

一个在GitHub上标星超2万的数据库,究竟是什么来头? 原来,这正是最近大火的向量数据库之一、首个在这一赛道开源产品Milvus。 自大模型爆火以来,它的关注度也一路飙升,官方显示,目前Milvus已经拥有超过1000企…

开源铸剑,五载匠心!Zilliz Cloud云服务盛装登场,引领向量数据库云时代!

2023 年注定是属于大模型和向量数据库的巅峰时刻。国内大模型的发展也迎来前所未有之机遇,“百模”激战正酣。在刚闭幕的世界人工智能大会上,国内外科技公司全线加入,三十余款大模型集中亮相,“国家队”尘埃落定,并正式…

璀璨五年,磨砺一剑!Zilliz Cloud云服务国内正式登场,定义大模型时代向量数据库的新纪元!...

2023 年注定是属于大模型和向量数据库的巅峰时刻。国内大模型的发展也迎来前所未有之机遇,“百模”激战正酣。在刚闭幕的世界人工智能大会上,国内外科技公司全线加入,三十余款大模型集中亮相,“国家队”尘埃落定,并正式…

头部大模型公司进京赶考,向量数据库成为应考神器

日前,由品玩主办的「模型思辨」国内大模型产业生态研讨会在北京举办,Zilliz 与 360 集团、阿里巴巴、昆仑万维等来自大模型产业链的头部公司及投资机构参会,会上 Zilliz 创始人兼首席执行官星爵、360 集团创始人周鸿祎、昆仑万维创始人方汉等…

毛利率新高、现金流转正,“单纯”的金山云充满想象空间

‍数据智能产业创新服务媒体 ——聚焦数智 改变商业 5月23日,金山云发布了2023年一季度财报。根据财报显示,金山云Q1营收为18.6亿元,同比下滑14.2%,净亏损6.1亿元。尽管营收和利润较去年同期表现较差,但是毛利率达到了…

数字化价值赋能金融,CSDN行业技术峰会·金融科技深圳站圆满落幕

出品 | CSDN(ID:CSDNnews) 随着移动互联网、大数据、云计算、人工智能等科技的普及和应用,金融行业也开始向数字化、智能化、个性化的方向转变,为用户提供更加便捷、快速、个性化的服务。创新技术如何赋能金融行业&…

一起了解代驾出行综合运营方案解决服务商

对于代驾出行综合运营方案解决服务商你在市面上了解多少呢,下面就让我们一起来看看吧。 基于中国互联网出行行业-代驾项目为依托,成立互联网代驾全链路服务商;核心运营业务:第三方品牌运营服务、平台中心化流量赋能、自研全场景代…

6岁的招聘界“ChatGPT”|企业家俱乐部“创业者下午茶”第八期——AI得贤招聘官创始人方小雷

您知道吗?中国6年前就有“ChatGPT”产品了? 南京大学上海校友会企业家俱乐部“创业者下午茶”本期来到位于徐汇区漕河泾开发区宝石园的AI得贤招聘官总部,听创始人01级商学院方小雷校友解构“招聘界的ChatGPT”,看AI如何赋能招聘。…

从通达信中获取得到股票、期货等金融标的的分时数据。

首先下载一个通达信 下载一个普及版的,点击进去右上角有一个免费下载,下载了以后进入软件,无论是游客登录还是注册登录都可以。 点击最上面一栏的选项,然后找到盘后数据下载 点击拓展市场行情分钟线,可以选1分钟的&…

同花顺_代码解析_技术指标_O

本文通过对同花顺中现成代码进行解析,用以了解同花顺相关策略设计的思想 目录 OBOS OBV OBVFS OI指标 OSC OBOS 超买超卖指标 大盘指标。 输出超买超卖指标:上涨家数-下跌家数的N日异同移动平均 输出MAOBOS:OBOS的M日简单移动平均 1.指标上升至80时为超买&…

通达信接口大全:火线竞价器,最近很伙的指标!

最近很火的火线竞价器,拿出来分享给大家!用于竞价参考用的,竞价类指标,数据类型。数据类竞价指标,不能无脑买入的,必须人工筛选是否符合形态与热点。指标有一定时效性和局限性,谨慎使用,据此操作…

股票怎么量化选股?怎么在通达信接口运行公式?

股票量化选股交易方式是现在很多投资者都普遍使用的一种交易方式,通过量化的作用,将自己的选股策略在通达信接口输入,这便可以高效的快速的实现自动选股的功能,那么,它是怎么运行的呢? mport java.io.IOEx…

同花顺_代码解析_技术指标_Z_1

本文通过对同花顺中现成代码进行解析,用以了解同花顺相关策略设计的思想 目录 ZJ_01 ZJ_02 ZJ_05 ZMMZB ZNZ_ASR ZNZ_BYQD ZNZ_CBAND ZNZ_CBW ZNZ_CBXQD ZNZ_CKD ZNZ_CMACD ZNZ_CMGL ZNZ_CYBB ZJ_01 波段之星 "波段之星"指标为图形化指标。…

当AI学会创作,是否应该感到担忧?

当AI学会创作,是否应该感到担忧? 0. 前言1. 人工智能与 AIGC1.1 人工智能简介1.2 人工智能与 AIGC1.3 步入 AIGC 时代 2. 文本生成模型3. 代码生成模型4. 图像生成模型小结与展望 0. 前言 近来,随着 Open AI 发布的新一代 AI 聊天机器人 Cha…

chatGPT帮我写了三个平台的代码,还不止

在全世界都在吹chatGPT的时候,我也被卷了进来。 本人代码出身,在这里演示下他的强大,不懂代码的,可以忽略具体代码,看看他帮我干了什么? 直接登录体验(国内已经做了处理,直接使用即…

实时聊天组合功能,你了解吗?

你有兴趣安装实时聊天组合功能吗?如果您选择了SaleSmartly(ss客服),您的实时聊天插件可以不仅仅只是聊天通道,还可以有各种各样的功能,你不需要包含每一个功能,正所谓「宁缺勿滥」,功…

声纹识别之说话人验证speaker verification

目录 一、speaker verification简介 二、主流方案和模型 1、Ecapa_TDNN模型 2、WavLm 三、代码实践 1、Ecapa_TDNN方案 a、模型结构 b、loss c、数据处理 d、模型训练和评估 e、说话人验证推理 2、WavLm预训练方案 a、模型结构和loss b、数据处理 c、模型训练 …

游戏中的语音聊天方案

0. PhotoVoice 光子语音PhotonVoice | 光子引擎photonengine中文站 1. Vivox 来自 Vivox 的游戏内语音和文本聊天 SDK | Unity Multiplayer 服务 2. Agora 声网 声网 - 全球实时互动API平台开创者 3. Zego HarmonyOS Java 实时音视频概述 - 开发者中心 - ZEGO即构科技 Viv…

OpenAI 再发大招: ChatGPT 推出插件功能,能联网获取新知识,可与 5000+ 个应用交互...

公众号关注 「奇妙的 Linux 世界」 设为「星标」,每天带你玩转 Linux ! ​ OpenAI 宣布已经在 ChatGPT 中实现了对插件的初步支持。插件 (Plugins) 是专门为语言模型设计的工具,以安全为核心原则,可帮助 ChatGPT 访问最新信息、运…