艾瑞巴蒂看过来!OSSChat 上线:融合 CVP,试用通道已开放

还在纠结于反复查找开源项目的技术文档?

团队常因频繁搜索开源项目主页导致效率低下?

每天都要问一遍【开源项目中那些“小白问题”究竟有没有更快的解决方法?】

对此,只想对你说:赶紧试试 OSSChat!赶紧试试 OSSChat!赶紧试试 OSSChat!

( 链接在此:https://osschat.io/)

OSSChat 究竟是谁?

介绍一下,这是我们最近做的一个很有意思的工具,它的主要目的是把一个开源社区所有沉淀下来的知识性内容打造成知识库,并通过 ChatGPT 的能力包装成问答机器人。后续,我们也打算为各个开源社区提供免费的 embedded chatbot 的能力,解决主页内容搜索和用户 QA 这样的关键问题。

简言之,有了 OSSChat,你就可以通过对话的方式直接与一个开源社区的所有知识直接交流,大幅提升开源社区信息流通效率。

在首发尝鲜版本中,OSSChat 提供了基于 Hugging Face、Pytorch、Milvus 等开源项目的深度问答服务,后续将陆续覆盖更多受欢迎的开源项目。如果 OSSChat 上面还没有你的项目,请直接联系我们申请入驻!

01.

OSSChat:自带“精准”基因

用过 ChatGPT 的小伙伴可能都遇到过类似的问题:当你向它询问专业垂域知识或实时信息时,由于受限于模型本身的训练数据集边界,ChatGPT 会生成看似正确但与事实不符的内容,这也是 ChatGPT 被业界广为诟病的一个重要缺陷。为了解决这一问题,Zilliz 推出了崭新的 CVP 技术栈——即 ChatGPT + 向量数据库(vector database)+ prompt-as-code。

毋庸置疑,ChatGPT 在自然语言问答方面的能力十分出色,如果通过向量数据库为 ChatGPT 提供一个大规模可靠的知识库,并使用 prompt 将用户问题与相应的知识库文本对应起来,ChatGPT 便可以扬长避短,很大程度上避免 ChatGPT “捏造答案”。

可以说,OSSChat 完美展现了 CVP 技术栈的工作模式。具体来看,OSSChat 将各个开源项目的 GitHub 仓库(repo)及相关文档页面作为数据源(source of truth),这些数据被转换为 embedding 并存储在 Zilliz 向量数据库中,其他相关内容则存储在单独的数据存储器中。用户与 OSSChat 提问交互时,会在 Zilliz 向量数据库中触发相似性检索,随后检索结果会被发送给 ChatGPT 作为输入问题,最终生成精准答案。

02.

关于避免 ChatGPT 捏造事实这件事

接下来可以通过几组典型的例子,展示 CVP Stack 帮助 ChatGPT 给出精准答案的能力。我们对比了相同问题下 ChatGPT 与 OSSChat 的答案(*注:以下问答均翻译自英文,英文原文请移步 Zilliz Blog 查看):

Q1:Hugging Face 是否支持 OpenAI Whisper?

ChatGPT 回答:据我所知,截至 2021 年 9 月,Hugging Face 尚未宣布支持 OpenAI Whisper。但是,他们将来可能会添加支持。OpenAI Whisper 是 OpenAI 的新语言模型,其他公司和开发人员将其整合到其平台和产品中可能需要一些时间。

OSSChat 回答:是的,Hugging Face 支持 OpenAI Whisper。

FlaxWhisperModel 类在 transformers 库中可用,这是 OpenAI Whisper 模型的包装器。您可以使用此类加载预训练的 OpenAI Whisper 模型,并将其用于各种自然语言处理任务,例如文本分类、问题回答和文本生成。

对于这个问题,ChatGPT 受到知识库限制,它的回答帮助并不大。但是 OSSChat 的回答却十分准确,因为这个答案直接来自 Hugging Face 文档网站。

Q2:torch.compile 这个 API 可以用来做什么?

ChatGPT 回答:截至 2021 年 9 月我的知识截止日期,PyTorch 中没有torch.compile API,这是由 Facebook AI Research 开发的流行的开源机器学习库。但是,PyTorch 提供了与编译和优化神经网络模型相关的各种 API,例如 torch.nn.Module,它是 PyTorch 中所有神经网络模块的基类。torch.nn.Module 提供各种用于定义和优化神经网络模型的方法和钩子。

此外,PyTorch 提供了与 Just-In-Time (JIT)编译器(例如 TorchScript JIT 编译器)集成的接口,可以用于在各种硬件平台上优化和编译 PyTorch 模型。JIT 编译器可以将 PyTorch 模型转换为独立的、序列化的表示形式,可以在其他环境或语言中加载和执行。总之,虽然 PyTorch 没有 torch.compile API,但它提供了各种用于优化和编译神经网络模型的 API 和工具。

OSSChat 回答:torch.compile API 的目的是通过预先编译来加速 PyTorch 代码。它可以处理任意 Python 代码,对现有代码的更改最小,并可以处理数据相关的控制流。它还可以处理非 PyTorch 函数调用,TorchScript 追踪将其视为常量并可能导致不正确的结果。

ChatGPT 长篇大论解释了 PyTorch API 是什么,并宣称 PyTorch API 中没有torch.compile。但实际上,我们并没有提问 PyTorch API 是什么,且 PyTorch 中存在 torch.compile 这个 API。

Q3:Milvus 中的 TTL 是什么,如何设置?

ChatGPT 回答:在 Milvus 中,TTL(Time To Live)是一项功能,允许您为数据设置到期时间。当您为 Milvus 中的集合或分区设置 TTL 时,Milvus 将自动删除任何已超过指定 TTL 的数据。要在 Milvus 中为集合或分区设置 TTL,您可以分别使用 set_collection_ttl 或 set_partition_ttl API。


以下是示例:

 

在此示例中,我们在 Milvus 中创建了一个集合和一个分区。然后,我们使用 set_collection_ttl 和 set_partition_ttl API 分别为集合和分区设置了 7 天的 TTL。TTL 指定为 Unix 时间戳,它是自 1970 年 1 月 1 日以来的秒数。我们使用 datetime 模块将 TTL 添加到当前时间以计算到期时间。

请注意,您需要在启动 Milvus 时启用 TTL 功能。这可以通过在 Milvus 配置文件中设置 TTL_CHECK_INTERVAL 参数来完成。默认值为 60 秒。

OSSChat 回答:TTL 在 Milvus 中代表“Time to Live”,它是一项功能,可以为集合中的数据设置到期时间。当集合中的数据过期时,它将被自动清理,并且不会参与搜索或查询。

要在 Milvus 中为集合设置 TTL 值,您可以使用 Python 中的 collection.set_properties() 方法。例如,要将 TTL 值设置为 1800 秒(30 分钟),您可以使用以下代码:

collection.set_properties(properties={"collection.ttl.seconds": 1800})

您还可以在创建集合时通过在集合的属性中指定 collection.ttl.seconds 属性来设置 TTL 值。该值应以秒为单位指定,应为 0 或更大。值为 0 表示 TTL 已禁用。

对于这个问题,ChatGPT 给我们提供了一个看似合理的答案,甚至还包含了代码片段。但实际上,这并不是正确答案,而是 ChatGPT 捏造出来的答案。相较之下,OSSChat 则给出了正确回答—— Milvus 中的 TTL 是在集合设置中的一种属性,它的值以秒为单位。

03.

OSSChat 试用通道已开放

目前,我们已经开放了 OSSChat 试用通道,所有用户均可免费使用。未来我们在不断完善其功能的同时,也将公布更多关于 OSSChat 搭建过程的细节。如果希望 OSSChat 聊天机器人能够出现你所开发的开源项目,也欢迎复制链接或点击【阅读原文】填写申请:https://docs.google.com/forms/d/e/1FAIpQLSdXHXCyzs11u7lh2hWkAtWusHtn8fVEZjfrFXTvR7yHhXZDgQ/viewform

当然,如果你对 OSSChat 的功能或者开源项目方面有更多的建议,也欢迎告诉我们!话不多说,OSSChat 等你!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/38217.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

AI生产力工具平台AI100.ai今日正式上线,ChatGPT API和Prompt机器人免费试用

上个月,AI100.ai开放注册,我们发出1000份免费测试邀请,得到了开发者的积极参与和反馈,加速了AI00.ai的功能优化。AI00.ai今日正式上线,为感谢广大开发者的支持,现面向开发者启动ChatGPT API免费试用活动&am…

免费、不用部署SD:AI二维码制作教程

大家好,我是可夫小子,《小白玩转ChatGPT》专栏作者,关注AIGC、读书和自媒体。 最近,风格化的AI二维码,应该没少见吧。生成的原理大家大概也知道,主要通过stable diffusion和一些插件来完成,但对…

宠物店小程序功能有什么_分享宠物店小程序开发制作功能介绍

宠物店微信小程序主要功能有: 1、宠物寄养支持在线提交寄养预约,自主选择宠物寄养位。上门接送或自主接送。一键提交,摆脱繁琐流程。 2、线下买单线下店铺消费也可以使用会员余额。 3、宠物服务可以选择一键搜索或服务分类查询需要的宠物服务…

猫狗分类,猫狗大战

项目全部代码在文章末尾 1、任务描述 Cats vs. Dogs(猫狗大战)数据集下载地址为https://www.kaggle.com/c/dogs-vs-cats/data。这个数据集是Kaggle大数据竞赛某一年的一道赛题,利用给定的数据集,用算法实现猫和狗的识别。 其中包…

Cats vs. Dogs(猫狗大战)数据集处理

猫狗大战数据集 Cats vs. Dogs(猫狗大战)数据集下载地址为https://www.kaggle.com/c/dogs-vs-cats/data。这个数据集是Kaggle大数据竞赛某一年的一道赛题,利用给定的数据集,用算法实现猫和狗的识别。 其中包含了训练集和测试集&a…

宠物管理|养犬登记|宠物识别|智慧城市监控|城市犬类管理系统

关键词:宠物识别、宠物面部识别、宠物管理、宠物社交、宠物培训、宠物保险、鼻纹识别、宠物登记、宠物比赛、宠物走失、宠物用品、智慧宠物; “犬类管理”正日益成为城市治理的重要话题之一。 据最新数据,2020年全国犬数量为5222万只&#…

一文读懂物联网大数据产业链

原文地址 大数据开启了一个大规模生产、分享和应用数据的时代,它给技术和商业带来了巨大的变化。麦肯锡研究表明,在医疗、零售和制造业领域,大数据每年可以提高劳动生产率0.5-1个百分点。物联网时代,大数据在核心领域的渗透速度有…

专访智齿科技徐懿丨企服公司四要素:智能、融合、产品复杂度、客单价

关注52AI,做AI的行业领先者。QQ人工智能行业交流群:626784247. 01 徐懿认为:客服企业的两大核心要素是“融合”以及“智能”,围绕这两点,该领域所有公司将被划分为四个象限,而客服行业未来的趋势一定是向着…

大数据的产业链分析,大数据完整的产业链构成

大数据的产业链分析大数据完整的产业链构成,可分为标准与规范、数据安全、数据采集、数据存储与管理、数据分析与挖掘、数据运维以及数据应用几个环节,覆盖了数据从产生到应用的整个生命周期。 大数据的产业链分析 1数据标准与规范 大数据标准体系是开展…

Tableau 聚合计算 - 分组求和(sum、fixed、include的使用)

一、聚合计算例子 有以下数据: // 计算1 SUM(IF [shuxue]123 then [yingyu] END)// 计算2 IF [shuxue]123 then {fixed [shuxue]: SUM([yingyu])} END// 计算3 IF [shuxue]123 then {SUM([yingyu])} END// 计算4 {fixed [shuxue]: SUM([yingyu])}// 计算5 {include…

我的一些关于商业计划书的经验

一年了,我一直在写一个关于传媒的商业计划书,着急要写个商业计划书,才发现这个事情还真是经验活,加上时间紧,最后搞的也不太好。回头自己系统的学习了一下理论知识包括各式。我曾问我 之前的一个导师说这个东西怎么写&…

商业计划书简单了解

《商业计划书制作与演示》章节测试答案 笔记课程来源:学习通:北京科技大学《商业计划书制作与演示》 第一章、商业计划书基础知识 大学生创业能力结构模型 商业计划书定义 商业计划书,是创业公司、企业或项目单位为了达到招商融资和其它发展…

[创业之路-57] :商业计划书BP如何书写?总体框架!

引言: BP (Buiness Plan) ,即商业计划书,本质上还是一份计划,是一份商业计划,即一种关于如何赚钱的计划,是一份通过组建公司,运营项目,进而赚钱的项目计划。 什么是商业?…

如何写一篇给天使投资人看的《商业计划书》?

转自:https://www.sohu.com/a/164233213_259030 笔者遇到过形形色色的创业者。总体来说,创业者要么把写商业计划书想的太简单,要么就是想得太难,很少有创业者去实实在在地了解商业计划书的写法和内在逻辑。 1.商业计划书本质是什…

Github api 请求速率说明和请求限制说明,使用认证token增加请求次数

有能力的可以看官方文档:Resources in the REST API - GitHub Docs GitHub 对每小时可以发送的请求数量有限制。通常,GitHub API的标准限制为: 未经身份验证 - 每个原始 IP 地址每小时60个请求;已验证 – 每个用户每小时可发送 5…

浏览器同域名请求的最大并发数限制

当我们在浏览网页的时候,对浏览速度有一个重要的影响因素,就是浏览器的并发数量。并发数量简单通俗的讲就是,当浏览器网页的时候同时工作的线程数量。 如果同时只有2个并发连接数数量,那网页打开的时候只能依赖于这2条线程&#…

postman点击一次连续发送多个请求

使用场景:postman有两个请求,每次调其他业务接口时都需要先执行这两个,我嫌太麻烦了得一个个点,怎么整? 这是准备操作的两个请求: 点击这个按钮,打开界面如下两个图 点击左下角的RUN即可看到你…

CHROME浏览器发送HTTP最大请求并发数限制

一、先上结论: ①同一域名下,同一GET请求的并发数是1,也就是说上一个请求结束,才会执行下一个请求,否则置入队列等待发送; ②同一域名下,不同GET/POST请求的并发数量是6。当发送的请求数量达到…

.net Core中如何限制接口请求次数

.net core中如何限制接口请求次数 像AspNetCoreRateLimit这种轮子我前面有给大家介绍过,今天就不说了,我们来聊聊背后的原理,欢迎各位大佬指正! 像我们经常看的一些APi请求接口网站: 拿请求国外主要城市的七日接口举例…

后台限制请求访问次数的实现

目录 背景 ExpiringMap 限制请求次数应用示例 pom依赖 注解类定义 切面定义 Controler示例 示例展现情况 背景 最近搞接口服务器,对兄弟团队提供数据接口,由于对接生产数据,担心小伙伴把我的数据库玩死,于是想着搞个请求限…