国产开源版「ChatGPT插件系统」来了!豆瓣、搜索一应俱全,清华、面壁智能等联合发布...

8b04b362ede14bf7d421aa97a9f7f73a.jpeg


  视学算法报道  

编辑:好困

【导读】近期,面壁智能联合来自清华、人大、腾讯的研究人员共同发布了中文领域首个基于交互式网页搜索的问答开源模型WebCPM,这一创举填补了国产大模型该领域的空白。面壁智能自研工具学习引擎BMTools也因此被成功实践。

最近,一个被称为「ChatGPT Plugins国产替代系统」的开源项目在GitHub上星标猛增。

这个项目就是BMTools,面壁智能自研的大模型工具学习引擎。

bccd454802d9643b032e501b59ff5bfe.png

项目地址:https://github.com/OpenBMB/BMTools

深耕前沿,快速嵌入大模型工具学习

首先,是最重要的问题,BMTools到底厉害在哪里?

作为基于语言模型的开源可扩展工具学习平台,面壁研发团队将各种各样的工具调用流程都统一到了BMTools框架上,使整个工具调用流程标准化、自动化。

目前,BMTools支持的插件,涵盖娱乐,学术,生活等多方面,包括douban-film(豆瓣电影)、search(必应搜索)、Klarna(购物)等。

开发者可以通过BMTools,使用给定的模型(比如ChatGPT、GPT-4)调用多种多样的工具接口,以实现特定功能。

此外,BMTools工具包也已集成最近爆火的Auto-GPT与BabyAGI。

a48712b1d2f6b2424ca2a3c92219fe71.png

那么,这种工具学习对大模型又有何作用?

尽管大模型在很多方面取得了显著的成果,但在特定领域的任务上,仍然存在一定的局限性。这些任务往往需要专业化的工具或领域知识才能有效解决。

因此,就像智能手机需要下载App才有更好的使用体验,大模型需要具备调用各种专业化工具的能力,这样才能为现实世界任务提供更为全面的支持。

大模型新范式工具学习(Tool Learning)应运而生。这一范式的核心在于将专业工具与基础模型的优势相融合,以在问题解决方面达到更高的准确性、效率和自主性。

大模型与外部工具的有机结合成功弥补了此前能力的诸多短板,工具学习极大地释放了大模型的潜力。

c89e24aa3834ff42d44f4ead66d88ff2.png

论文地址:https://arxiv.org/abs/2304.08354

2023年3月23日,OpenAI宣布推出插件系统(Plugins),这个插件的能力就是我们所说的工具学习。

在工具学习的加持下,Plugins能够支持ChatGPT连接浏览器、数学计算等外部工具,能力大幅增强。

ChatGPT Plugins的出现补充了ChatGPT最后的短板,使其可以支持连网、解决数学计算,被称为OpenAI的「App Store」时刻。然而直到现在,它仅支持OpenAI Plus用户,大多数开发者仍然无法使用。

493a4d4c3a7d00a47ac2e1a8dc4b0eda.png

面壁为什么能在ChatGPT Plugins发布后仅十天就推出BMTools?

面壁智能一直潜心研发大模型全流程高效计算工具,研发团队从2022年就开始持续开展工具学习新范式的研究,尝试将现有语言模型与搜索引擎、知识库等工具结合,取得了较好的实验效果。团队还在工具学习前沿研究领域进行了卓有成效的探索。

为满足众多开发者对OpenAI Plugins能力的热切期盼,在前期积累的基础上,团队快速将相关研究成果工具化,积累整理成工具包BMTools,将工具学习嵌入面壁智能大模型能力体系,正式加入OpenBMB大模型工具体系「全家桶」。

工具学习也是面壁智能继高效训练、微调、推理、压缩套件后推出的又一大力作。

c82b9848af271fc903bf3f245708ad75.png

BMTools工具包 :https://github.com/OpenBMB/BMTools

引领破壁,首发联网支持中文问答模型

近期,面壁智能联合来自清华、人大、腾讯的研究人员共同发布了中文领域首个基于交互式网页搜索的问答开源模型框架WebCPM,这一创举填补了国产大模型该领域的空白。而WebCPM正是BMTools的成功实践。

目前,WebCPM相关工作已录用于自然语言处理顶级会议ACL 2023。

4e69b90e7d29ed5374541297cb9e98a4.png

WebCPM论文链接:https://arxiv.org/abs/2305.06849

WebCPM数据与代码链接:https://github.com/thunlp/WebCPM

可以说,自从ChatGPT爆火之后,国内各家各派的大模型雨后春笋般涌现,但大部分模型都没有联网。

而没有联网的大模型无法获取最新的信息,生成的内容基于陈旧的数据集,存在一定的局限性。

WebCPM的特点在于其信息检索基于交互式网页搜索,能够像人类一样与搜索引擎交互从而收集回答问题所需要的事实性知识并生成答案

换言之,大模型在联网功能的加持下,回答问题的实时性和准确性都得到了飞跃式增强。

518772290980a62d85ca5056db3a3ce1.pngWebCPM模型框架

WebCPM对标的是WebGPT , WebGPT也正是微软近期推出的New Bing背后的新一代搜索技术。

同WebGPT一样,WebCPM克服了传统的LFQA( Long-form Question Answering)长文本开放问答范式的缺陷:依赖于非交互式的检索方法,即仅使用原始问题作为查询语句来检索信息。

在WebCPM框架下,模型能够像人类一样通过与搜索引擎实时交互来进行网页搜索而筛选高质量信息。

不仅如此,遇到复杂问题,模型也像人类一般将其分解成多个子问题并依次提问。

而且,通过识别和浏览相关信息,模型还会逐渐完善对原问题的理解,并不断查询新问题来搜索更多样的信息。

9287cccf3f5f52b25b8850b455143507.png

WebCPM搜索交互界面

未来,面壁智能也将进一步促进该科研成果的应用转化,努力推进WebCPM大模型在相应领域落地生根。

高屋建瓴,致力打造国产大模型系统

面壁智能始终努力引领大模型原始创新,致力于构建智能时代大模型基础设施和打造国产大模型系统,以期最终实现「让大模型飞入千家万户」。

面壁智能的成果有目共睹,且获得了业界肯定。

知乎首席技术官李大海曾评价面壁智能:「面壁智能团队是国内最早开展大规模语言模型研究的团队。公司储备大模型研究和应用的全栈技术能力,包括微调技术和加速技术等,研发能力处于行业领先地位。」知乎表示,相信面壁智能能成长为中国大模型领域基础设施核心厂商,为中国大模型事业贡献力量。

32a84f441d1fe647f55f222b9c478ce8.png

面壁智能全景图

依托工具平台和大模型库,公司推出ModelForce模力大模型系统和CPM企业级大模型。基于大模型的AI生产力平台ModelForce内置大模型训练、微调、压缩、推理全流程高效计算工具体系。

平台基于大模型少样本、零样本通用能力,使用大模型标准化微调方式、打造零代码微调客户端,能够大幅降低AI研发过程中的数据标注成本、算力成本、人力成本。

CPM大模型企业版针对开源版模型进行了能力升级,具有多能力融合、增量微调灵活适配、多场景应用等特点。

基于CPM企业级大模型与ModelForce大模型系统,面壁智能与知乎的合作训练了知海图AI」大模型

「知海图AI」大模型应用到了知乎热榜,能够快速进行要素抽取、观点梳理和内容聚合,于4月23日在知乎发现大会上发布。

不止于此。事实上,面壁智能站位高远,成功打造了一个「三位一体」的大模型产学研生态格局,通过整合顶尖高校学术研究力量并持续打造运营大模型开源社区OpenBMB,面壁智能搭建起业界需求、算法开源和产业落地三者的闭环通道,竭力促进国产大模型领域的前沿研究、应用研发和产业发展。

9a209fbfd734080eb5c46647227118a1.png

  • OpenBMB开源社区

为建设国内大模型开源生态贡献力量,发布了包括OpenPrompt、OpenDelta、BMInf、BMcook、BMTrain、BMTools等一系列大模型全流程开源工具包,并且在知乎、B站等平台推出了大模型全民公开课。

  • 清华大学计算机系自然语言处理与社会人文计算实验室(THUNLP)

作为在高校中一骑绝尘的研究力量,成立于上世纪70年代,是国内开展NLP研究最早、深具影响力的科研单位,多名知名学者和科学家坐镇,在语言大模型领域的研究工作十分突出。

  • 面壁智能

致力于大模型在人工智能典型场景与领域的应用与落地,CPM大模型是面壁团队根据多年的大模型训练经验自研的预训练语言大模型。公司目前已完成数千万元天使轮融资,并多家知名机构与公司达成战略合作。

在努力打造国产大模型系统的征程中,面壁智能的愿景始终是让大模型落地赋能更多产业、惠及更多的企业和个人。

星火已燎原,我们期待大模型在更多领域释放潜能,展现令人惊喜的应用价值。

面壁官网:https://www.modelbest.cn

商务合作:business@modelbest.cn

加入面壁:career@modelbest.cn

ba22d5190c92856285532de2beda06b0.png

outside_default.png

点个在看 paper不断!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/17550.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

多快好省的多样算力,让下一代互联网如你所愿

从前段时间让所有人刮目相看的AI绘画,到最近火爆全网的CharGPT,2022年的互联网行业为我们贡献了无数新鲜点子和妙哉的应用,始终令人回味无穷。回首这一年,我们好像并没有见证新的“杀手级”应用诞生;但仔细回味&#x…

泰坦号内爆5位富豪遇难!AI复原最后恐怖瞬间,设计缺陷真相公开

转自:新智元 30美元游戏手柄可操控潜水器?一系列巨大设计缺陷,注定了5位富人「泰坦尼克号」残骸之旅是一场生命的豪赌。 失踪4天,深海「泰坦号」潜水器竟灾难性内爆。 5位乘员全部遇难! 与爆炸不同,内爆是一…

独家 | 100位特邀用户亲测GPT-4,带来超预期体验!

GPT-4.0作为近年来自然语言处理领域的一项重要突破,备受人们关注和期待。为了助力用户全面理解和高效使用该技术,Beezy团队迅速实现GPT-4.0 API对接,并推出GPT-4.0免费体验官计划。 近期,首期体验官活动完美结束,Beez…

【大模型】创新工场AI工程院执行院长:后GPT时代,多模态是最大的机会

目录 核心观点 大语言模型的“垄断”与“白菜化” 多模态AI的广阔天地

后GPT时代,多模态是最大的机会

作者 | 王咏刚,SeedV实验室创始人/CEO,创新工场AI工程院执行院长 我既是软件工程师,也是投资人和创业者。我曾参与多个成功 AI 项目的创建、孵化或投资。今天,ChatGPT 开启了崭新的 AI 2.0 时代,我个人也全力投入到一…

chatGPT智能AI,就是一次未来新革命!

hatGPT一经面世,立刻就火爆全世界,国内还无法直接使用,居然成为全球热度第一名;如果说不是一次全新的革命科技,又怎么能会那么高的热度?毕竟这个不是平常的八卦新闻。 很多人还不以为然,这完全…

【金猿人物展】数睿数据创始人兼CEO穆鸿:大数据价值创造关键在于应用普惠...

‍ 穆鸿 本文由数睿数据创始人兼CEO穆鸿撰写并投递参与“数据猿年度金猿策划活动——2022大数据产业趋势人物榜单及奖项”评选。 ‍数据智能产业创新服务媒体 ——聚焦数智 改变商业 事情还得从我2022年这一年经历的一些事情谈起,由于工作的原因,我要经…

Protobuf-net3.2.8中的protogen.exe之使用

目录 protobuf是个好东西 遇到问题 顺便研究一下命令行程序如何调试 protobuf是个好东西 protobuf是一个轻量级的数据格式,相比json,它的数据量为json的1/3,且存储方式为2进制,并进行了压缩,序列化和反序列化更快&…

科技资讯|下一代Bing搜索,使用比ChatGPT更强大的语言模型

微软bing,经常被人遗忘的搜索引擎即将重获新生。正如预期的那样,这家科技巨头周二宣布,它正在与 OpenAI 合作,利用该公司的 AI 技术增强 Bing。然而,微软也有一个惊喜:下一个版本的 Bing 将采用一种新的下一…

BFT 最前线|OpenAI暂时下线ChatGPT”浏览“功能;Stability AI CEO:5年内,人类程序员将不复存在

原创 | 文 BFT机器人 AI视界 TECHNOLOGY NEWS 01 Open AI暂时下线ChatGPT“浏览”功能 日前OpenAI方面宣布,面向ChatGPT Plus用户的"浏览"功能会在某些情况下出现故障,因此已于7月3日暂时禁用了这一功能。该功能是为了提高ChatGPT的搜索体验…

开发者笑疯了! LLaMa惊天泄露引爆ChatGPT平替狂潮,开源LLM领域变天

【导读】Meta的LLaMA模型开源,让文本大模型迎来了Stable Diffustion时刻。谁都没想到,LLaMA的一场「史诗级」泄漏,产生了一系列表现惊艳的ChatGPT「平替」。 谁能想到,一次意外的LLaMA泄漏,竟点燃了开源LLM领域最大的…

巴比特 | 元宇宙每日必读:ChatGPT推出新功能「自定义指令」,可秒变「高级个人AI助理」,用户可设定各种角色...

摘要:据新智元报道,继Code Interpreter后,ChatGPT又迎来重磅升级。今天,OpenAI官宣了「自定义指令」(Custom instructions)新功能,该功能可让你的ChatGPT秒变个人助理,教练、营养师、…

浪潮信息刘军:智算力就是创新力 | MEET2023

Pine 整理自 MEET2023量子位 | 公众号 QbitAI 在人工智能的三驾马车中,算力作为算法和数据的支撑,它的作用一直都不容小觑。 目前,人工智能在和各个行业不断融合发展,这对算力也提出了更高的要求。 无论是AI大模型训练&#xff0c…

让我们在 Python 中使用 ChatGPT,这是目前的热门话题!

让我们在 Python 中使用 ChatGPT,这是目前的热门话题! 源码在公众号:猛男技术控,回复:chatgpt 即可获得 介绍 许多人已经知道,ChatGPT 是一种强大的自然语言处理 (NLP) 工具,风靡全球。它用于…

【SpringMVC】| RESTful架构风格、RESTful案例(CRUD)

目录 RESTful架构风格 1. RESTful简介 2. RESTful的实现 3. HiddenHttpMethodFilter RESTful案例(CRUD) 1. 准备工作 2. 功能清单 列表功能(显示数据) 删除数据(难点) 添加数据 更新数据 图…

【送书福利】普通用户“快速进阶”与资深玩家“解锁大招”的实用秘籍:《用ChatGPT与VBA一键搞定Excel》

本文目录 摘要作者简介本书特色内容简介送书福利 摘要 Excel是一款广泛应用于数据处理和分析的工具,而VBA(Visual Basic for Applications)是一种用于编程自动化Excel操作的语言。然而,对于非专业的Excel用户来说,VBA编…

ChatGPT与Excel结合_编写VBA宏

先来解释下什么是Excel vba宏 ⭐Excel VBA宏(Visual Basic for Applications)是一种用于在Microsoft Excel中自动化和扩展功能的编程语言。VBA允许用户编写自定义的脚本或宏,以便通过执行一系列指令来自动完成特定任务。 使用Excel VBA宏&a…

Cursor--基于ChatGPT的辅助编程软件

Cursor--基于ChatGPT的辅助编程软件 简述下载安装软件使用感想 简述 Cursor是一款与OpenAI合作并且基于ChatGPT的新一代辅助编程软件,不用科学上网,使用简单。 下载安装 下载网址: https://www.cursor.so/步骤: 1.打开网址&am…

为什么很多公司选择在年底裁员?

裁员是每年年底都无法避免的话题,尤其是今年,显得更为突出。裁人的速度也是一次次被刷新:有的上午还在过需求,下午就通知走人;有的吃个午饭回来就已经没有打开电脑的权限了…其中还有不少是处于实习阶段的应届毕业生&a…

美国最大运营商裁员4.4万人,作为普通的程序员,我们该如何面对互联网裁员浪潮?

近日,面对难看的财务报表,美国最大的通讯运营商、市值2200亿美金的Verizon,遣散了4.4万名老员工。 在国内,解决了80%就业的中小企业也遭遇了新一轮生存困境…社会很残酷,追求稳定的人都被时代抛弃,有远见的…