Meta 推出大型语言模型 LLaMA,比 GPT3.5 性能更高

9091d4e3857e9b3c166f0480104ccafb.gif

整理 | 禾木木       责编 | 梦依丹

出品 | CSDN(ID:CSDNnews)

ChatGPT 的爆火使得大家对 AI 进行了深度的讨论,大厂们也都在向公众展示他们所谓的 "生成性人工智能"已经准备好进入黄金时代。

近日,Meta 宣布推出大型语言模型 LLaMA(Large Language Model Meta AI),加入到由微软、谷歌等科技巨头主导的 AI“军备竞赛”中。同 ChatGPT、New Bing 不同,LLaMA 并不是一个任何人都可以与之对话的产品,也并未接入任何 Meta 应用。

公司 CEO 扎克伯格表示,LLaMA 旨在帮助研究人员推进研究工作,LLM(大型语言模型)在文本生成、问题回答、书面材料总结,以及自动证明数学定理、预测蛋白质结构等更复杂的方面也有很大的发展前景。能够降低生成式 AI 工具可能带来的“偏见、有毒评论、产生错误信息的可能性”等问题。

8468d8c6aa707f4f3ef665ffd08b00d1.png

Meta 表示,LLaMA 可以在非商业许可下提供给政府、社区和学术界的研究人员和实体工作者,正在接受研究人员的申请。

此外,LLaMA 将提供底层代码供用户使用,因此用户可以自行调整模型,并将其用于与研究相关的用例。

目前 Meta 在 GitHub 上提供了精简版 LLaMA。

f9b9ecc67d9b36ec09324520e5234d2d.png

6821f7b34b6b62726e3bc9c5bdb8b54d.png

比 GPT3.5 性能更高:参数规模小、训练数据多

Meta 目前提供有 70 亿、130 亿、330 亿和 650 亿四种参数规模的 LLaMA 模型。

在一些测试中,仅有 130 亿参数的 LLaMA 模型,性能表现超过了拥有 1750 亿参数的 GPT-3,而且能跑在单个 GPU 上;拥有 650 亿参数的 LLaMA 模型,能够媲美 700 亿参数的 Chinchilla 和拥有 5400 亿参数的 PaLM。

与此同时,所有规模的 LLaMA 模型,都至少经过了 1T(1万亿)个 token 的训练,这比其他相同规模的模型要多得多。例如,LLaMA 65B 和 LLaMA 33B 在 1.4 万亿个 tokens 上训练,而最小的模型 LLaMA 7B 也经过了 1 万亿个 tokens 的训练。

c8250ed41648a831bd05bc2311877133.png

与其他大型语言模型一样,LLaMA 的工作原理是将一系列 tokens 作为输入,并预测下一个单词以递归生成文本,Meta 使用了 20 种语言对其进行训练。

4c8a1b93ea021e64d585426b3c50a86b.png

AI 能力结果评估

在常识推理方面 LLaMA 涵盖了八个标准常识性数据基准。这些数据集包括完形填空、多项选择题和问答等。

结果显示,拥有 650 亿参数的 LLaMA 在 BoolQ 以外的所有报告基准上均超过拥有 700 亿参数的 Chinchilla。

同时,除 BoolQ 和 WinoGrande 外,该模型测试中均超过拥有 5400 亿参数的 PaLM。拥有 130 亿参数的 LLaMA 模型在大多数基准测试上也优于拥有 1750 亿参数的 GPT-3。

闭卷答题和阅读理解方面,LLaMA-65B 几乎在所有基准上和 Chinchilla-70B 和 PaLM-540B 不相上下。

在数学推理方面,它在 GSM8k上 的表现依然要优于 Minerva-62B。

在代码生成测试上,基于编程代码开源数据集 HumanEval 和小型数据集 MBPP,被评估的模型将会收到几个句子中的程序描述以及输入输出实例,然后生成一个符合描述并能够完成测试的Python程序。

LLaMA-62B 优于 cont-PaLM(62B)以及 PaLM-540B。

此外, 在大规模多任务语言理解和训练期间的能力进化上,都有不错的表现

f065386f90f97d2d57f35b40f89d6177.png

结语

Meta 的目标是在未来发布更大的模型,这些模型在更广泛的预训练数据集上进行训练,同时它观察到随着规模的扩大,性能也在稳步提高。

在这场争夺 AI 霸主地位的竞赛中,OpenAI 率先发布了 ChatGPT,谷歌很快以其 "实验性 "聊天机器人 Bard 紧随其后,而中国科技巨头百度正计划以 Ernie Bot- ERNIE 3.0 进入战场。更不用说微软声称正建立在 "新的下一代 OpenAI 大型语言模型 "基础上的 Bing Chat(又名Sydney),它比 ChatGPT 更先进,而且还与 Bing 搜索整合。

大家也都在等待下一位官方声明,虽然 Meta 在这一领域进行了多次失败的尝试,但并没有被吓倒,它继续试验基于 LLM 的模型,成功推出 LLaMA。

随着其以前的模型在历史的尘埃中结束,每个人心中的问题是:Meta 这次真的能站出来吗?

AI 霸主之争还在持续升温,所有的目光都再次集中在 Meta 上,看看它是否有能力与大炮交锋。它是否能作为一个强有力的竞争者出现,还是像以前的模型那样,随着 LLaMA 的出现而逐渐消失?

未来,只有时间能证明。

参考链接:

https://analyticsindiamag.com/meta-launches-new-llm-llama-which-outperforms-gpt-3-at-a-fraction-of-the-size/

https://www.theverge.com/2023/2/24/23613512/meta-llama-ai-research-large-language-model

https://ai.facebook.com/blog/large-language-model-llama-meta-ai/

www.facebook.com

50ec6d31bbc2b9ac238c690ce0450458.gif

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/59897.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Chat Bot(聊天机器人)自动化测试脚本来解决人工测试的问题

问题描述:有一个Oliver Cafe Shop聊天机器人,如何实现自动化脚本自动测试这个聊天机器人的功能。 实现效果:通过代码来实现客户端发送请求来代替Bot Framework Emulator输入Tea,然后客户端监听和接收服务器端(Bot)发来的回复(图片中选择drin…

postman发送需要登录验证的请求

使用postman 发送后台需要登录验证的请求 postman需要填写的参数 Authorization的获取方式 打开前台发送一个成功的请求 找到里面的Authorization粘贴到postman参数那里就可进行请求了

Postman发送请求时带上登录信息

正常情况下,没有登录验证等公共接口,用postman进行get或post请求都很方便,加上相应的参数就行。 但是对于某些接口,可能需要先登录后才能请求,这时如果按正常的思路请求,可能就会被拦截了。 对于这种情况…

避免跳出谷歌人机验证 reCAPTCHA界面的解决方法

第一次遇到跳出谷歌人机验证 reCAPTCHA界面只要点击窗口就没有问题了,心里还感叹了下谷歌能把人机验证这事做的这么好,不错。然而这个窗口还是会不断调出来扰人 ,导致使用Chrome浏览器搜索变得很慢,体验感极速下降,非常…

postman 请求时提示需要登录解决方案

在postman中没有输入登入信息时会遇到下面的提示。 只需在游览器控制台中 network 找到对应的请求, 在其中找到有关 Authority 的 Request Headers ,将其复制 粘贴到postman中 再次执行,结果成功。

postman 登录--先获取到短信验证码,然后短信验证码的返回值作为登录接口的某一个请求值

业务场景:使用postman完成登录,先从一个接口获取到验证码,然后登录接口调用这个验证码 1.先写获取到验证码这个接口,返回的结果如下,我需要获取到data的值 2.然后需要把这个data返回的值设置成变量 //把data的值打…

使用postman完成需要发送验证码的会员注册请求

目标: 使用postman完成移动端的会员注册功能。 背景: 移动端会员注册时需要输入验证码,才能完成注册。 PC管理端有短信发送历史页面,能查询到注册时发送的验证码,验证码格式如下: [ uat_AutoTest ] 尊敬的用…

【异常解决】postman请求提示Full authentication is required to access this resource

Full authentication is required to access this resource解决方案 一、背景描述二、解决方案 一、背景描述 在使用 postman 测试接口时,该接口需要在 Header 中传入 access_token,实际上也在请求的 Header 中添加上了 access_token 参数,但…

请求后端返回的验证码显示的情况

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言一、情况一:数据是图片文件流二、情况二:直接返回是图片情况三:uni小程序的登录验证 最后 前言 在实际的项目中验证码登录几…

postMan 测试显示验证码

在postman的选项卡Test中,可以编写html格式的显示模板,在格式化显示时,变量使用的方式是两个大括号包着一个变量名{{变量名}}。 现在后端返回到前端的数据格式 一般是JSON格式,所以编写测试脚本要先把JSONW文本转换为JSON对象&am…

UNIX 工作站的大规模灭绝

行业快速迭代下,软硬件的淘汰速度似乎远超我们的想象。 链接:https://www.osnews.com/story/135605/the-mass-extinction-of-unix-workstations/ 声明:本文为 CSDN 翻译,未经允许禁止转载。 作者 | Thom Holwerda 译者 | 弯月…

【计算机网络】| Http.*协议该知道的那些事儿 | 面经

本文章参考了很多文档文献整理成狮子自己喜欢的风格类型文字,主要有: 《图解网络-小林coding》、Github上面的《前端语音社群》,ChatGpt 3.5 大家有兴趣可以去找来看看,一起上岸!!! 目录 面试官…

GPT-3问答机器人实战【LangChain】

原文:https://www.toutiao.com/article/7211527561673867779/?log_frome0e756d2bfaf5_1683079005521 ChatGPT 几个月前问世,并以其回答来自广泛知识集的问题的能力震惊了所有人。 在 ChatGPT 展示大型语言模型的强大功能时,Dagster 核心团队…

三秒钟,我要拿到世界杯所有队伍阵容信息

文章目录 🕐Im coming~🕑我写了个啥?🕔咋写的?🕘代码供上🕛 See you next time 专栏Python零基础入门篇🔥Python网络蜘蛛🔥Python数据分析Django基础入门宝典&#x1f52…

2022世界杯结果预测,简单AI模型最有效?附代码!

2022世界杯冠军是谁?本文将为你揭晓一个利用简单AI模型得到的靠谱预测。 许多人称足球为“不可预测的比赛”,因为一场足球比赛有不同的因素可以改变最终比分。 这是真的……在某种程度上。 北大出版社,人工智能原理与实践 人工智能和数据科…

我在chatgpt学习requestIdleCallback

react对接chatgpt,导入json形成记忆数据继续提问,想要私聊 [{"role": "user","content": "requestIdleCallback 怎么使用" }, {"role": "assistant","content": "requestI…

必应聊天放宽限制:每轮会话最多 30 次,每天上限提至 300 次

微软搜索和人工智能副总裁 Jordi Ribas 在最新推文中宣布,必应聊天(Bing Chat)进一步放宽限制,每轮会话最多支持 30 次,用户每天最多可进行 300 次交流。 必应聊天预览版在最初发布时没有任何关于每次会话或每天聊天次…

前端食堂技术周刊第 76 期:第 95 次 TC39 会议、React Labs 工作进展、加速 JavaScript 生态系统、设计系统元规范、AI 一周资讯、前端开发者的终局

美味值:🌟🌟🌟🌟🌟 口味:惠林顿牛排 食堂技术周刊仓库地址:https://github.com/Geekhyt/weekly 本期摘要 第 95 次 TC39 会议React Labs 工作进展AI 一周资讯加速 JavaScript 生…

直播APP制作时即时聊天功能实现

目前直播app制作很火,直播中的即时聊天功能必不可少。云豹直播作为优质的直播平台源码提供商,在即时聊天功能方面必有其独到之处,下面为大家从如何实现即时聊天这个功能上答疑解惑。 即时聊天这个需求在很多app中都有,也是公认的…

虚拟直播实现流程(多人连麦直播互动为例)

虚拟直播既可以实现单人视频直播,也可以邀请观众上麦、进行多人连麦互动。 虚拟直播场景的直播分为两个阶段: 单虚拟主播直播: 单虚拟主播直播是指主播创建房间后,使用虚拟形象进行音视频直播,观众可以进房观看直播。…