“目前水平最高”!Meta 挑战 ChatGPT

f7fdd46b77a5853d351d1751eb71407f.jpeg

来源:数据观综合

编辑:蒲蒲

Meta发布全新大型语言模型LLaMA,加入硅谷AI竞赛。

继微软、谷歌之后,Facebook母公司Meta也宣布加入AI军备竞赛。

707b50de819d1c0c30d4e4ee773c919c.png

Meta 推出全新大语言模型

北京时间2月25日,脸书母公司 Meta CEO 扎克伯格在社交媒体宣布:推出最新的基于人工智能的大型语言模型(Large Language Model Meta AI,简称“LLaMA”)。

263e098be96d26913e17fa3661565c69.jpeg

据扎克伯格介绍,Facebook AI Research 研发的 LLaMA是“目前水平最高的”大型语言模型,目标是帮助研究人员推进他们在 AI 领域的工作。

1021139d19fb5a3f7b379115b52bc726.jpeg

据Meta的首席 AI 科学家杨立昆介绍,一段时期以来一直批评ChatGPT“缺乏创新”,它匆忙推向大众,并且用RLHF(人类反馈强化学习)来纠正一些错误,并不能从根本上解决问题。他介绍说:“LLaMA 是 Meta AI - FAIR 的一种新的开源、高性能大型语言模型。Meta 致力于开放研究,并在 GPL v3 许可下向研究社区发布所有模型。”

对于Meta来说,大语言模型并不是一个陌生的赛道。早在去年5月,Meta就曾推出一款面向研究人员的名为OPT-175B的大型语言模型。去年11月,Meta又开发并上线了AI语言大模型Galactica,旨在运用机器学习来“梳理科学信息”。但此后却因散布了大量错误信息,在上线48小时后火速下线。

而ChatGPT的上线时间则为去年11月30日。也是因此,当ChatGPT爆火时,Yann LeCun还曾评论称,人们对于ChatGPT的态度比对Glacatica更宽容。

国外投资机构DA Davidson高级软件分析师Gil Luria认为:“Meta今天的公告似乎是测试他们生成式AI能力的一步,这样他们就可以在未来将它们应用到产品中。”他还补充道:“生成式AI作为AI的一种新应用,Meta对此经验较少,但显然对其未来的业务很重要。”

1e97177ffd53c362388832b10bfb02af.jpeg

LLaMA实力如何?

据悉,LLaMA 语言模型家族的参数量从 70 亿到 650 亿不等。相比之下,作为 AI“巨星”ChatGPT 的底层模型,OpenAI GPT-3 则拥有 1750 亿个参数。

根据 Meta 的说法,LLaMA 本质上不是聊天机器人,而是一种研究工具,可能会解决有关 AI 语言模型的问题。

f98645a0cabd6de5f992d6aa446115f8.jpeg

据法新社称,按照 Meta 的表述,LLaMA 是一套“更小、性能更好”的模型,且不同于谷歌的 LaMDA 和 OpenAI 的GPT 机密训练资料和演算,LLaMA 是基于公开资料进行训练。

参数规模在 AI 领域非常重要,是负责在机器学习模型当中根据输入数据进行预测或分类的变量。语言模型中的参数规模往往直接决定其性能,较大的模型通常可以处理更复杂的任务、并产生更连贯的输出。然而,参数越多、模型占用的空间也越大,运行时消耗的算力也越夸张。因此,如果一个模型能够以更少的参数获得与另一模型相同的结果,则表示前者的效率有显著提高。

Meta 在官网表示,在大型语言模型中,像 LLaMA 这样的小型基础模型是可取的,因为测试新方法、验证他人的工作和探索新用例所需的计算能力和资源要少得多。基础模型基于大量未标记的数据进行训练,这使得它们非常适合于各种任务的微调。与其他大型语言模型一样,LLaMA 的工作原理是将一系列单词作为输入,并预测下一个单词以递归生成文本。

Meta 在其研究论文中指出,LLaMA-13B 在大多数基准测试中都优于 OpenAI 的 GPT-3 (175B),并且 LLaMA-65B 与最佳模型 DeepMind 的 Chinchilla70B 和谷歌的 PaLM-540B 具有竞争力。一旦经过更广泛的训练,LLaMA-13B 可能会成为希望在这些系统上运行测试的小型企业的福音,但是,它要让它脱离开发者独立工作,还有很长一段路要走。

cbad02f8b2ba3afa651bf58623d86770.jpeg

LLaMA 与其他大模型参数对比

独立 AI 研究员 Simon Willison 在文章中评论称,“我认为,我们有望在未来一、两年内通过自己的(旗舰级)手机和笔记本电脑,运行具备 ChatGPT 中大部分功能的语言模型。”

Meta 称,将致力于这种开源模型的研究,新模型会开源给整个 AI 研究社区使用,并授予大学、非政府组织和行业实验室访问权限。另外,Meta 表示其还有更多研究需要做,以解决大型语言模型中的偏见、有害评论等风险。

6467f7b45ea80006d46c7fd1e60f59b1.jpeg

使用公开数据集训练 或将打破大模型发展格局

Meta 训练其 LLaMA 模型所使用的是各类公开可用的数据集(例如 Common Crawl、维基百科以及 C4),意味着该公司可能会开源发布模型及其权重设置。在大语言模型行业当中,这代表着一波转折性的新发展,或将打破科技巨头在竞赛中永远把最好的 AI 技术“藏”起来的定式。

项目组成员 Guillaume Lample 在推文中指出,“与 Chinchilla、PaLM 或者 GPT-3 不同,我们只使用公开可用的数据集,这就让我们的工作与开源兼容且可以重现。而大多数现有模型,仍依赖于非公开可用或未明确记录的数据内容。”

Meta 将自己的 LLaMA 模型称为“基础模型”,意味着该公司打算以此为基础构建起更加完善的 AI 模型。这类似于 OpenAI 以 GPT-3 为基础构建 ChatGPT 的作法。Meta 方面希望 LLaMA 能在自然语言研究当中发挥作用,进而在“问答、自然语言理解或阅读理解、理解能力以及解决现有语言模型的局限性”等方面贡献力量。

虽然顶级 LLaMA 模型(LLaMA-65B,拥有 650 亿个参数)明显是在叫板竞争对手 DeepMin、谷歌及 OpenAI 的同类方案,但此次公布阵容中最有趣的反而可能是家族中的“小弟弟”LLaMA-13B,此外,Meta 也表示将提供 7B、13B、33B 和 65B 等参数尺寸的 LLaMA。

前面提到,LLaMA在多项基准测试时,在单 GPU 上运行的性能优于 GPT-3。而且跟 GPT-3 系列模型必须依赖于数据中心的庞大设施不同,LLaMA-13B 有望在不久的将来,让消费级硬件也能获得趋近 ChatGPT 的 AI 性能表现。

目前,精简版的 LLaMA 已经登陆 GitHub。要了解完整的代码的权重(即神经网络「学习」到的训练数据),Meta 已向感兴趣的研究人员开放访问申请表(https://forms.gle/jk851eBVbX1m5TAv5)。Meta 目前还未宣布更广泛的模型与权重公布计划。

LLaMA 项目地址:

https://github.com/facebookresearch/llama

LLaMA 论文地址:

https://research.facebook.com/publications/llama-open-and-efficient-foundation-language-models/

b7780b45b1a26e23cdcb8cba54ef6774.png

硅谷巨头的的AI之战

红杉合伙人Sonya Huang、Pat Grady曾撰文称,当下行业正处于生成式AI第四波发展浪潮中——杀手级应用涌现阶段。随着各大平台发展成熟,AI模型继续变得更好、更快、更便宜,越来越多的模型免费、开源,应用层面将出现大爆发。

LLaMA 的发布,意味着Meta 正式加入微软、谷歌等硅谷公司的AI竞赛。不久前,谷歌刚刚推出了人工智能聊天机器人Bard,对标的竞品正是ChatGPT。此前,ChatGPT的走红被视为对搜索引擎的最大冲击,而谷歌恰恰是这一领域的霸主。

虽然Bard在演示中的意外“翻车”一度带崩了谷歌的股价,但这一动作传递出的信号已经不言而喻。谷歌在广告中表示,Bard使用谷歌的大型语言模型构建,并利用网络信息。谷歌还将其聊天机器人描述为“好奇心的发射台”,称它有助于简化复杂的话题。

作为ChatGPT“背后的人”,微软更是有效利用了这一波红利,宣布推出由ChatGPT支持的最新版本人工智能搜索引擎Bing(必应)和Edge浏览器。

公开信息显示,2019年,微软向OpenAI投资10亿美元,双方达成协议合作开发“通用人工智能”,同时微软获得将OpenAI的部分技术商业化的权限。今年1月,微软又表示,将对OpenAI进行为期数年、价值数以10亿计美元的投资,有知情人士透露,微软曾讨论向OpenAI投资至多100亿美元。

值得一提的是,微软旗下的OpenAI、谷歌旗下的DeepMind以及Meta旗下的FAIR也被公认为全球领先的三大AI实验室。硅谷三巨头在大语言模型上的对战,不是偶然,而是必然。

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)大脑研究计划,构建互联网(城市)大脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

4a8c891a43042345f9653e21f9c06072.jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/17654.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

《流浪地球》让人细思极恐的是什么?

问:《流浪地球》让人细思极恐的一句话是什么? 答:交通第三交通委提醒您:道路千万条,安全第一条。行车不规范,亲人两行泪。 问:【闪拍生活】APP让人细思极恐的一句话是什么? 答&…

假期观影|《流浪地球》观后感

早上带着儿子一起去看了这场电影,电影里面描述的是不幸的事情,但现在的孩子是幸福的,想想自己这个年龄的时候只有《地道战》《地雷战》《上甘岭战役》还有《铁道游击队》等等爱国教育片。现在他们都是这类科幻大片。科幻题材的电影我看过《后…

北大教授雷奕安质疑《流浪地球》的69个不合理之处

数据猿导读 说不得,摸不得,更打不得!似乎所有人都在小心翼翼地活着、看着,被裹挟着、被引领着、被正确着、被... 来源:科学网博客丨作者:雷奕安 数据猿官网 | www.datayuan.cn 今日头条丨一点资讯丨腾讯丨搜…

从ChatGPT到MOSS,《流浪地球2》是否会照进现实?

要说热点的话,那么2023年开年至今,从流浪地球的MOSS引发的巨大讨论与争议,到ChatGPT的爆火引发的全民跟风热潮,至微软推出的新必应在测试中出现的“暴雷”,一切的舆论,一切的争议,都终归出于“人…

现有大语言模型(ChatGPT)的上下文理解能力还是假象吗?

人工智能的一个重要方面是人机交互智能,人机交互智能的核心在于机器对自然语言的理解,而机器翻译是衡量这种理解的有效方式。 按照目前LLM的技术路线,仅仅靠计算语言形式的概率能否产生人类式理解还是未知,但我们知道人类式理解是…

朋友圈宣传文案 朋友圈产品推广文案模板怎么写?

朋友圈互推,本质是利用异业联盟互换资源的原理; 营销值得学举个在现实生活中常见的例子,大家就能很好的理解,异业联盟互换资源的原理。使用得当,效果便是11>2! 我们院子有个买鸡蛋的大姐,为人实在乐于…

chatgpt赋能python:使用Numpy在Python中进行科学计算

使用Numpy在Python中进行科学计算 对于需要进行科学计算和数据分析的程序员,Python是一个非常有用的编程语言。而Numpy(Numerical Python)则是Python生态系统中最受欢迎和广泛使用的科学计算库之一。该库提供了高效的数组操作,线…

开源的全文搜索引擎总结,chatbot和chatgpt项目必备资源

全文搜索引擎就是通过从互联网上提取的各个网站的信息(以网页文字为主)而建立的数据库中,检索与用户查询条件匹配的相关记录,然后按一定的排列顺序将结果返回给用户。 1、Apache Lucene Java 全文搜索框架 许可证:Apa…

搜索框功能实现

搜索框功能实现 在开发搜索框过程中需要实现两个小功能,技术栈是nuxt.js 功能描述如下功能1:当鼠标聚焦的时候搜索框下方出现热门推荐,如下图所示 功能2:当输入搜索内容的时候,热门推荐消失,出现搜索结果…

input type=search 实现搜索框。

欲实现一个文字搜索的功能,要求输入时,键盘回车按钮提示显示为“搜索”。效果如下: input typetext并不能达到这种效果,google了一下,html5 增加的typesearch可以做到(但需要input typesearch外面包上一层带action属性…

chatGPT网站报错:Sorry,you have been blocked

打开charGPT网站突然进不去,显示:Sorry,you have been blocked. 尝试清理了chatGPT网站的cookie数据,还是不行。 最后解决方法: 关掉网站,换一个VPN国家,再次打开网站,登录进入成功。

一种解决ChatGPT报错“Sorry, you have been blocked“的方法

ChatGPT突然不能用,尝试了网上说的重启V某N,打开隐私模式等方法都不管用。 采用下面方式,解决: 1.打开浏览器的 “设置”。 2.找到语言设置 3.将首选语言改成英语 搞定!

最强绘图AI:一文搞定Midjourney(附送咒语)

最强绘图AI:一文搞定Midjourney(附送咒语) Midjourney官网:https://www.midjourney.com 简介 Midjourney是目前效果最棒的AI绘图工具。访问Midjourney需要科学姿势。 [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下…

教培行业的“智能GPT私教”?WorkPlusAI助理帮助教培机构实现十倍人效!

从横空出世到掀起高潮,当下,AIGC(人工智能生成内容)模式下的ChatGPT它正以惊人的速度席卷各个领域,在线教培行业也不例外。那么,正式进入落地期的ChatGPT,在在线教培行业有那些应用前景呢&#…

智能教育卷入GPT混战!三路玩家火拼,“AI老师”成标配

大模型教育场景落地,供给侧军备竞赛已开启。 作者 | 周炎 编辑 | 云鹏 明天,2023世界人工智能大会将正式开幕,据悉,30余款大模型都将悉数亮相,这其中就包括科大讯飞星火认知大模型、网易有道子曰大模型、百度文心一言…

智能教育卷入GPT混战,三路玩家火拼,“AI老师”成标配

大模型教育场景落地,供给侧军备竞赛已开启。 作者 | 周炎 编辑 | 云鹏 明天,2023世界人工智能大会将正式开幕,据悉,30余款大模型都将悉数亮相,这其中就包括科大讯飞星火认知大模型、网易有道子曰大模型、百度文…

最近火出圈的chatGPT智能AI聊天机器人

最近火出圈的chatGPT智能聊天机器人,相信大家都有所了解,那你们是否已经亲身体验过呢?今天,很高兴通知大家,我们最新上线了一个AI智能聊天机器人,让你可以随时随地与它进行自然语言交互。 无论聊天对话、查…

ChatGPT提示大解析:如何有效定制Prompt并用插件管理

有时候,你可能在编程时遇到难题,需要解决方法。有时候,你在学习新的语言时,想要找到一位悉心的教师。又或者,你可能只是需要一些新的灵感,来润色你的文章。在所有这些情况下,ChatGPT都可以发挥巨…

如何用ChatGPT1分钟内撰写完几万字的教学文件?

对于教师和培训工作者来说,进行上课之余,撰写教案也是一项十分耗费时间的任务,但是 Upskillr可以按照你的需要,在一分钟的时间里,为你撰写一份数万字的教学文件,供你下载。 首先登陆您的 ChatGPT帐号&#…