“干翻”GPT-3,Meta 用开源发起攻势

整理 | 彭慧中 责编 | 屠敏
出品 | CSDN(ID:CSDNnews)

大型语言模型,即具有超过 1000 亿个参数的自然语言处理(NLP)系统,在过去几年中改变了 NLP 和 AI 研究。这些模型经过大量文本训练,在生成创意文本、解决数学问题、回答阅读理解等方面表现出令人惊讶的能力。然而,这样的模型通常要经过几十万个计算日的训练,因此在没有大量资金的情况下难以复制。

2020年,OpenAI发布了具有1750亿参数的预训练模型,横扫文本生成领域。但“美中不足”的是一直没有开源,代码和模型看着眼馋,却到不了嘴边,只通过其申请及审核程序提供给学术界和商业实体使用。

最近,Meta AI实验室高调宣布,开源了能挑战GPT-3的语言模型Open Pretrained Transformer(OPT-175B)(https://github.com/facebookresearch/metaseq/tree/main/projects/OPT)。它由5个公开数据集的800GB的数据训练而成,还使用了能比拟GPT-3的1750亿个参数。然而,这个模型大小却比GPT-3小,仅为125M到175B。在人工智能圈,这算得上是一个里程碑事件。即使是在大语言模型历史上,这也是第一次毫无保留,把预训练模型、训练代码以及使用代码全部公开。
在这里插入图片描述
论文地址:https://arxiv.org/pdf/2205.01068.pdf

除了公开发布了模型及所有实验代码外,Meta还公开了他们的日志,日志包含团队成员对于数据训练的每日更新:如何将其添加到模型中,以及何时、哪些有效、哪些无效。在100多页的笔记中,研究人员记录了从2021年10月到2022年1月不间断运行的三个月训练过程中的每个错误、崩溃和重启。之所以共享这个模型,Meta AI希望更多的社区参与理解关于大模型的基本技术。

在这里插入图片描述

**“我相信建立信任的唯一方法是极度透明。”**Meta AI 的常务董事乔尔·皮诺(Joelle Pineau)说。自2017年加入Meta(当时的Facebook)以来,皮诺一直在推动人工智能研发过程的透明化。在核心学术会议发表研究的方式上,皮诺要求研究人员必须将包括代码和有关如何进行实验的详细信息与结果一起提交。她在其人工智能实验室一直倡导这种文化。

除此之外,Meta还很重视“环保”问题。人工智能的研究消耗了大量的计算能力。虽然行业实验室已经开始报告这些模型的碳足迹,但大多数不包括与实验研发阶段相关的计算成本,在某些情况下,研发阶段可能比训练最终模型更耗费一个数量级的资源。因此,Meta在开发OPT-175B时还考虑到了能源效率,在成功地训练了这种规模的模型的前提下,其碳足迹仅为GPT-3的1/7。

未来,Meta AI希望OPT-175B能够借助社区的力量,为大语言模型创建的前沿带来更多声音,也为该领域的大语言模型开发增加前所未有的透明度和开放性。

参考链接:
https://www.solidot.org/story?sid=71456
https://cloud.tencent.com/developer/article/1991424
https://www.sohu.com/a/544878024_473283

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/68751.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

听说,这届飞桨社区的框架贡献者真的很“卷”

飞桨平台的快速发展,与开源开放密不可分。飞桨框架建设并非只靠百度工程师,也离不开热爱飞桨、热爱开源的开发者们,他们用自己的方式参与飞桨框架建设,与飞桨共同成长。 为了鼓励更多的开发者参与到飞桨社区的开源建设中&#xff…

基于MemFire Cloud创建Posts社交网络论坛应用实战

MemFireDB,带你体验不一样的云端飞翔。 MemFire Cloud是一款提供云数据库,用户可以创建云数据库,并对数据库进行管理,还可以对数据库进行备份操作。它还提供后端即服务,用户可以在1分钟内新建一个应用,使用…

百度网盘加速|火狐插件global speed挂了?不用担心有新方法

考研党去考了个期末考试,回来继续看百度网盘就发现之前的插件用不起来了,心里拔凉拔凉的,赶快上网搜罗各种方法期待奇迹出现。 那就浅浅的解决一下问题吧!(忙着期末周,写的略微粗糙~) 百度网盘…

【游戏逆向】老飞飞怀恋魅力爱玩等老飞飞瞬移分析代码

【游戏逆向】老飞飞怀恋魅力爱玩等老飞飞瞬移分析代码 在游戏中,每个人物都有一个坐标。x坐标和y坐标。老飞飞也一样,可能有些朋友用ce找到当前的人物坐标。然后修改坐标就能达到瞬移到效果。不过有些老飞飞是无法实现的。只要瞬移就会掉客户端。今天就…

【网站加速器】浏览器一键加速神器SpeedyFox

你好呀!我是小易同学,一名普通的不能再普通的学习者。 写文章是为了记录自己的学习过程,同时也希望能帮助到需要的人。 如果我的文章对您有帮助,请不要忘记关注我哦🥰 一、介绍 SpeedyFox可以对Chrome浏览器、Edge、火…

Aeraki Mesh 正式成为CNCF沙箱项目,腾讯云携手合作伙伴加速服务网格成熟商用

作者:腾讯云高级工程师 赵化冰 刚刚获悉,由腾讯云主导,联合百度、灵雀云、腾讯音乐、滴滴、政采网等多家合作伙伴发起的服务网格开源项目 Aeraki Mesh 通过了全球顶级开源基金会云原生计算基金会(CNCF)技术监督委员会…

一文纵览Umi‘s Friends生态,GameFi浪潮的变革者

以“P2E”为特性的 GameFi,代表着游戏时代的新盈利模式,它将 NFT 或其他形式的代币化资产作为游戏内容,游戏内资产的寿命会,则随着这些资产继续存在于玩家的钱包中而延长(即便游戏关闭),资产的互…

一个骨灰级玩家的游戏加速器使用心得分享

骨灰级玩家可能算不上,但绝对算得上是一个stream的忠实玩家。虽然不能像大部分玩家一样天天吃鸡,但是作为一个stream的忠实玩家,也会经常玩《CSGO》、《全境封锁》、《GAT5》之类的游戏。在steam上也前前后后大概买了六七款游戏。 玩单机游戏…

高校如何学习思政课程?关键技术是这个

高校多方位多角度动态的进行质量监控,不断促进思政课程转变教学理念、改革教学方法,提高思政课的针对性、吸引力和感染力。 思政课程是高校落实立德树人根本任务,推进三全育人纵深发展的关键环节,与作为立德树人关键课程的思政课同…

AI in Finance<量化交易人工智能金融投资>(上)

投资有风险,操作需谨慎!!!! 本文为个人笔记,请审核通过,谢谢 不管多么优秀的统计模型都有局限,风险控制永远都要放到第一位! 分散化不要把鸡蛋放在一个篮子里&#xff0…

chatgpt赋能python:Python考试怎么办?一份高效备考指南

Python考试怎么办?一份高效备考指南 作为一名有10年Python编程经验的工程师,笔者认为在备考Python考试时需要注意以下几点: 1. 了解考试内容和考试形式 在备考时需要明确Python考试的大致内容和考试形式。Python考试通常包含Python基础语法…

chatgpt赋能python:Python考级指南:如何成功通过Python等级认证考试

Python考级指南:如何成功通过Python等级认证考试 Python是一门非常流行的编程语言,尤其在数据分析、人工智能和机器学习领域中非常受欢迎。Python的高级特性、易读性和可扩展性,使其成为越来越多企业和组织中必不可少的一部分。因此&#xf…

chatgpt赋能python:Python怎么考?全面解析Python相关考试内容及考试技巧

Python怎么考?全面解析Python相关考试内容及考试技巧 Python是一种高级编程语言,广泛应用于人工智能、数据分析、Web应用程序和游戏等领域。因此,Python也成为互联网公司招聘的热门技能之一。但是,如何有效地备考Python相关考试&…

《Web应用技术》期末复习(END)

说明:不知道是哪位兄台在群里说了一句,整的我压力山大。这是我个人的期末复习梳理,自己使用并且提供给几位有需要的朋友使用,并不确定期末考试考不考这些。请大家视情况查看和使用,如果有错误,也欢迎大家找…

刘赖简介——同泰国医馆专家介绍

刘赖,1961年出生,毕业于成都中医药大学,后就职于河北省华北油田总医院,主治医师。现任同泰国医馆咨询专家。 从事中医临床工作32年,精于中医内科、皮肤科,擅长于治疗男性性功能减弱和女性内分泌失调导致的…

选品推荐|shopee|lazada泰国热销的5大品类

泰国电商市场最热卖品类都有哪些? 2021年跟着Shopee. Lazada出海东南亚,跨境卖家应重点关注的市场之一便是泰国:泰国电商增长潜力巨大,至2025年将达130亿美金,在东南亚排名第三;Shopee Lazada跨境泰国站在机器翻译、SLS LGS及运营支持方面深耕已久,效能全面提升,2021年…

泰国地图高清中文版 电子版​

泰国地图高清中文版 电子版 软件大小:1.19MB 软件语言:简体中文 软件类别:图像浏览 软件授权:官方版 更新时间:2015-01-28 应用平台:/Win8/Win7/WinXP 泰国地图高清中文版完整的介绍了泰国的国土&#xff0…

泰国TISI标志LOGO

PCN 提供文章 The Product certification schemes of TISI Consists of 2 Types with different certification marks. TISI 的产品认证方案包括两种不同的认证标志 Voluntray Certification markmandatory certification mark 自愿性认证标志和强制性认证标志。 备注:所谓的…

Chrome浏览器扩展的写法

Chrome浏览器扩展写法 1.写在前面2.前言2.1. 什么是Chrome插件2.2. 学习Chrome插件开发有什么意义2.3. 为什么是Chrome插件而不是Firefox插件 3.开发与调试4. 核心介绍4.1. manifest.jsonbackgroundevent-pagespopupinjected-scripthomepage_url 5.Chrome插件的8种展示形式5.1 …

chatgpt赋能python:Python怎么横着输出?

Python怎么横着输出? 如果你是一名有10年Python编程经验的工程师,你一定已经经历过许多项目,很可能你曾经需要对代码进行一些横向格式化或输出。Python作为一种高级编程语言,有各种各样的技巧和技能。在本文中,我们将…