大模型论文周报 | 来自MIT、哥伦比亚大学、港科大、斯坦福、普林斯顿大学等机构前沿论文研究...

点击蓝字

a515234d0cfdd41abc13e421af61fdae.jpeg

关注我们

AI TIME欢迎每一位AI爱好者的加入!

大模型又可以称为Foundation Model模型,模型通过亿级的语料或者图像进行知识抽取,学习进而生产了亿级参数的大模型。大模型的出现迎来了AI研究的新时代,其所带来的结果提升十分显著,超越了很多领域中针对研究问题设计特定算法实现的提升。

本周精选了10篇大模型领域的优秀论文,分别来自MIT、哥伦比亚大学、港科大、斯坦福、普林斯顿大学等机构。

为了方便大家阅读,只列出了论文标题、作者、AI华同学综述等信息,如果感兴趣可点击“论文详情页”查看原文,PC端数据同步(收藏即可在PC端查看),每日新论文也可登录小程序查看。

f30e154a96e0f6dada09fd75f522ad97.jpeg

1. SE(3) diffusion model with application to protein backbone generation论文详情页

作者:Jason Yim,Brian L. Trippe,Valentin De Bortoli,Emile Mathieu,Arnaud Doucet,Regina Barzilay,Tommi Jaakkola

AI华同学综述(大模型驱动):在本文中,基于三维建模的传播模型已经成功地产生了具有结构性的新功能性蛋白质基础。然而,对于SE(3)上的基本方法论,没有关于分段等效的统一的方法论。我们开发了一个FrameDiff框架,该框架用于学习多个镜头上分段得分的不同分数。我们发现我们的样本能够扩展超越任何已知的蛋白质结构。

2. A Multitask, Multilingual, Multimodal Evaluation of ChatGPT on Reasoning, Hallucination, and Interactivity论文详情页

作者:Yejin Bang,Samuel Cahyawijaya,Nayeon Lee....Pascale Fung

AI华同学综述(大模型驱动):本文提出了一种基于公开数据集的技术评估框架。我们使用21个带有8种基本NLP应用程序的语料库进行了广泛的实证评估。根据这些语料库和一个新设计的多向图表对ChatGPT的多任务、多语言和多模态方面进行了评估。我们发现,它在大多数任务中都优于零射击学习,甚至超过了精确校准模型。此外,我们发现,它能够从文本提示中生成多样性的视频内容,通过中间的编码生成步骤来实现。

3. MarioGPT: Open-Ended Text2Level Generation through Large Language Models论文详情页

作者:Shyam Sudhakaran,Miguel González-Duque,Claire Glanois,Matthias Freiberger,Elias Najarro,Sebastian Risi

AI华同学综述(大模型驱动):我们描述了用于生成各种环境的Mario格式特技。我们展示了如何将这种技术与新的大型语言模型相结合,以实现可控级别生成。此外,我们还引入了一种新的搜索算法,该算法可以灵活地组合多种模式来生成不同的水平。

4. Is ChatGPT a General-Purpose Natural Language Processing Task Solver?论文详情页

作者:Chengwei Qin,Aston Zhang,Zhuosheng Zhang,Jiaao Chen,Michihiro Yasunaga,Diyi Yang

AI华同学综述(大模型驱动):开放式数据库的自然语言处理能力随着规模的提高,大型语言模型(LLM)已经证明了能够执行各种自然语言处理(NLP)任务零射击。最近的推出吸引了大量的关注,因为它可以生成对人类输入的高质量反应,并基于后续的交流来纠正以前错误。然而,尚未确定这是否能成为一个通用的自然语言处理方法,或者ChatGPT是否适合许多NLP任务完成零射击。在本文中,我们进行了实证分析,通过评估20个受欢迎的NLP语料库来衡量该系统的无射击学习能力。我们发现,该系统在许多有利可图的任务上表现良好,但当解决特定的任务时仍然存在挑战。

5. Theory of Mind May Have Spontaneously Emerged in Large Language Models论文详情页

作者:Michal Kosinski

AI华同学综述(大模型驱动):我们将传统无知任务、人们用来测试人类行为能力的普通假设任务(如误导行为或自我意识等)送到几种语言模型中,没有借助任何先前训练的例子。结果表明,在2022年之前发布的模型中,它们几乎无法解决TOM任务。然而,截至2022年1月,该工具已解决了70%以上的TOM任务,与7岁儿童的表现相似。这些发现表明,这种能力自发的出现可能是一种语言模型改进的能力的结果。

6. Multi-Source Diffusion Models for Simultaneous Music Generation and Separation论文详情页

作者:Giorgio Mariani,Irene Tallini,Emilian Postolache,Michele Mancusi,Luca Cosmo,Emanuele Rodolà

AI华同学综述(大模型驱动):在本文中,我们定义了一个基于传播的生成模型,它可以处理音乐合成和源分割。除了基本推理任务(即产生混合物,分离来源)外,我们还引入并实验了源归纳部分推理的推理任务,该任务包括给别人分配一组源的来源子集。此外,我们提出了一种新的用于源归纳的推理方法。我们训练了我们的模型在斯拉克2100数据库上,这是一个音乐资源提取标准的数据集。

7. SWARM Parallelism: Training Large Models Can Be Surprisingly Communication-Efficient论文详情页

作者:Max Ryabinin,Tim Dettmers,Michael Diskin,Alexander Borzunov

AI华同学综述(大模型驱动):在本文中,我们考虑了训练大型模型的替代设置:使用廉价的预处理实例或从多个地区挖掘现有资源。我们在这些条件下分析了现有模型平行算法的性能,并找到了这些条件下的训练大模型的局面。基于这些发现,我们提出了斯瓦尔姆平行性,这是一个设计用于不连接、异构和无可信的设备的模型平行学习算法。

8. BLIP-2: Bootstrapping Language-Image Pre-training with Frozen Image Encoders and Large Language Models论文详情页

作者:Junnan Li,Dongxu Li,Silvio Savarese,Steven Hoi

AI华同学综述(大模型驱动):Blip2是一个泛型且有效的预训练策略,该策略将视图语言培训从冷冻原始训练的图像编码器和冷冻大型语言模型驱动。Blip2与一种轻型查询转换器相结合,在两个阶段进行训练。首先,我们引入一个带有解析器的小型语法翻译器来引导对数线性规划的学习。然后,我们使用无限制文本生成自然语言输出的能力。

9. Describe, Explain, Plan and Select: Interactive Planning with Large Language Models Enables Open-World Multi-Task Agents论文详情页

作者:Zihao Wang,Shaofei Cai,Anji Liu,Xiaojian Ma,Yitao Liang

AI华同学综述(大模型驱动):我们研究了基于大型语言模型的协同规划方法的问题。我们发现,由于任务的长期性以及目标之间的距离,选择好的策略会产生不均衡的结果。为了解决这个问题,我们提出了“描述、解释、计划和选择”(DEPS),一种基于大型语言模型(LLM)的协同规划方法。我们的方案通过一个可学习的模块将平行子目标划分为预计完成的步骤,并根据结果对其进行改进。我们的实验标志着第一个能够高效地执行70多项《我的世界》任务的可持续发展壮举。最后,分析和探索研究详细说明了我们的设计是如何击败对手的,并为最终版本提供了一份有希望的更新。

10. Large language models can segment narrative events similarly to humans论文详情页

作者:Sebastian Michelmann,Manoj Kumar,Kenneth A. Norman,Mariya Toneva

AI华同学综述(大模型驱动):人类对事件的感知有一个非常重要的前提,研究人员通常通过从几个观察者中提取行为注释来获得此类信息。在这里,我们提出了一种替代计算方法,在大型语言模型GPT3中使用大规模语料库,而不是使用人类注释。我们证明了GPT3可以将连贯的叙事文本分割为事件。GPT3注释的事件与人类事件注释有很大的相关性。此外,这些GPT提取的注释达到了“共识”解决方案的近似程度。

  • — end —

往期精彩文章推荐

05c8b26f5f3502f4328bca26908323c4.jpeg

记得关注我们呀!每天都有新知识!

 关于AI TIME 

AI TIME源起于2019年,旨在发扬科学思辨精神,邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索,加强思想碰撞,链接全球AI学者、行业专家和爱好者,希望以辩论的形式,探讨人工智能和人类未来之间的矛盾,探索人工智能领域的未来。

迄今为止,AI TIME已经邀请了900多位海内外讲者,举办了逾450场活动,超500万人次观看。

463dda9937859e45171eee3a699dc3fb.png

我知道你

在看

~

f7d1c681405e6f28e1f70e2bb887c273.gif

点击 阅读原文 查看更多!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/8376.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

AIGC技术周报|ChatDoctor:哪里不舒服;HuggingGPT:连接大模型和机器学习社区;ChatGPT真的鲁棒吗?

AIGC通过借鉴现有的、人类创造的内容来快速完成内容创作。ChatGPT、Bard等AI聊天机器人以及DallE 2、Stable Diffusion等文生图模型都属于AIGC的典型案例。「AIGC技术周报」将为你带来最新的paper、博客等前瞻性研究。 1.ChatDoctor:哪里不舒服? 通用领…

实现短信验证码登录

文章目录 在开发短信验证码接口验证码实体SmsCode手机验证码发送接口手机验证码生成接口不拦截短信验证码路径登录页面测试重构校验码处理接口 ValidateCodeProcessor,封装不同校验码的处理逻辑抽象实现 AbstractValidateCodeProcessor两个子类分别实现发送功能 Ima…

Android实现登录系统(二)--SMS短信验证登录

SMS短信验证登录,大部分提供的这种服务都是要收费的, 但是Mob网站提供的并不收费,它是通过验证码的格式收费这样的服务盈利的, 也就是说使用他们的&#xf…

Android入门:利用SmsManager发送短信

我们可以通过Intent调用发送短信的服务,但是也可以通过SmsManager发送; 一、为何需要自己开发短信发送器 虽然在Android系统中已经存在发送短信的应用,但是如果我们在开发其他应用时需要集成发送短信功能,则很方便。 二、开发短信…

难顶!ChatGPT又双叒大面积封号了...

编辑:桃子 【新智元导读】ChatGPT大面积封号ing... ChatGPT又双叒开始大面积封号了... 从昨天开始,许多童鞋纷纷表示,自己的ChatGPT plus账号被封了。 许多人收到了一封来自OpenAI的邮件,文中称由于账号存在可疑行为,…

ChatGPT突遭大规模封号,一场网安强震即将爆发!

前言 ChatGPT狂飙出圈,推出仅5天,用户就超过100万,上线两个月,全球活跃用户就已破1亿。 然而就在这两天又传来劲爆消息:ChatGPT正在悄无声息地大规模封号!很多人得知消息后登录就发现自己的账号已经不在。…

ChatGPT全球大封号!数10万企业停摆:第一批玩AI的人,被AI给玩了

观点| Mr.K 主笔| Wendy.L 编辑| Emma 来源| 技术领导力(ID:jishulingdaoli) 3月31日,Open AI就开始无征兆的进行全球大封号,其中亚洲是重灾区,官方没有给出任何声明,具体原因不得而知。并且暂停了这些地区新账号的…

突发!因为这个原因,ChatGPT又双叒大面积封号了...

来源 | 新智源 ID | AI-era ChatGPT又双叒开始大面积封号了... 从昨天开始,许多童鞋纷纷表示,自己的ChatGPT plus账号被封了。 许多人收到了一封来自OpenAI的邮件,文中称由于账号存在可疑行为,为了保障平台安全,才这么…

【产业互联网周报】华为宣布实现MetaERP研发和替换;微软为ChatGPT自研AI芯片;...

关注ITValue,看企业级最新鲜、最价值报道! 钉钉、文心一言、WPS等接入大模型;火山引擎推出大模型训练平台及自研DPU;谷歌合并旗下两大人工智能部门Brain和DeepMind,加速研究力战ChatGPT……又是为AIGC疯狂的一周 【产业…

顶级研究机构发布《ChatGPT 全产业研究报告》 120页PDF 打包下载

ChatGPT是时下最火的话题,国内多家顶级研究机构,对ChatGPT做了全方面的研究。为了方便大家学习,小编收集了最新的13份共120页的学习资料,截图如下: 这些资料来自网络,版权归属各研究机构,感谢以…

从大模型走向小模型,谁将是ChatGPT布局to B行业的大赢家?

ChatGPT淘金热 当前,爆发了ChatGPT热潮,吸引众多科技企业陆续加入其中。这与当年美国西部加利福尼亚的淘金热何其相似。 历史总会惊人的相似,ChatGPT聊天机器人好比一座数字化时代的金矿。全世界科技淘金人蜂拥而至,从潮起到潮落…

如何实现chatgpt的打字机效果

点击↑上方↑蓝色“编了个程”关注我~ 这是Yasin的第 88 篇原创文章 打字机效果 最近在搭建chat gpt代理的时候,发现自己的配置虽然能够调通接口,返回数据,但是结果是一次性显示出来的,不像之前的chat gpt的官网demo那样实现了打字…

如何使用ChatGPT提升自己的“码”力?

如何使用chatGPT提升自己的"码"力? 代码评审(CodeReview)代码优化代码释义提供解决方案代码生成设计模式和架构建议学习新知识总结 ChatGPT是什么,我就不用再多介绍了吧!相信大家已经看到了它在文本领域所展现出来的实力,虽然目前…

云孚快写:自动生成多级目录,一键生成万字长文

1.产品简介 云孚快写是云孚科技自主研发的一款智能写作产品,基于大模型技术打造,针对长文写作场景深度优化,可根据文章标题一键生成目录,再根据目录一键生成正文,文章字数无上限,可极大提升用户的长文写作…

低调且强大--iVX低代码平台

iVX目录 前言一、低代码那么多 为什么选择iVX?二、“拼”出来的低代码平台,真的好用吗?三、iVX与其他低代码有啥可比性? 前言 首先我们应该明白自动编程突破可能是:领域内Mini LLM 现在的思路都是搞LLM,几乎…

多方合作时,系统间的交互是怎么做的?

大家好!我是sum墨,一个一线的底层码农,平时喜欢研究和思考一些技术相关的问题并整理成文,限于本人水平,如果文章和代码有表述不当之处,还请不吝赐教。 以下是正文! 文章背景 我们最近做了很多…

你真正了解低代码么?(国内低代码平台状况分析)

■ 写在前面■ 低代码产品如何分类,90% 的人都没有搞清楚■ 低代码平台如何比较?Point 在哪儿?一个比喻大家全听懂■ “拼”出来的低代码平台,真的好用吗?■ 推荐一款 C 端低代码产品 ■ 写在前面 都说技术是生产力&a…

【AI实战】给类ChatGPT的大语言模型外挂私有知识库

【AI实战】给类ChatGPT的大语言模型外挂私有知识库 原理准备环境代码下载 chatglm-6b 模型权重文件下载 Embedding 模型 GanymedeNil/text2vec-large-chinese安装依赖库我的计算资源 外挂知识库开启服务外挂知识库 测试参考 本文使用 langChain 来给大语言模型 ChatGLM-6B 外挂…

一块GPU搞定ChatGPT;ML系统入坑指南;理解GPU底层架构

1. 跑ChatGPT体量模型,从此只需一块GPU 在发展技术,让大模型掌握更多能力的同时,也有人在尝试降低AI所需的算力资源。最近,一种名为FlexGen的技术因为「一块RTX 3090跑ChatGPT体量模型」而获得了人们的关注。 虽然FlexGen加速后的…

谷歌研究科学家:ChatGPT秘密武器的演进与局限

来源|TalkRL OneFlow编译 翻译|徐佳渝、贾川 同样是基于GPT预训练模型,为什么ChatGPT的效果要远远超出GPT-3等前几代模型?答案已经揭晓,成就ChatGPT的秘密武器在于RLHF,也就是人类反馈的强化学习。 在预训…