干货!来自北大、KAUST、斯坦福、达摩院的大模型前沿动态:表格推理、代码生成、MiniGPT-4、生成式推理...

点击蓝字

bd53667bbedfddd2060b968aa9c44599.jpeg

关注我们

AI TIME欢迎每一位AI爱好者的加入!

3a76d4ac1f90a94b39e384cc345956f7.png

cddc6bf78cd809a523b10b90439079df.png

ChatGPT的发布使得国内外众多的研究机构掀起了一股AI热潮,而这也进一步推动了人们对大语言模型的深入研究。2023年4月26日,AI TIME举办的大模型专场四活动邀请了阿里巴巴达摩院NLP研究员惠彬原、北京大学计算机学院软件研究所博士生姜雪、阿卜杜拉国王科技大学博士生朱德尧、斯坦福大学博士生盛颖。四位嘉宾分别介绍了自己在大模型领域的最新研究工作,分享了自己对于大模型的观点看法,并展望了未来人工智能的全新范式。

914e44e617a4944ef1d6a8d2f81a08d5.gif

个人报告

惠彬原:分解,分解,推理!大模型是超越人类的表格推理者

大模型目前已经展现出了在部分能力上超越人类的表现。本次分享中惠彬原首先介绍了表格推理的背景和任务,其次从Program Synthesis和Table Pre-training两个方面阐述了表格推理相关的研究工作并分析了GPT-3发布之后对表格推理的研究产生的影响与变化,提出要解决的两个主要问题:大语言模型如何泛化到多行的巨大表格中以及产生包含与证据信息不一致的误导性思维链,然后重点分享了关键框架Dater的设计思路以及该篇工作的主要贡献,通过实验结果展示了Dater在性能上的显著提升:Dater在TabFact上首次超越人类,最后展望了未来有待进一步解决的研究问题和研究方向。

姜雪:基于自规划和自合作的大模型代码生成技术

编程是一种解决问题强有力的工具,而代码生成是一种能让机器自动编程以满足人类意图或需求的技术。姜雪首先为大家阐明了代码生成的具体含义以及目前的研究发展状况,其次分析了现有代码生成方法中存在的问题,即只能解决函数级代码生成、行级代码补全这种短需求的场景,在面对复杂问题分析以及软件系统设计时则不尽如人意,她进一步提出了研究目标:使大模型在应对用户更复杂的需求时能展现更好的代码生成能力。姜雪介绍了该篇工作的主要思路,即通过引入规划和合作的方法论使得大模型解决更复杂的需求并且进一步提升代码生成的质量,最后通过实验数据展示了所提方法的优越性能

朱德尧:MiniGPT-4: Enhancing Vision-language Understanding with Advanced Large Language Models

GPT-4展示了非凡的多模态能力,例如能够直接从手写文本生成网站和识别图像中的幽默元素等。朱德尧首先表达了该篇工作的研究动机,即期望找到GPT-4视觉语言能力的来源并提升Blip-2整个系统的表现力,然后介绍了MiniGPT-4的设计方案及实验过程,它仅使用一个投影层将冻结的视觉编码器与冻结的LLM Vicuna对齐,最后通过对demo结果的展示表现了MiniGPT-4的新型功能与强大能力,说明了使用对话模板微调模型对增强模型生成可靠性与整体可用性至关重要。

盛颖:单卡上的高吞吐量大语言模型生成式推理

传统意义上,大型语言模型(LLM)推理的高计算和内存要求使其仅在多个高端加速器的情况下才可行,本篇工作研究了使用有限资源的高吞吐量大语言模型生成推理。本次分享中,盛颖首先介绍了语言模型的相关背景及其所需的数据条件,其次表明了工作的研究动机,即希望AI能够被更加民主化地使用,每个人可以拥有自己的大模型,然后阐述了降低大语言模型运行的三种要求,包括:模型压缩、协作推理、存储卸载,最后通过具体分析实验结果,证明了所提方法使得大语言模型在单卡上进行生成式推理的优越性能。

Panel

大模型是否会颠覆传统的软件开发?

姜雪:从某种程度上来讲,大模型确实在改变着软件开发的方式,能够帮助开发人员快速地生成代码,减少人工出错的可能性,并且可以自动地生成文档和测试用例。但是,我认为现在大模型还是不能完全取代传统的软件开发,可能会引发一种新的分工,使得人类更专注于专业化和创业化的工作。因为软件开发需要设计架构、编程、测试维护等各个方面的专业知识。目前大模型在很多情况下是一个比较有利的辅助工具,它并不能解决所有的问题,还是需要人类来提供监督和指导。此外,很多应用程序是依赖于特定的技术和领域知识的,大模型适用性不足,在这种情况下需要专业的人员来完成。

朱德尧:大模型会取代底层重复的没有创造力的工作,但是对于顶层的架构设计,在短期内还是需要人类去完成的。对于底层来讲,大模型具有较大的潜力,在自动化、个人认证等方面展现出较好的逻辑推移能力,如果好好利用大模型将能够提升工作效率,避免重复劳动。

盛颖:传统的软件开发形式会因为大模型的出现有所改变,但是不会被完全取代。目前在软件开发中已有的技术可以自动补全代码,提升开发效率,但是最终的结果还是需要人类进行验证。对于大模型会不会导致开发人员的就业困难这个问题,简单重复的工作被加速之后,能够创造出更多的机会,让大家能够将精力集中在更加有意思的工作中。

申泽楷:大模型能否颠覆传统软件开发没有一个确定的答案。它可能会颠覆一部分,会取代一些基础的架构,同时会产生一些新的软件开发范式。在新时代下AI是无法取代人类的,关键在于人类如何利用大模型的优势克服局限,去提升软件的开发质量和效率。

Panel

我们离真正的AGI有多远?

朱德尧:在短期内可能会出现通用的在感知和决策方面都能做到很好的AGI。从技术层面来讲,随着GPT版本的更新,互联网中的数据库已被大量使用,那么在未来可能会因为高质量数据的缺少而出现一个瓶颈。但是在下一步AI的训练范式又有可能从监督与自监督学习转化为强化学习,由被动地接收转变为主动收集数据并从数据中学习。从这个角度来看,一旦AI能够做到主动地抽取数据,探索学习世界,那么在未来3-5年内建造一个非常通用的能够做出决策的AGI模型时很有可能的。

盛颖:我对AGI的未来偏向乐观,因为他确实已经展现出一些人类无法完全理解的能力。而真正的AGI能否实现取决于两个方面:一是人类能否接受AI拥有自我意识进行主动探索;二是人类有多大的动力耗费代价去实现真正的AGI。我相信这在最终是能够实现的,但是短期来看,它对社会的价值更多的体现在辅助性层面,随着时间的推移,会变得越来越重要甚至不可替代。

姜雪:我对此持中立的态度,既不悲观也不乐观。真正的AGI应该像人类一样去学习,去适应推理解决广泛的任务,而不是局限在某个特定任务上的表现。目前的AI系统在处理一些任务的时候仍然是需要人类的这个干预和指导的,是没有办法完全代替人类的。要实现真正的AGI还是面临着很多挑战的,比如说具备人类的适应能力、创造创新能力、对人类情感和道德的理解。所以要实现真正的AGI不仅要解决计算技术的问题,还会有哲学上的挑战以及很多跨学科、领域的合作,需要很长的时间去发展。

申泽楷:我们在离未来真正的AGI可能还有很长的路要走,或许需要几十年或者更久。短期之内AGI不断涌现,但是在最终还是取决于人类对智能的探索,需要不断地创新和持续的努力。

Panel

大家会更喜欢本地使用或个人专有的模型,还是云端服务的模型?

盛颖:在未来肯定还是会同时存在这两种模式的,但是我更希望在将来每个人都能拥有专有的assistant。当然这也与AI模型架构朝着哪个方向搭建有关,是更应该专注于云端的服务措施还是专注于大模型本身的特色。AI的生态是与物种多样性相类似的,做到普遍性与特殊性的统一才能推动整个AI系统向前发展。

姜雪:如果有计算资源的话,我个人倾向于本地模型,因为我可以做到自由访问,探索资源是如何工作的。但是云端的服务会受到网络或政策的限制,涉及到数据隐私和安全性的问题。现在的大模型只是作为基础设施提供云端服务,在未来我希望有个人的大模型与云端服务的大模型结合,实现超级大模型。

朱德尧:在不关注硬件条件的前提下,由于隐私安全的问题,我会更希望有自己的模型。小模型会因为参数量的受限而缺乏大模型的涌现能力,目前更实际的问题是大模型需要的计算资源太大,所以云端模型会稍占优势,在未来会更倾向于哪一方面主要有两个影响因素确定:一是大型语言模型的规则是否还起作用,二是硬件的发展速度。

申泽楷:大模型的选择不是一个“0-1”问题,一定是各有优点和特色的,在未来一定会有更加灵活或者混合的方案出现,从而呈现“百花齐放”的局面,能够让用户根据自己的需求和偏好选择模型的特性和服务方式。

整理:陈研

审核:惠彬原 姜雪 朱德尧 盛颖

点击“阅读原文”跳转可以查看回放哦!

往期精彩文章推荐

a7febf56233e90bb53a80f4c4c3e8f66.jpeg

记得关注我们呀!每天都有新知识!

 关于AI TIME 

AI TIME源起于2019年,旨在发扬科学思辨精神,邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索,加强思想碰撞,链接全球AI学者、行业专家和爱好者,希望以辩论的形式,探讨人工智能和人类未来之间的矛盾,探索人工智能领域的未来。

迄今为止,AI TIME已经邀请了1100多位海内外讲者,举办了逾550场活动,超600万人次观看。

22608f8cd717acaaeafdebd85471987a.png

我知道你

在看

~

1e77f682760447ec6740ae52c0a964b0.gif

点击 阅读原文 查看回放!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/26576.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

5月25日活动报名 | 与五位来自AI产业和开发者工具服务领域的大咖一起思辨代码自动生成...

点击蓝字 关注我们 AI TIME欢迎每一位AI爱好者的加入! 10年内AI会淘汰程序员这个职业么? AI技术的发展已经给我们带来了很多的变化,尤其是在计算机编程领域,基于大模型能力的代码生成工具在这1年来得到了越来越多的关注&#xff0…

永远年轻,永远在路上的AI TIME

点击蓝字 关注我们 AI TIME欢迎每一位AI爱好者的加入! 在2019年的智源人工智能大会上,我第一次接触AI TIME,时至今日,加入AI TIME已经四年了。在过去的四年里,AI技术、产业发生了翻天覆地的变化,我自己的思…

除了AIGC,2023年还要面临哪些技术“双刃剑”?

最近两个月,人们惊叹于AIGC的“超能力”,但也对AIGC带来的潜在风险表示担忧。ChatGPT之父Sam Altman在最近的一次访谈中表示,AI在为人类的聪明才智提供力量倍增器的同时,也可能带来技术滥用、事故等安全风险。他重点指出「恶意人员…

生成式AI火爆全球,你是否已经做好了准备?

2023年,随着ChatGPT的火爆全球,生成式AI也引发了各界人士的广泛关注。一时间,从国际科技巨头到国内人工智能企业,几乎所有我们耳熟能详的科技公司,都纷纷杀入了生成式AI市场。 作为全球云计算技术的开创者和领导者&…

面对AI“龙卷风”破坏力 白宫“软着陆”欧盟“硬防御”

ChatGPT的风靡与风险将OpenAI的CEO山姆奥特曼(Sam Altman)送进白宫,他被蹲守在美国总统府邸的记者们围追,面对5月4日白宫发起的AI风险治理会议,奥特曼很官方地给出“重要也很及时”的回应,自信的反复强调“…

QQGC?揭秘QQ的AI绘画大模型技术

👉腾小云导读 2022年来,AIGC概念迅速出圈并快速形成产业生态,成为继PGC、UGC之后新的数字内容创作形式。QQ影像中心提出了自研的AI画画技术方案——QQGC,本文将介绍在QQGC基础大模型训练中的实践和探索,接着往下看吧~ …

Worldcoin,大众的加密货币还是个人的数字身份?

2022年8月,在印度班加罗尔一间大学的教室里,摩西•阿莫得(Moiz Ahmed)举起一个排球大小、中间有一个玻璃开口的铬合金球。阿莫得向学生们解释说,如果用这个叫做“Orb”的设备扫描他们的虹膜,他们将获得25个…

UML统一建模语言(UML类图)

UML统一建模语言 UMLUML类图类图的作用类的表示方法 类与类之间关系的表示方式关联关系单向关联双向关联自关联 聚合关系组合关系依赖关系继承关系(泛化关系)实现关系 UML 统一建模语言(Unified Modeling Language,UML)是用来设计…

用StartUML生成GoF设计模式类图与代码(c++)

先介绍一下startUML StarUML(http://www.staruml.com)的前身是Plastic,从1996年开始开发。1998年开始,Plastic转变为UML建模工具。2005年改名为StarUML,最新版本StarUML 5.0已经是一款功能全面的产品,支持…

详解GMM高斯混合模型EM模型

一般讲到GMM就会讲到EM。 我不过多的介绍EM算法。这里只是举一些例子来看看真实的GMM怎么用EM算的。 一、GMM的作用 记住GMM的作用,就是聚类! 二、GMM有hard和soft两种 hard-GMM和soft-GMM是为了对标k-means和soft k-means。在中文互联网上搜索到的GM…

UML建模及starUML使用

1、UML关系 1.1 六种关系图例 在UML类图中,常见的有以下几种关系: 泛化(Generalization), 实现(Realization),关联(Association),聚合(Aggregation)&#x…

统一建模语言UML(四):领域模型和类图

统一建模语言UML(四):领域模型和类图 领域模型 领域模型是对领域内概念类或现实世界中对象的可视化表示,也称为概念模型。是更为完整的业务模型的一个特例。从UML的表示法角度,领域模型被描述为一组没有定义操作的类图…

EA建模工具,介绍常用的UML图

[导读] 作为程序猿都最好掌握的一门语言,那就是UML(Unified Modeling Language),统一建模语言(UML)是软件工程领域中一种通用的开发建模语言,旨在提供一种可视化系统设计的标准方法。是开发人员、系统设计人员交流的有…

UML建模语言中的活动图

实验目的 通过上机实验,掌握活动图的语法和规则,深入理解活动图的概念 实验环境 Window下安装StarUML 实验内容 介绍活动图的基本语法与规则(可以用图形表述): 活动图是在流程图的基础上添加了大量软件工程术语的…

使用语雀绘制 Java 中六大 UML 类图

目录 下载语雀 泛化关系(Generalization) 实现关系(Realization) 关联关系(Association) 依赖关系(Dependency) 聚合关系(Aggregation) 组合关系&…

[精华] UML (统一建模语言) 各种图总结

UML(Unified Modeling Language)是一种统一建模语言,为面向对象开发系统的产品进行说明、可视化、和编制文档的一种标准语言。下面将对UML的九种图包图的基本概念进行介绍以及各个图的使用场景。 一、基本概念   如下图所示,UML…

迅速掌握统一建模语言UML图

统一建模语言 是非专利的第三代建模和规约语言。UML是一种开放的方法,用于说明、可视化、构建和编写一个正在开发的、面向对象的、软件密集系统的制品的开放方法。UML展现了一系列最佳工程实践,这些最佳实践在对大规模,复杂系统进行建模方面&…

UML建模三个工具: StarUML ,Telelogic TAU 和 Rose

UML建模软件目前用的主要有3种: 商业版本:Telelogic TAU 和 Rational Rose 开源版本:StarUML Telelogic TAU与Rational Rose的功能很强,但是需要买License。 StarUML就是希望能提供和TAU/Rose一样功能的开源版本。 目前使用起来…

统一建模语言UML(5)活动图

与其他图的区别 活动图与传统的流程图十分相似,活动图与流程图的最主要的区别在于,活动图能够支持活动的并行行为。 交互图和活动图都是用来对系统动态方面进行建模,区别: 交互图的节点是对象,描述了对象之间通过消息…

一、设计模式 - UML (统一建模语言) - 类图

文章目录 前言UML 类图1. 类图的自身结构2. 关联关系2.1. 自关联2.2. 单向关联2.3. 双向关联 3. 聚合关系4. 组合关系5. 依赖关系6. 继承关系7. 实现关系 前言 统一建模语言(Unified Modeling Language,UML)是用来设计软件的可视化建模语言&a…