如何让大模型更聪明?

【导读】 6月20日下午,163期文汇讲堂“数字强国”系列启动,首期《AIGC驱动生产力跃升与良好世界塑造》,在涌动着毕业季青春气息的华东师大樱桃河畔成功举办。北京智源人工智能研究院副院长兼总工程师林咏华应邀作主讲,华东师大学者杨国荣致辞,计算机学院贺樑、哲学系郦全民、付长珍、潘斌、刘梁剑参与数字&人文圆桌对谈,13位听友现场互动。校内外7600余人观看华东师大微信号直播。现场发放了50枚NFT数字徽章.

本次讲座由文汇报社、上海树图区块链研究院、华东师大中国现代思想与文化研究所、华东师大哲学系伦理与智慧研究中心联合主办。

现经整理,刊发现场互动,以飨听友与读者。主讲和圆桌对话请见文末链接。

大模型走向更智能会遇到的天花板,尚在集体摸索中

图片

AI行业Convertlab公司主管高鹏:今年2月份开始,我们一直折腾于在大模型上做自动化应用,结果发现它没有想象中那么聪明。请问这种序列到序列的模型,技术上的天花板在哪里?智源有何突破计划?

林咏华:这是很专业的问题。从从业者的角度来看,当前国内的大模型并没有大家想象的那么聪明,大多数情况都还是要依赖人去调教。坦白来说,目前我们还没能够摸到天花板在哪里。包括智源自己在内的AI科研团队,还无法保证我们每一步都做对了。这里有很多的因素,包括许多算法的选择或者算法突破,还有待很多的实践。大模型正因为太大,试错成本很高,使得一些更激进的想法、创新或突破性设想不敢轻易去实施,因为可能动辄就要几百万、上千万的投入。

企业众筹降低大模型开发成本,还需要更智慧的机制

图片

商业协会秘书长平渊海:我毕业于经济学系,很关心成本。现在开发大模型需要很高的成本,有没有想过发动相同利益的企业一起做众筹呢?比如说和快递业企业联手研发专门用于分拣的大模型?如有,其中面临过哪些挑战?

林咏华:这个设想从今年上半年开始就一直就有。每一个行业都可以至少找到八到十家共同性质的企业一起众筹、训练行业大模型,做出来以后各家在企业的内部更精细地去锻造。这个想法很合理。只不过这里需要有充满智慧的顶层设计,难度不在技术层面,更多是在合作模式、商业模式、未来利益共享的顶层设计。

人文学者可以在AI支撑的体验时代继续提问和批判

图片

华东师大哲学系博士生李祥翔:AI在信息收集和处理方面的能力已经远远超过人类,未来在分析和回答问题上,人类或许也会落后于AI。根据您对科技和哲学的了解,哲学和人文社科学者,以后存在的意义和价值是什么,哲学人的任务只压缩为提出问题吗?

郦全民:按照我的理解,哲学家这个职业就是擅长提问题。假如说生产力发展了,机器人成为劳动者的主体,留给我们哲学家的任务是在体验时代提出好问题。英国在尝试的UBI实验(发基本月薪但可自由选择是否工作)就是这样的,需要哲学家提出新问题:比如,我们人类是否已经进入了那种包括看风景的体验时代?

另外,哲学家还有一个工作就是批判,它是永远需要的。今天的圆桌对话当中,大家发现我们的观点并不一样,就是在“批判性”地讨论。比如,对于通用人工智能是否会有自主意识,保留意见居多。但只要大模型达到一定程度,“涌现”某种能力是肯定的。目前,人工智能模型还没有达到人脑1%的参数。所以,我们需要一种开放、批判的心态。

审美确实创造出工作岗位,前提是人不依赖机器判断

图片

华东师大学哲学系博士生丁洪然:人工智能能替代的工作越来越多,但是人类的审美是有很大的差异性的,审美是否不可能被AI替代,由此创造出更多的职业选择和生活方式?

贺樑:在人工智能的影响下,未来需要人类做的工作应该会越来越少,当然,我们人类会被动或主动地想办法设计出适合我们做的事,审美是其中一个可能。美本身在不同的时代、不同的人群里就有不同的定义。它一是来自生物自然的感受;二是来自人类后天的定义,主观性较强。现在对美的标准,再过五年、十年都会发生变化。所以只要人还是世界主体的话,就有望按照人类的标准来定义,由此创造出超越机器能力的职业。

但前提是,要规避美的标准是由AI来帮我们确立和判断的,那样会沦为当下的下围棋一样,一步棋下得好不好,很多是依赖机器判断和指导,而并非由我们人来判断。这些充满创意的环节一旦都变成了机械的确定,就容易索然无味。

翻译领域生产力跃升:机器高效+人脑智慧与经验

图片

翻译公司创业主林韶春:我在六年前加入文汇讲堂时还是翻译公司的职员,后来响应国家双创号召成为了独立的创业者。请问,包括ChatGPT在内的AIGC技术,在翻译领域会如何提升行业的生产力?

付长珍:如何提升翻译领域的生产力?我自己没有创业的经历,只能“纸上谈兵”。技术和人的关系,是一种双向赋能,随着技术的发展不断更新自己创业的方式是非常必要的。ChatGPT拥有强大的语义理解和上下文推理能力,通过人机交互,可以使翻译过程更加流畅、高效,某种程度上确实可以大大提高生产力。但在一些关键环节上,仍然需要强调人的个性才智和想象力,需要翻译工作者的加工提升和检验。

我想,只要保持对技术的谦逊与审慎,人机协同才能更好地应对复杂性,不断提升翻译的质量和公司效益。

隐私保护的途径之一是大模型部署到私有化网络中

图片

通信行业高级工程师柴忠於:通过ChatGPT询问公司方面的业务,而公司又禁止用ChatGPT,具体落地时如何保护隐私?

林咏华:关于数据隐私,基于不同的大模型部署方式,通常有两种考虑。一是类似于ChatGPT包括国内的某些大模型,提供了在云上的服务,用户上传问题及相关信息,它再回答。理论上,大模型运营商都需要获得授权的情况下才能够访问用户上传的数据,否则是不合法行为。所以,这里存在一个问题,即你是否信任这些大模型运营商。

二是对于那些对信息保密有要求的行业,包括金融机构、医疗机构等,我们可以支持大模型的私有化部署,部署到企业的内部网络里,以避免商业信息的泄露。

版权的加密都在探索,最终应从技术层面加以实现

图片

人力资源工作者叶沛松:在基础大模型推动下,如何保护我们自己的版权和知识产权?在基础大模型推动下,如何保护我们自己的版权和知识产权?

林咏华:目前版权问题的讨论,主要是针对放到预训练数据里的知识内容,涵盖图片、视频、文字作品。怎么能够做到在训练的时候,对这些有版权的作品进行加密,从而避免版权作品的泄露?目前学术界在不断地研究各种方法,包括同态加密技术等。但使用这类技术,对现在的计算成本会上升很多很多。

所以,目前也有一些非技术方法,来缓解这类版权的问题。例如,当我们收集了大量有版权的数据需要公开时,版权所有者只要声明自己的作品不希望被收集,则可以要求数据收集方进行删除。举例,最近有一个收集全球代码数据以用于大模型训练的网站The Stack公开了一个链接,声明如果开发者发现自己的代码被收录到他们的数据集,但又不希望代码变成数据集中的一部分,可以申请在代码数据集里删除。

多模态下的文生3D,技术上指日可待,其后需不断迭代

图片

3D智能动画科技公司市场推广翁缪纯:我们公司在三四年前利用AI技术,开发了一款3D智能动画,所用时间、费用都较小。大模型出来后就遇到研发成本较高的瓶颈。请问,如何通过大模型解决这对成本矛盾?

林咏华:大模型在多模态,尤其是视觉多模态上面,不断有新的突破。当前已经发展比较成熟的是文生图的模型应用,此外有文生3D即通过一段文字就可以自动生成三维图像,进一步还可以用文字生成视频,只不过现在能自动生成的视频还比较短。所以,技术上指日可待,或许在未来一两年就可以通过大模型,让创作者输入一段文字的描述,即可自动生成3D动画。

强人工智能主导下,人有无可能发展成全面的人?

图片

华东师大哲学系博士生郭江勇:人类作为劳动者有这样的经历:从独立自主的劳动者到机器流水线上的一个环节,未来可能是再到人工智能时代的数字化按钮或者符号,这意味着人的劳动主体地位的逐步消解。因此,我特别疑惑的是:在智能化时代里,劳动者丰富的经验、技艺与风格逐渐被弱化,那么劳动者是否会丧失劳动主体的权利或资格?此时,人还能否成为一个全面发展的人吗?

潘斌:我们今天所看到的各种智能主体,包括人机协同、人形机器人或者机器手臂等,说到底还是由人来支配与控制机器,所以说,目前,人还是唯一的劳动主体,而距离强人工智能和超级人工智能的时代还较遥远。

但是,如果智能机器人或者强AI等有可能成为新的劳动主体,我们也不能排除它们会有觊觎、独占地球资源的念头或动机。在智能技术的加持与帮助之下,人类能否真正确立劳动主体的资格,取决于我们如何认识与规范关于人工智能的研发应用,取决于人工智能技术能否成为人类的真正工具与具体延伸。

从乐观主义的立场来看,在发达的智能时代人类有可能成为全面而自由的人。

从出版界获优质训练数据并仍维护版权,需法规前行

图片

海关工程师胡烨亮:您刚才谈到,在人工智能发展中优质语料的数量和质量不足,但又要实施版权保护。如果迁就这种版权保护,就会阻碍生产力发展。我的设想是国家或行业协会统筹支付一定的版权费用,来替代原来由各个公司垄断的版权达到版权共享。可行否?

林咏华:一方面,当前从社会及政府的层面已经意识到,不能够因为版权保护而让可能影响整个社会或者所有产业的一个重要技术的发展停滞下来。另一方面,我们这里所说的版权,只是用来做大模型的训练数据。并不是拿了一本书再次发布,这里是让机器去读,并不是人去读。

基于这两个重要的前提,目前业内正在进行很多积极的讨论,希望推动一些新的法律法规或者行业规范,可以使得我们更加有序地去组织,有机会去使用现在散落在各个地方的版权数据被组织起来,以供大模型训练使用或者被有偿使用。

这里也需要高层设计的智慧,因为它将打破两个不同产业的边界。

机器如能替代人的创造力,符合“宇宙的自然选择”理论

图片

华东理工大学工科博士生侯志伟:《技术的本质》这本书里讲到,科技的世界里各种高科技产品本质是技术的组合,一个产品下面是技术,技术下面还是技术,最后技术追究下去是一种现象,现象被人类所利用。人工智能已经可以识别图像、认知图象,某一天可以有机组合一些技术时,是不是可以认为要按照这条逻辑,那么机器是不是必将替代人类或者替代人类的创造力?

郦全民:我觉得技术发展了,是否会出现超级智能,要看看有什么力量在驱动?简单地说,有两种力量,一是个人的好奇心,另一就是英伟达创始人黄仁勋最近在台湾大学毕业生典礼上说的,“不管你是为了追逐食物,还是为了避免成为食物,都是要跑,不要走。”就是说,你要不落后就要跑,你还要跑得更快。

最后,人类会怎么样?可能是产生新的智能物种。我觉得这是好事。人类假如要离开地球、离开这个生物系统,进入另外一个状态,就需要新的智能物种超出生物的生态系统,实现进化新的方式。目前,科学中就有一个“宇宙的自然选择”学说,主张普适达尔文主义。人工智能体所处的电子生态系统与人所处的生物生态系统不同,有更广阔的进化空间,所以,我相信AI会超越人类。

降低幻觉率的方法,或以单一大模型技术与外部知识融合

图片

华东师大中国哲学硕士研究生龚胜男:主旨演讲中,您提到做评测时有人类参与。我在使用GPT中,发现它会说谎。是否可从技术层面保证它的客观性?

林咏华:大模型是基于概率产生内容,所以幻觉率(也就是“一本正经胡说八道”)是很难避免。目前可行的方法是,大模型与外部知识进行融合、增强。与外部客观存在的知识库、数据库或者搜索引擎去结合,尽量降低大模型的幻觉率,而使得它回答真正的“有理有据”。

AI人才不论从业时间长短,关键在于保有学习能力和融会贯通

图片

60秒提问由舞台上小闹钟控制时间,敦促听友简洁提炼问题,36分钟共互动了12个问题

文汇报记者李念:进入AI的大模型时代后,行业对人才的培养和需求、学校学科设置,和此前有何不同?(非现场提问,为会后交流所提)

林咏华:我觉得对AI领域人才的培养并没有太大的区别。在十多年前深度学习流行时,很多非AI领域人才转行涌入,现在大模型出现,又有一批非大模型的人才转型。并且,由于各种开源平台的蓬勃发展,这一轮的学习门槛更低了。比如B站上有各种针对开源大模型代码的视频教程,大家都可以很快上手。

所以,我认为对AI人才来说,始终不变的是,第一要保有持久的学习能力,哪怕在传统赛道的AI从业者,哪怕已经四五十岁的开发者,只要保持学习、善于融会贯通,都有很好的发展机遇。

第二,我相信,大模型和小模型会并存,大模型产业落地离不开很多已有技术。例如,在深度学习出来后,用OPEN CV做计算机视觉处理的人才甚至有了对他们更大的需求,因为深度学习不能解决所有问题,需要这些传统图像处理技术来完成前处理和后处理。对大模型而言,也是一样的道理。

学科设计上,我们觉得需要融入更多基础学科,需要更多学科和AI相结合,产生新的思维模式。我们相信,类似计算机软件技术,不远的将来,AI也会变成一个普遍的工具。

整理:李念

【精彩瞬间】

图片

1.163-1期文汇讲堂预热环节,播放了文汇报社制作的4个关联短视频,依次为文汇讲堂李念的《163期“数字强国”携NFT开启》,记者许炀的“许蜜桃下午茶”制作的《王安忆余华谈ChatGPT》,文艺部邵岭策划、融媒体视觉部制作的《AI音乐成为新生命》,文汇文艺评论制作的《莫言谈ChatGPT》,开场也引述了“文艺评论周刊”刊发的江晓原的观点。

图片

2.13:10分开始的进场中,听友张迪、高平、胡杨、丁启政等志愿担任会务签到、发放新事物NFT数字徽章(上方),当天的提问奖奖品为NFT数字徽章和8月即将出版的讲堂新书《万年中国》(上方)。

图片

3.整整两年后,2023年6月,文汇讲堂线下讲座恢复,开始了“现场+直播”模式。

图片

4.第一个环节是华东师大中国现代思想与文化研究所所长杨国荣致辞《科技发展与人类生活》

图片

5.林咏华当天乘早班飞机来到上海做主旨演讲,她夸奖文汇讲堂具有浓郁的人文气息,学者与听友的提问,进一步拓展了她的思路

图片

6.圆桌对话环节,围绕范式改变、人工智能会否替代人类智能、GAI 何时到来等四大问题展开热烈讨论

图片

7.当天发放的50枚由上海树图区块链研究院铸造的NFT数字徽章,其上的“虎”“羽”两字来自哲学系90高龄的王龙道老师的书法真迹   来自过程PPT/平源海设计

图片

8. 主持人李念与嘉宾(从左到右)贺樑、郦全民、林咏华、付长珍、潘斌、刘梁剑合影。

图片

9.开场前,林咏华与准同行计算机学院的贺樑教授热烈探讨。讲座前后,始终洋溢着跨界碰撞。

图片

10.华东师大微信公众号的视频直播,吸引了7000多全国各地的观众,此后又设置了24小时的回放。小图为一天前华东师大宣传部直播团队董生等在做导播台测试。

图片

11.优秀提问者后排从左到右李祥翔、叶沛松、丁洪然、郭江勇、平渊海与嘉宾合影

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/338848.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Whisper-AT:抗噪语音识别模型(Whisper)实现通用音频事件标记(Audio Tagger)

本文介绍一个统一音频标记(Audio Tagger)和语音识别(ASR)的模型:Whisper-AT,通过冻结Whisper的主干,并在其之上训练一个轻量级的音频标记模型。Whisper-AT在额外计算成本不到1%的情况下&#xf…

第三届大湾区算力大会丨暴雨开启数字未来新篇

5月30-31日,韶关市迎来主题为“算启新篇智创未来”的第三届粤港澳大湾区(广东)算力产业大会暨第二届中国算力网大会,活动由广东省人民政府主办,广东省政数局、韶关市人民政府共同承办。暴雨信息作为算力产业发展的重要构建者受邀赴会&#xf…

vue-2

vue-cli的安装 vue-cli是一个脚手架工具,它集成了诸多前端技术,包括但不仅限于: webpack、 babel、eslint、http-proxy-middleware、typescript、css pre-prosessor、css module、… 这些工具,他们大部分都要依赖两个东西&…

用例篇03

正交表 因素:存在的条件 水平:因素的取值 最简单的正交表:L4(2) 应用 allpairs 来实现正交表。 步骤: 1.根据需求找出因素和水平 2.将因素和水平写入到excel表格中(表格不需要保存)(推荐用…

WP All Import插件

使用 WP All Imports 插件并将亚马逊产品集成到 WooCommerce 网站中。在您的网站上,他们可以添加到购物车...然后一旦他们按下结帐,他们就会被发送到亚马逊进行付款 WP All Import 是一个强大的WordPress插件,它允许用户从XML或CSV文件中导入…

区块链--Ubuntu上搭建以太坊私有链

1、搭建私链所需环境 操作系统:ubuntu16.04,开虚拟机的话要至少4G,否则会影响测试挖矿时的速度 软件: geth客户端 Mist和Ethereum Wallet:Releases ethereum/mist GitHub 2、安装geth客户端 sudo apt-get update …

day20

第一题 23. 合并 K 个升序链表 本题是已经知道有多个链表,需要我们将这些链表按照升序排列的规则组合到一起,同时这些链表都是升序排列的; 解法一: 利用优先级队列 步骤一:利用优先级队列床架一个小根堆; …

事务报错没有显示回滚导致DDL阻塞引发的问题

在业务开发过程中,显示的开启事务并且在事务处理过程中对不同的情况进行显示的COMMIT或ROLLBACK,这是一个完整数据库事务处理的闭环过程。 这种在应用开发逻辑层面去handle的事务执行的结果,既确保了事务操作的数据完整性,又遵循了…

Jenkins流水线pipeline--基于上一章的工作流程

1流水线部署 1.流水线文本名Jenkinsfile,将流水线放入gitlab远程仓库代码里面 2构建参数 2pipeline脚本 Jenkinsfile文件内容 pipeline {agent anyenvironment {key"value"}stages {stage("拉取git仓库代码") {steps {deleteDir()checkout scmGit(branc…

kafka-生产者发送消息消费者消费消息

文章目录 1、生产者发送消息&消费者消费消息1.1、获取 kafka-console-producer.sh 的帮助信息1.2、生产者发送消息到某个主题1.3、消费主题数据 1、生产者发送消息&消费者消费消息 1.1、获取 kafka-console-producer.sh 的帮助信息 [rootlocalhost ~]# kafka-console…

CISCN 2022 初赛 ez_usb

还是从第一个 URB向后看 发现 同时 存在 2.8.1 2.10.1 2.4.1 但是显然 2.4.1 是7个字节 不满足 usb流量要求 只考虑 2.8.1 和 2.10.1 tshark -r ez_usb.pcapng -T json -Y "usb.src \"2.8.1\"" -e usbhid.data > 281.json 正常取数据即可 import js…

Vue3 - Mac系统用文本编辑写html不显示效果的坑

平时在win系统下,可以直接对文本进行编辑,非常的舒服。 在mac系统中,也有类似的功能,就是文本编辑,没想到居然还有坑。 这是我mac系统中创建的html文件,想着没有几行代码,就没有开编辑器了&am…

crossover软件是干什么的 crossover软件安装使用教程 crossover软件如何使用

CrossOver 以其出色的跨平台兼容性,让用户在Mac设备上轻松运行各种Windows软件,无需复杂的设置或额外的配置,支持多种语言,满足不同国家和地区用户的需求。 CrossOver 软件是干嘛的 使用CrossOver 不必购买Windows 授权&#xf…

Java Spring Boot 从必应爬取图片

获取图片主要就是通过必应图片页面控制台的元素,确认图片和标题在哪个类中(浏览器 F12) 引入依赖 这里需要引入两个依赖 jsoup 和 hutool maven依赖网站地址:Maven Repository: Search/Browse/Explore (mvnrepository.com) 挑选…

基于java18多端展示+ idea hbuilder+ mysql家政预约上门服务系统,源码交付,支持二次开发

基于java18多端展示 idea hbuilder mysql家政预约上门服务系统,源码交付,支持二次开发 家政预约上门系统是一种通过互联网或移动应用平台,为用户提供在线预约、下单、支付和评价家政服务的系统。该系统整合了家政服务资源,使用户能…

c++学生管理系统

想要实现的功能 1,可以增加学生的信息,包括(姓名,学号,c成绩,高数成绩,英语成绩) 2,可以删除学生信息 3,修改学生信息 4,显示所有学生信息 5&#xff0c…

图形学初识--多边形剪裁算法

文章目录 前言正文为什么需要多边形剪裁算法?前置知识二维直线直线方程:距离本质:点和直线距离关系: 三维平面平面方程距离本质:点和直线距离关系: Suntherland hodgman算法基本介绍基本思想二维举例问题描…

uni-app解决表格uni-table样式问题

一、如何让表格文字只显示一行,超出部分用省略号表示 步骤 : 给table设置table-layout:fixed; 列宽由表格宽度和列宽度设定。(默认是由单元格内容设定)让表格元素继承父元素宽度固定table-layout: inherit;overflow: hidden;超过…

Docker安装启动Mysql

1、安装Docker(省略) 网上教程很多 2、下载Mysql5.7版本 docker pull mysql:5.7 3、查看镜像是够下载成功 docker images 4、启动镜像,生成容器 docker run --name mysql5.7 -p 13306:3306 -e MYSQL_ROOT_PASSWORD123456 -d mysql:5.7 5…

我成功创建了一个Electron应用程序

1.创建electron项目命令: yarn create quick-start/electron electron-memo 2选择:√ Select a framework: vue √ Add TypeScript? ... No √ Add Electron updater plugin? ... Yes √ Enable Electron download mirror proxy? ... Yes 3.命令&a…