生成式人工智能时代:研究机构与工业机构的角色之争

939b828d42e6b6a6495019814f1727cf.png

来源:Illustration by IconScout Store from IconScout

作者:刘鹏飞

微软创始人比尔盖茨说人生中让他印象深刻的两次技术革命演示,一次是现在操作系统的先驱“图形用户界面”,另一个就是以ChatGPT为代表的生成式人工智能技术。

cd3810cbeb26093594de168df7027537.gif

一、生成式人工智能:技术革命新时代

什么是生成式人工智能?

生成式人工智能是指: 利用机器学习技术让计算机自动生成不同模态(比如文本,图片,语音等)高质量数据的方法。尽管过去几十年的人工智能研究迭代出了无数的生成模型,但生成式人工智能被当成一种新的算力来讨论还要从以GPT3为代表的大预训练语言模型算起。

利用生成式AI技术,人们往往可以通过自然语言交互方式生成高质量内容。比如,张三感染了新冠想写一封邮件给部门经理, 那么他只需要输入“我感染了新冠,请帮我写一封邮件告诉部门经理我今天不去上班了”,便可以得到如下一个还不错的邮件初稿

f2acfd27247950d35524b8bfd9c868ef.jpeg

生成式人工智能起草邮件

又比如,张三脑洞大开,想生成一副泰迪熊在时代广场玩滑板的图片,那么他只需要输入“生成一副泰迪熊在时代广场玩滑板的图片”,便可以得到如下图片:

1d979fed65cfc7cf5ce281835428d8f7.jpeg

生成式人工智能生成图片

生成式人工智能的技术基础?

生成式人工智能所涉及的技术非常综合且广泛,但就其核心文本生成而言,主要依赖于两个重要技术:

  • 生成式预训练(Generative Pre-training)

  • 提示学习(Prompting Method)

前者负责海量数据的向量化存储问题,后者则提供了一种可以通过自然语言描述对存储数据进行灵活读取的能力。这两种技术的结合,革新了人类对数据存储和读取方式的方式,也催生出了一种新的人机交互接口:自然语言接口(Natural Language Interface),其带来的蝴蝶效应体现在了各个方面。比如关于生成式人工智能,有如下有趣的类比:

052ec5ab6beaf20ba7588b3008529c93.jpeg

生成式人工智能的技术基础

  • 从计算平台角度看,生成式预训练模型可以被视为新一代通用计算机,而OpenAI则是这个通用计算平台之父,赋予了新一代计算机实现通用人工智能的使命;

  • 从计算力角度看,生成式计算(Generative Computing)是继云计算之后的又一种新的算力形式,将会像电、网络和云计算一样,成为人们生活中不可或缺的基础算力;

  • 从应用生态角度看,以ChatGPT为代表的生成式人工智能产品将成为互联网新的重要入口。生成式AI产品(比如:ChatGPT)独有的自然语言接口属性使得这个入口很容易建立一个具有超强包容性的生态系统(比如:ChatGPT Plugin);

  • 从人机交互角度看,以ChatGPT为代表的产品将成为人类大脑的延伸,提供更智能、高效、自然的与人交互的方式,同时还能通过工具的使用帮助人类更好地与世界互动。

不管做怎样的类比,我们都可以看到生成式人工智能都被放在一个空前的技术革命地位,它将会在多个领域为人类带来前所未有的颠覆性、革命性和史诗级的影响,大大提高社会生产力和人们的生活质量。

二、生成式人工智能带来的结构性变革

生成式人工智能的到来将在不同领域、不同方面带来结构性的变革,比如:

1. 个人层面:个人成长、教育和职业发展都需要在新环境下重新思考,学习新知识和工具、适应新环境等。网上有个很现实的说法:未来AI不会淘汰人类,但会淘汰不会使用AI的人,也许说法过于极端,但确实没有道理放着个可以延伸大脑的工具而不去使用;

2.组织层面:不管是学术研究机构、还是工业机构(尤其是互联网等科技公司),其内部组织结构,人员结构、合作方式等都可能需要结合新的形势进行调整与重构;比如,OpenAI 发布ChatGPT以来,国内很多巨头公司都对企业内部组织进行了重构,为的是更好地形成合力去研发新产力-生成式AI;在学术界,类似“复仇者联盟”有Laion, Together;创投界也有类似的组队。从这个层面来看,生成式AI,让大家走到了一起:)

3. 行业层面:数字化、信息化、智能化进程将会加速;行业的生产方式将会受到巨大冲击;

4. 社会层面:生成式人工智能将会对教育、医疗等行业带来颠覆性影响,人才分布也将会发生改变;政府需要帮助工人平滑地进行角色转变,以及通过合适的政策力量将新科技产力安全地、可靠地、公平地服务于每一个人。


三、研究机构和工业机构

在生成式 AI中的不同职能

在生成式人工智能所带来的这场产业革命中,我尤其关注研究机构和工业机构的不同职能,和应该扮演的角色。这里有这样一个关于研究者“存在危机”的小背景:

在生成式人工智能到来以后(尤其以ChatGPT,GPT4为典型),人们对于研究机构与工业机构应该扮演的角色感到困惑,主要是因为许多任务看似被解决了,这在学术界引发了关于研究方向的担忧(比如自然语言处理领域研究者会困惑于:自然语言处理这个研究领域还存在吗?)。于是人们也开始思考,学术界在当前形势下还应该研究什么课题,或者哪些课题更适合由学术界来研究。

然而,事实上,生成式人工智能技术仍然存在许多挑战和问题需要解决。只是这些挑战和问题可能不再像之前那么“现成”,需要在拥抱变化、使用体验新技术后被新定义出来,这就要求研究者对生成式AI的技术发展、能力边界、应用范围有更好的理解;

在众多类比中,我比较喜欢“生成式人工智能是人类大脑的延伸”这个设定。沿着这个角度,这里我也尝试给出以大预训练模型为核心的生成式AI的全景技术栈,并剖析每一部分所涉及到的研究或工程环节;

3f57fea983a3a472dfa2315c6dd29ad6.jpeg

生成式人工智能全景技术栈 (created by GAIR Lab)

(1) 需求挖掘

生成式AI催生成了连接人和AI的自然语言接口,而该接口的通用性取决于AI模型对人类需求了解的多少,不管是学术界还是工业界都可以在需求挖掘这件事情上贡献;

  • 如何建立数据飞轮,高效地收集用户的需求与反馈(垂直领域或通用领域)?

  • 如何基于大规模数据分析和自然语言处理技术,从用户生成的文本、社交媒体、搜索历史等数据中发现人类潜在的需求?(⭐)

  • 如何通过AI辅助进行需求收集?(⭐)

(2) 提示工程

  • 如何设计能够更好帮助用户挖掘有效“提示”的辅助系统或者软件?

  • 如何提供“提示”使用时候的鲁棒性?(⭐)

(3)系统安全

  • 如何防止用户进行恶意的“提示注入“(Prompt Injection)行为?(⭐)

  • 如何防止用户通过越狱使用AI做一些违反法律、道德的行为?(⭐)

(4) 用户接口

  • 如何设计AI-native 接口?

  • 如何设计AI-retrofit 接口?

(5) AI安全 &价值对齐(⭐)

  • 如何保证AI系统的输出是安全可靠的?

  • 如何保证AI不会输出有害、有毒的内容?

  • 如何确保AI系统的输出对齐我们所普遍认同的价值观?

  • 如何确保AI技术民主化,以及利用AI技术使教育、医疗资源公平化?

(6) LLMOps

  • 数据:如何收集高质量的预训练数据?精调数据?用户的反馈?(⭐)

  • 训练:如何进行有效的、稳定的

  • 预训练?

    • 精调?(⭐)

  • 推理(⭐):

    • 如何提升推理的速度?

    • 如何可控地解码出高质量的文本?

    • 如何理解并使用好in-context learning技术?

  • 部署:

    • 如何实现高效的、可规模化扩展的部署?

  • CI&CD:如何构造一个自动化的LLMOps?

(7)多模态学习

  • 如何提高生成式AI对图片、语音、视频的理解能力,并且可以和文本统一到同一语义空间(⭐)

  • 如何提高图片、语音、视频在自然语言接口下的生成能力(⭐)

(8) 环境交互

  • 如何提高生成式AI的工具使用能力?(⭐)

  • 如何标准化生成式AI使用工具的API?

  • 如何为生成式AI开发适配的外部工具?

  • 如何链接生成式AI和机器人?(⭐)

“⭐” 所标注的项目都是学术界可以尝试去探索、解决的(由于笔者时间有限,以上只是初步的枚举,未来有机会再详细展开。当然有感兴趣的朋友们也欢迎一起讨论:)

总之,生成式人工智能时代,研究机构可以研究的问题并没有减少,更多的只是内容上的更新,这也就要求学者敢于定义新任务,新场景,并提出可能的解决方案;比如:如何确保生成式人工智能技术的应用不会被滥用或者侵犯人们的隐私和安全?如何促进生成式人工智能技术的公正和可持续发展?在这方面,学术界具有得天独厚的优势。学术界可以利用其自由和开放的环境,推动最新的研究和探索,不断挑战和创新。此外,学术界也可以跨越不同领域和学科的边界,汇聚最新的想法和思路,为生成式人工智能技术的发展提供更广阔的视野和更深入的思考。

我非常喜欢约翰霍普金斯大学Mark Dredze教授在类似的讨论话题下对学生们的建议:

我的建议是总是选择一个主题来研究,这个主题具备以下两个特点:1)你认为没有其他人会解决它。2)你在这个主题上有独特的贡献能力。”

同时Mark Dredze教授还具体分享了几个在他看来有价值的方向,这里摘抄分享下:

(1)自然语言处理在其他领域的应用:多年来,各行各业的人们一直在向我们寻求NLP工具,以帮助他们进行研究和解决问题。我们现在有了更好的工具。如何帮助他们使用这些工具?

(2)低资源领域或语言:扩展语言模型可以解决很多问题。并不是每个任务或领域都有足够的数据。这些领域的解决方案是什么?他们会被遗弃吗?对于特定的任务,有很多工作要做监督学习。考虑到任务的规模、成本和准确性等因素,使用GPT-N来解决每个NLP任务的想法是不可行的。

(3)评估:我们需要评估的帮助!我们正在触及目前评估方法的极限,没有好的方法,进步就无法继续。

(4)创造性的新应用:近年来,我被我们现在使用NLP系统的多样性和创造性所震撼。请再来点。

Mark教授很多观点,我都非常认同+共鸣:

1. 诚然,每个人都有自己独特的能力,如果能把它和当前发展中遇到的瓶颈问题连接好,你便能做出非凡的工作,无论是在学术界还是工业界。

2. 在过去的一年多中,我也和CMU Graham Neubig教授联合创立了专门面向生成式AI评估的公司,致力于让大模型更安全可靠地服务于人。我们几乎把所有关于自然语言处理任务的评估技术都挖尽了,感受就是目前评估方法相对模型本身的快速发展是严重落后的。这导致很多时候我们可能在一条错误的路子上不断优化,或者满足于部分的优良结果而忽视全面认识,最终错过了技术突破与创新的时机;

3. 记得我也曾和Graham教授针对"GPT4出来后,自然语言处理学者还能做什么的"的问题进行过一些讨论,他很认真的说道:

”我们这个世界上还有很多问题没有解决,比如“全球变暖”,”癌症治疗“,“教育公平”,想到我们的新工具可以帮助我们开始解决这些问题,我真的很兴奋。但显然,我们有很多工作要做,这需要新的工具和对现有工具的创造性使用;而当我们发现这些实用工具的局限性时,便找到了一个有价值的研究方向。

你会发现,Graham很多观点和Mark教授也高度吻合;这也让我非常想引出纽约大学教授Sam Bowman的一个建议:

“探索我们可能用这项技术做的有价值的事情!特别是如果你的目标是更长远的未来,或者专注于科学,你可以做很多这波创业公司无法做的事情。”

我想,长期主义+有责任感 会是帮你克服"存在危机"的关键;

当然,也分享这样一个“利好”:

OpenAI 做了很多伟大的事情:

  • 他们创造了自然语言接口,创造了新的生产力

  • 他们不断探索技术边界,有可能带我们走向通用人工智能

他们还让学术界和工业界的优化目标更加一致,通过 ”对齐研究”(Alignment Research),让研究者在考虑问题的时候更有“用户需求”意识,这也使我们的技术发展可以更有效地沿着推动生产力发展的方向前进。

0120c7952f8aaf7b701ef46a2126eb79.jpeg

生成式AI对学术界、工业界的影响

因此,学术界应该继续研究和探索生成式人工智能技术的各个方面,包括技术本身的发展和应用,以及伦理和社会问题的解决。同时,学术界也需要与工业界和政府合作,共同推进该技术的发展和应用,确保其能够为人类带来更多的益处和福祉。

 // 

 国内首个面向生成式人工智能的实验室:GAIR

最后,这里要分享的是:我也即将回国,任职于上海交大,创建:

生成式人工智能研究实验室 (GAIR: Generative AI Research Lab)

实验室将致力于创造前沿的生成人工智能技术,使人类能够解决复杂问题,提高世界各地人们的生活质量。具体地说:

  • 基础研究: 我们致力于开展关于生成式AI的基础研究,促进生成式人工智能技术的透明度和可解释性。

  • AI系统: 通过利用尖端的机器学习、自然语言处理等,我们的目标是创建能够产生负责的、符合人类价值观的人工智能系统,同时尊重用户的不同观点。

  • 社会影响: 我们将与学术界、业界、社区伙伴、政府和普通用户密切合作,确保我们的工作对社会产生积极的影响。

实验室在以上提到的多个生成式AI方向上都有布局,同时也获得了国内多家企业、研究机构的支持,每年也会有和CMU的固定学术合作项目,欢迎感兴趣的学生、朋友们来合作一起做些推动领域&社会发展的事情。

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)大脑研究计划,构建互联网(城市)大脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

cedff307c1663fb55c5c497d18d93f48.jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/57805.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

chatgpt赋能python:Python有什么好玩的项目

Python 有什么好玩的项目 Python 是一种多用途的编程语言,被广泛应用于网站开发、数据分析、机器学习以及科学计算等领域。但是除了这些实用的场景,Python 也有很多有趣的项目。在这篇文章中,我将介绍几个有趣的 Python 项目,带你…

用 AI 生成漂亮小姐姐(一)——Stable Diffusion 小白搭建教程

最近 AIGC、ChatGPT 等话题持续发酵,热门程度不亚于之前的 “元宇宙”。抖音、小红书到处都是机器对话、AI 绘图的视频。我看见别人生成的漂亮小姐姐图片眼馋得不行,终于按捺不住自己的好奇心,也尝试一下搭建。本文只是简单记录一下搭建过程。 △ 别人生成的漂亮小姐姐 我使…

如何用 GPT-4 帮你写游戏(以24点游戏举例)

目录 给我一个24点游戏 游戏规则 GPT给的代码 ​改进 再改进 最近呢掀起了一阵GPT-4的热潮,很多人都想用GPT-4,这里呢我就打一个广告(嘿嘿),如果不知道国内如何使用GPT的,可以看看这个博客:G…

发送Email、接收Email

邮件软件称为MUA:Mail User Agent,意思是给用户服务的邮件代理; 邮件服务器则称为MTA:Mail Transfer Agent,意思是邮件中转的代理; 最终到达的邮件服务器称为MDA:Mail Delivery Agent&#xff0…

Android studio通过lame生成把pcm转成MP3的so库以及音频的录制和播放附源码

1.先新建C项目 2. 在cpp目录下创建目录map3lame(名字随便起) ,接下来要用到 3.下载lame 地址lame 最新版本是3.100,解压完成后如下图 把libmp3lame目录中的所有.c和.h文件(注意其他类型的文件和目录不需要)都复制到项目中新建的map3lame目录中&#xff…

香港金曲奖分析(1983-2017 by SIRMAN)

以前的金曲奖就是华语音乐的代表,特别是80、90年代,谭张争霸,四大天王等,虽然近来影响力已不如之前,但让我们来看看1983-2017的获奖名单。数据来源于百度百科“十大劲歌金曲颁奖典礼”,由于名单较多&#x…

Android中Pcm文件转换为Mp3

刚完成了一个pcm转成mp3的小工作,记录下自己解决这个问题的过程,以便以后可以参考。pcm转换mp3首选的就是lame这个开源框架,下载地址lame,下载完成后需要ndk编译lame。安卓ndk环境配置可以百度。下面记录下ndk编译lame的过程 首先…

NCM转MP3神奇的网页

由于毕业演出需要,下了QQ音乐上的一首需要会员的歌,发现是NCM格式,没有办法打开,于是在网上找方法,然后就发现了这个好方便的网页,直接线上转格式!赶紧记下来,以备下次用&#xff01…

使用Lame库实现wav、pcm转mp3

文章目录 前言 一、Lame库是什么? 二、使用步骤 0.创建native项目 1.下载Lame库 2.pcm转MP3 3.wav转MP3 4、native方法如下 三、注意 总结 前言 因为使用android录音后生成的文件是wav或者pcm格式,项目要求最后的文件需要是mp3格式,于…

Android集成LAME库,实现pcm转mp3

一、交叉编译LAME库 LAME是一种非常优秀的MP3编码引擎,在业界,转码成MP3格式的音频文件时,最常用的编码器就是LAME库。 1. 下载LAME库源码 https://sourceforge.net/projects/lame/files/lame/ 进入LAME官网下载LAME源码,我选择…

[opcv图像处理] C/C|++将图片转换为马赛克效果

这个程序将图片转换为马赛克效果。 算法原理:求出每个小方块内所有像素的颜色平均值,然后用来设置为该小方块的颜色。依次处理每个小方块,即可实现马赛克效果。 完整代码如下: / // 程序名称:将图片转换为马赛克效果…

从入门到入土:Python实现爬取网易云歌词|评论生成词云图

写在前面: 此博客仅用于记录个人学习进度,学识浅薄,若有错误观点欢迎评论区指出。欢迎各位前来交流。(部分材料来源网络,若有侵权,立即删除) Python实现爬取网易云歌词|评论生成词云图 免责声明…

用python写一个爬取周杰伦所有歌词的爬虫

写一个爬虫爬一下周董的所有歌词看看这么多年他为啥这么火 唱的都是什么主题的歌可以这么经久不衰,他凭啥被称为流行歌曲天王。废话不多说 直接上代码 今天比较晚了 之后再慢慢完善讲解。代码比较low因为是编自学边完成的,所以只是实现了基本的功能&…

buuoj 来首歌吧 writeup

题目(二十三): 【题型】Misc 【题目】来首歌吧 【来源】(buuoj)https://buuoj.cn/challenges#%E6%9D%A5%E9%A6%96%E6%AD%8C%E5%90%A7 【思路】通过音频的节奏得出摩斯密码,得到flag。 【具体步骤】 Step1&a…

chatgpt赋能python:Python打折代码:为你的电商网站提供更便捷的价格管理工具

Python打折代码:为你的电商网站提供更便捷的价格管理工具 在当前这个竞争激烈的市场,随时提供大量的优惠促销活动是吸引消费者注意力和提高销售额的必要手段之一。而电商网站在进行促销活动时,一个鲜为人知的秘密是——打折代码。打折代码作…

利用Python实现有道翻译的功能

这是上学期在Python课堂上老师讲的利用Python实现有道翻译的功能。 流程如下:网址:有道翻译 输入翻译名称,按F12对网页进行分析,通过查询到translate开头的连接中我们找到了翻译的数据参数 首先将参数以urlencode编码的方式传入到…

中英文自动翻译(有道翻译、彩云小译)

一.有道翻译 1)获取应用ID 和 应用密钥 https://ai.youdao.com/doc.s#guide 2)遵循接口参数接入 具体参考接口文档:https://ai.youdao.com/DOCSIRMA/html/%E8%87%AA%E7%84%B6%E8%AF%AD%E8%A8%80%E7%BF%BB%E8%AF%91/API%E6%96%87%E6%A1%A3/…

Unity 接入有道智云AI - 文本翻译

接入接口前首先需要申请应用ID和应用秘钥,登录有道智云AI开放平台,创建应用,获取应用ID和秘钥。 定义接口响应类数据结构,接口实际返回内容和官方文档有点出入,大概是文档未更新吧。 以下是官方文档给出的说明&#x…

【Python爬虫】有道翻译新旧API接口

🌈据说,看我文章时 关注、点赞、收藏 的 帅哥美女们 心情都会不自觉的好起来。 前言: 🧡作者简介:大家好我是 user_from_future ,意思是 “ 来自未来的用户 ” ,寓意着未来的自己一定很棒~ ✨个…

Translate插件的有道翻译

在plugins下载Translate插件 setting-> Tools->Translation 没有id和密钥就申请注册 登录后 创建应用 创建成功后输入id和密钥 点击鼠标右键即可使用 翻译效果 over