生成式AI年度观察 | 技术及产品快速迭代,生成内容质量及安全性仍需提升

原文链接:

https://mp.weixin.qq.com/s/ED9mo5pxuDdyZmrFe-u7qw

一、2022年生成式AI发展观察

1.扩散模型和ChatGPT能力出众,多种生成模态涌现

扩散模型Diffusion(以下简称“扩散模型”)和神经网络模型CLIP结合,文生图实现质变。扩散模型能够缩短训练时长、使图像生成更具多样性,具备保留数据语义结构的能力。神经网络模型CLIP可匹配图像和文本,与扩散模型结合可加快文本生成图片速度。近一年来,扩散模型成为研究热潮,在人工智能顶级会议ICLR 2023中,“Diffusion Model”在论文题目关键词频率排名从去年的第159名上升到14名[1]

图1:ICLR2023投稿论文关键词Top10排名,图片来自网络

大规模预训练语言模型ChatGPT(后文简称“ChatGPT”)发布,内容生成能力强大。ChatGPT由OpenAI于2022年12月发布,一经推出引起业界普遍关注。部分观点认为ChatGPT能够颠覆搜索行业,在智能客服、游戏、虚拟人等领域也将得到广泛应用。ChatGPT具备强大的对话能力和生成能力,由大规模预训练语言模型GPT-3.5微调得来,在理解能力、结果准确性、识别非法与偏见能力上均能取得更优效果。

生成模态不断更新,呈现多元化格局。按照生成模态划分,生成式AI产品分为文本生成、图片生成、代码生成和音频生成多个方向。随着技术的不断发展,生成模态种类不断扩展。2022年9月Meta发布自研视频生成大模型Make-A-Video;2022年11月,NVIDIA公司发布了3D模型生成工具Magic3D;同月WebAR软件平台解决方案商Geenee AR发布了AI WebAR内容创造套件RT3D AI SDK。

2.国内外产品各具特色,交互体验不断升级

国内生成式AI产品以语言生成类和视觉生成类为主,其他应用类型处于探索阶段。文本生成类产品如百度的“文心ERNIE3.0”和澜舟科技的“AIGC文本生成引擎”等,可实现小说诗歌创作、新闻内容生成、商业文案生成。图片生成类应用如百度的“文心一格”,其创作出的作品效果接近人类作品。代码生成产品如硅心科技的“aiXcoder”可实现代码自动补全、相似代码搜索、错误自动定位。音频生成产品如网易的“天音”可实现自动编曲。同时,国内部分企业也陆续推出新工具和平台,可生成数字内容、合成数据等。华为云推出数字内容生产线MetaStudio,该平台具备3D模型制作、云渲染等能力,可用于虚拟直播、虚拟视频内容制作。中国移动研究院、北京宽客进化公司实现了GAN生成NFV相关合成数据技术,并逐步探索结构化数据生成技术的落地路径。

国外生成式AI产品应用方向多样,现象级产品迅速获取大量用户。根据知名创业组织Antler的统计,截止2022年年底,海外生成式AI产品数量达到190余个[2],包括视频、音频、游戏、数据、搜索等多种类型应用。同时,2022年年底图片生成应用Midjourney官方Discord中的关注人数超过百万,ChatGPT上线后一周内用户数量已近百万。

生成式AI产品在交互设计中,更注重用户体验。目前生成式AI产品形态包含插件、API网页交互、客户端等。其中,API网页交互无需下载安装产品,在云端即可获得生成内容,如用户可在百度的“文心ERNIE 3.0”产品网页中输入提示词生成内容。同时,生成式AI技术与搜索产品融合后,匹配内容、意图理解表现更好。例如,用户使用论文阅读助手SciSpace时,无需指定关键词即可搜索和查找相关论文,可提升阅读论文效率。

3.应用场景逐渐扩展,痛点短板亟需解决

文本生成类应用在生成可控性、准确率等方面仍表现不足。文本生成类应用仍存在生成内容准确率低、可控性低等问题。例如,著名技术交流论坛Stack Overflow曾临时禁止ChatGPT回答编程问题。图片生成类应用则存在作品版权争议较大、生成内容细节不足等问题。AI创作时会大量借鉴绘画、漫画名作,其生成内容与原作风格相似度较高,版权界定尚不清晰。例如著名艺术家网站ArtStation已有艺术家呼吁删除站内所有AI绘画作品。同时,AI作品在细节表现上仍存在不足,例如某些图片生成的应用中,生成内容将动物和物品、真实和卡通混淆。

二、中国信通院生成式AI方向工作有序开展

1.组织ChatGPT生成能力评测,开发域创作表现较好,约束条件下仍有不足

2022年12月初,为便于产学研各方快速了解ChatGPT内容生成能力,中国信通院对ChatGPT展开评测,从技术能力和产品能力两个关键模块切入。技术能力选取创意写作、命题写作、摘要生成和代码生成四大任务类型,以数据集测试的方式评测ChatGPT的可接受率。产品评测关注用户体验,邀请评分人员对生成内容的可读性、主观性等方面打分。测评结果显示,ChatGPT在创意写作等开放域内容创作表现较好,而面对约束条件如摘要生成、代码纠错时生成能力仍有限。关于本次评测的更多详情,可访问文章:

可信AI评测观察:ChatGPT生成能力|开放域内容创作表现较好,但在约束条件下生成能力仍有不足

图2:ChatGPT生成能力评测成果

2.生成式AI标准编制工作稳步推进,预计今年3月发布

近年来,生成式AI行业发展迅速,覆盖数据模态不断扩展,生成内容愈发具有创造力、多元化。另一方面,部分生成式AI应用的产品能力仍存在不足,数据合规性、安全性也需进一步规范。中国信通院与联盟高度重视生成式AI技术及发展走向,于2022年11月启动生成式AI标准编制工作。来自学术界、产业界的50余家单位积极报名参与标准编制。

图3:生成式AI标准报名参编单位一览

生成式AI标准体系初步形成,标准编制工作正在进行。生成式AI标准分为技术能力和产品能力两部分,全面评测产品的技术能力和产品水准。技术能力部分按照生成模态划分,通过主观评价和客观评价两大维度全面评测生成式AI产品的技术水平。产品能力重点关注生成式AI产品的服务能力、可信能力和综合能力。其中服务能力关注产品功能、用户交互和付费模式等指标;可信能力中加入隐私保护、生成数据合规性、安全性等指标;综合能力关注多行业适配性、多样性等指标。

图4:生成式AI标准框架

3.生成式AI标准研讨会、技术沙龙活动持续开展

12月14日,生成式AI首期技术沙龙暨标准研讨会成功举办,来自天津大学、百度、网易、澜舟科技的企业专家围绕生成式AI与隐私保护、大规模预训练模型等主题进行了分享,业内专家共话生成式AI核心技术与发展趋势。12月22日,生成式AI标准第二次交流研讨会举办,会上针对标准框架进行了详细讨论并正式启动标准编制工作。

图5:生成式首期AI技术沙龙

原文链接:

https://mp.weixin.qq.com/s/ED9mo5pxuDdyZmrFe-u7qw

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/31177.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

可信AI年度观察 | 生成式AI技术及产品快速迭代,生成内容质量及安全性仍需提升

自2021年起,生成式人工智能(以下简称“生成式AI”)连续两年入选Gartner《Hype Cycle for Artificial Intelligence》,被认为是未来重要的AI技术趋势。2022年以来,生成式AI产品不断涌现,生成内容模态多样&am…

孙燕姿谈“AI孙燕姿”:她的反应让人意外,深入体验揭示其背后的真相与潜力!

目录 前言AI歌手简介AI歌手的技术原理孙燕姿对“AI孙燕姿”的看法结论个人感受一、你听过AI歌手的音乐呈现吗?作为听众你的感受如何?二、你认为这种新型演艺模式能否获得广泛的市场认可?原因是什么?三、你认为AI歌手会取代流行歌手…

吞噬还是撬动?开发者如何应对大模型风暴?

责编 | 禾木木 出品 | CSDN(ID:CSDNnews) ChatGPT 的出现几乎改变了 AI 的风向,各方大佬都丝毫不吝惜溢美之词,比尔盖茨说这种人工智能技术出现的重大意义,不亚于互联网和个人电脑的诞生;英伟达…

《花雕学AI》ChatGPT跟人类的思考方式有什么不同?

一、ChatGPT是一个基于GPT-3.5的对话语言模型,它可以根据用户的输入生成多轮对话,也可以生成文本、代码、音乐等内容。ChatGPT的思考方式是利用大量的数据和强大的算力来学习语言的联合概率分布,从而能够根据上下文和目标生成合理和有趣的回复…

跟着ChatGPT学PsychoPy编程1:绘制一个随按键而变化的进度条

让GPT帮忙绘制一个随按键而发生的进度条(说的越详细越好): from psychopy import visual, event, core # 创建窗口 win visual.Window(size(800, 600), fullscrTrue) #True表示全屏 # 创建矩形框 rect visual.Rect(win, width0.1, height0.…

抖音服务器带宽有多大,才能供上亿人同时刷?

字节跳动有多少台服务器?字节跳动大型的数据中心出口带宽是多少? 最近看到一个有意思的提问:抖音服务器带宽有多大,为什么能够供那么多人同时刷?今天来给大家科普一下。 图片来自 Pexels 抖音,百度&#xf…

月报总结|Moonbeam 5月份大事一览

本月,Moonbeam迎来了Uniswap V3的部署,经过一年的社区讨论,UniSwap V3终于以5000万个同意票通过,将在未来一个月内部署于Moonbeam,为Web3用户提供更广泛公链生态的多链体验,加速应用之间跨链交互&#xff0…

月报总结|Moonbeam 4月份大事一览

本月,Moonbeam生态扶持进入下一里程碑!探索更多优质的早期Web3项目,Moonbeam Accelerator Program已公布进入最终加速孵化阶段的10家初创公司,这些幸运项目将在未来3个月接受顶级孵化公司和专业投资机构的培训,于下半年…

惊人的算力成本背后,自动驾驶公司如何加速研发创新

【摘要】AI算法模型的开发,测试和训练是自动驾驶公司最重要的工作之一,它们都需要大量GPU算力来支撑。然而,“一人一卡”的简单独占式GPU分配方式会导致GPU分配率高但实际利用率低,造成大量算力的浪费。基于远程GPU的GPU池化技术能…

Flutter 中使用 OpenAI GPT-3 进行语义化处理

Flutter 中使用 OpenAI GPT-3 进行语义化处理 视频 https://www.bilibili.com/video/BV1AA411X7o3/ 前言 最近 openai 的 ChatGPT 火了,然后我也想着用它来做点什么,于是就写了个 调用 openai api 语言执行工具,跑个测试,以后再有…

谷歌云|机密 GKE 节点可在计算优化的 C2D 虚拟机上使用

机密 GKE 节点可用于计算优化的 C2D 虚拟机。 许多公司已采用 Google Kubernetes Engine (GKE) 作为其应用程序基础架构中的关键组件。在某些情况下,使用容器和 Kubernetes 的优势可以超越传统架构,但迁移到云端并在云端运行应用程序通常需要战略规划以降…

【打卡-Coggle竞赛学习2023年3月】对话意图识别

学习链接: https://coggle.club/blog/30days-of-ml-202303 ## Part1 内容介绍 本月竞赛学习将以对话意图识别展开,意图识别是指分析用户的核心需求,错误的识别几乎可以确定找不到能满足用户需求的内容,导致产生非常差的用户体验…

魔法咒语

魔法咒语 题目描述 Chandra 是一个魔法天才。从一岁时接受火之教会洗礼之后, Chandra 就显示出对火元素无与伦比的亲和力,轻而易举地学会种种晦涩难解的法术。这也多亏 Chandra 有着常人难以企及的语言天赋,让她能轻松流利地说出咒语中那些极…

网络舆情监测系统TOOM

在当今社会网络信息纷繁错杂,一条小小的舆情信息很可能引发异常舆情风暴,导致严重的舆情危机,而网络舆情监测系统能,更好地全面监测网络信息,未雨绸缪,精准把控,及时发现及时处理,为…

讯飞星火大模型V1.5发布 刘庆峰:我们要追赶OpenAI

雷递网 乐天 6月9日 讯飞星火认知大模型V1.5今日正式发布。讯飞称,时隔一月,星火大模型不仅各项能力获得持续提升,且在综合能力上实现三大升级:开放式知识问答取得突破,多轮对话、逻辑和数学能力再升级。星火APP同步发…

英伟达把GPT-4塞进我的世界,打游戏快15倍:AI大佬沉默了

深度学习自然语言处理 分享来自:机器之心 游戏行业可能要变天? 通用 AI 大模型 GPT-4 进游戏了,进的是开放世界,而且玩出了高水平。 昨天,英伟达发布的 VOYAGER 给 AI 圈内带来了一点小小的震撼。 VOYAGER 是第一个大模…

英伟达将GPT-4接入我的世界,无需人类插手,打游戏快15倍!

夕小瑶科技说 分享 来源 | 机器之心 游戏行业可能要变天? 通用 AI 大模型 GPT-4 进游戏了,进的是开放世界,而且玩出了高水平。 昨天,英伟达发布的 VOYAGER 给 AI 圈内带来了一点小小的震撼。 VOYAGER 是第一个大模型驱动&#…

AI前沿速报0427:多领域的AI技术突破

​ 人工智能(AI)技术不断创新,引领全球各行各业的变革。本期速报为您带来了近期AI领域的一些重要发展: 【一、AI在时尚产业的应用】 AI技术在时尚产业的应用方面取得显著进展,如趋势预测、产品设计、个性化推荐以及减…

英伟达把GPT-4塞进我的世界,打游戏快15倍!AI大佬沉默了...

点击下方卡片,关注“CVer”公众号 AI/CV重磅干货,第一时间送达 点击进入—>【Transformer】微信交流群 转载自:机器之心 游戏行业可能要变天? 通用 AI 大模型 GPT-4 进游戏了,进的是开放世界,而且玩出了…

chatgpt赋能python:**介绍**

介绍 炒股是一个受到全球人民广泛争议的话题。它可以提供巨大的回报,但同时也存在风险。Python的出现为炒股爱好者们提供了一个新的利器。Python是一种易于编写、易于阅读和易于学习的高级编程语言,它被广泛应用于各种各样的领域。在股票市场上&#xf…