ChatGPT等AIGC如何移动边缘部署?南洋理工最新《 在移动网络中释放边云生成AI的力量:AIGC服务》综述其技术体系...

9a2a6953c5113b4a10e6e32025f62ca8.png

人工智能生成内容(AIGC)是一种使用人工智能算法创造性地生成、操作和修改有价值和多样化数据的自动化方法。本文重点研究了ChatGPT和Dall-E等AIGC应用在移动边缘网络(mobile AIGC networks)中的部署,这些应用在维护用户隐私的同时,提供个性化和定制化的实时AIGC服务。首先介绍了生成模型的背景和基本原理以及移动AIGC网络的AIGC服务的生命周期,其中包括数据收集、训练、微调、推理和产品管理。然后,讨论了支持AIGC服务并使用户能够在移动边缘网络访问AIGC所需的云边-移动协同基础设施和技术。探索了AIGC驱动的移动AIGC网络的创意应用和用例。此外,还讨论了部署移动AIGC网络所面临的实现、安全和隐私方面的挑战。最后,指出了完全实现移动AIGC网络的未来研究方向和开放问题。

https://www.zhuanzhi.ai/paper/4db7f7a43d99cc11e86982637091dba0

1. 引言

221e4659bc965f8a1adc687216dd6da8.png

图1移动AIGC网络概述,包括云层、边缘层、D2D移动层。AIGC服务的生命周期,包括数据收集、预训练、微调、推理和产品管理,在核心网络和边缘网络之间循环。

近年来,人工智能生成内容(artificial intelligence-generated content, AIGC)已成为一种生产、操作和修改数据的新方法。通过利用AI技术,AIGC将内容生成与传统的专业生成内容(PGC)和用户生成内容(UGC)[1] -[3]一起自动化。随着数据创建的边际成本降低到几乎为零,AIGC(例如ChatGPT)有望为人工智能发展和数字经济提供大量合成数据,为社会提供显著的生产力和经济价值。人工智能技术的不断进步,特别是在大规模和多模态模型[4],[5]领域,推动了AIGC能力的快速增长。这一进展的一个主要例子是DALL-E[6]的开发,这是一个基于OpenAI最先进的GPT-3语言模型的人工智能系统,由1750亿个参数组成,旨在通过预测连续的像素来生成图像。在其最新迭代DALL-E2[7]中,采用扩散模型来减少训练过程中产生的噪声,从而生成更精细和新颖的图像。在使用AIGC模型生成文本到图像的背景下,语言模型起着指导作用,增强了输入提示和结果图像之间的语义一致性。同时,AIGC模型处理现有的图像属性和组件,从现有数据集生成无限的合成图像。

基于具有数十亿个参数的大规模预训练模型,AIGC服务旨在增强知识和创造性工作领域,这些领域雇用了数十亿人。通过利用生成式人工智能,这些领域可以实现至少10%的内容创造效率提高,可能产生数万亿美元的经济价值。AIGC可以应用于各种形式的文本生成,从实际应用(如客户服务查询和消息)到创造性任务(如活动跟踪和营销文案[9])。例如,OpenAI的ChatGPT[10]可以根据用户提供的提示自动生成有社会价值的内容。通过与ChatGPT进行广泛而连贯的对话,来自各行各业的人可以在调试代码、发现健康食谱、编写脚本和设计营销活动方面寻求帮助。在图像生成领域,AIGC模型可以根据现有图像的属性和成分处理现有图像,实现端到端的图像合成,如直接从现有的[7]图像生成完整的图像。此外,AIGC模型在跨模态生成方面具有巨大的潜力,因为它们可以在空间上处理现有的视频属性,并同时自动处理多个视频片段[11]。

与PGC和UGC相比,AIGC在内容创造方面的优势已经显而易见。具体来说,生成式AI模型可以在几秒钟内产生高质量的内容,并提供为用户需求量身定制的个性化内容[2]。随着时间的推移,AIGC的性能得到了显著提高,这是由增强的模型、增加的数据可用性和更大的计算能力[12]驱动的。一方面,先进的模型[4],如扩散模型,为跨模态AIGC生成提供了更强大的工具。这些进展归功于生成式人工智能模型的基础性研究,以及生成式深度神经网络(DNN)中学习范式和网络结构的不断细化。另一方面,随着网络日益互联,用于生成式人工智能训练和推理的数据和计算能力变得更加容易获得[9],[13]。例如,需要数千个GPU的AIGC模型可以在云数据中心进行训练和执行,使用户能够通过核心网络提交频繁的数据生成请求。

尽管AIGC具有革新现有生产流程的潜力,但在移动设备上访问AIGC服务的用户目前缺乏对交互式和资源密集型数据生成服务[14],[25]的支持。首先,可以利用云数据中心强大的计算能力训练AIGC预训练模型,如用于ChatGPT的GPT-3和用于ChatGPT Plus的GPT-4。用户通过在云服务器上执行AIGC模型,通过核心网络访问基于云的AIGC服务。然而,由于其远程特性,云服务具有较高的延迟。因此,在移动边缘网络,即图1所示的移动AIGC网络上部署交互密集型的AIGC业务,应该是一个更实际的选择[26]-[28]。具体而言,开发移动AIGC网络的动机包括

    • 低延迟:用户可以访问移动AIGC网络[29]中的低延迟服务,而不是将AIGC服务请求定向到核心网内的云服务器。例如,用户可以通过将预训练模型下载到边缘服务器和移动设备进行微调和推理,直接在无线接入网络(RANs)中获得AIGC服务,从而支持实时、交互式的AIGC。

    • 本地化和移动性:在移动AIGC网络中,在网络边缘设有计算服务器的基站可以通过本地化服务请求[30]、[31]来微调预训练模型。此外,用户的位置可以作为AIGC微调和推理的输入,解决特定的地理需求。此外,用户移动性可以集成到AIGC服务提供过程中,实现动态、可靠的AIGC服务提供。

    • 自定义和个性化:本地边缘服务器可以适应本地用户需求,允许用户根据自己的偏好请求个性化服务,同时根据本地服务环境提供定制化服务。一方面,边缘服务器通过对AIGC服务[2]进行相应微调,可以根据本地用户群体的需求定制AIGC服务;另一方面,用户可以通过指定偏好向边缘服务器请求个性化服务。

    • 隐私和安全:AIGC用户只需要向边缘服务器提交服务请求,而不需要将偏好发送到核心网络内的云服务器。因此,AIGC用户的隐私和安全可以在AIGC服务的提供过程中得到保护,包括服务的微调和推断。

如图1所示,当用户通过边缘服务器和移动设备在移动边缘网络上访问AIGC服务时,有限的计算、通信和存储资源为交付交互式和资源密集型的AIGC服务带来了挑战。首先,边缘服务器上的资源分配必须权衡边缘服务器AIGC服务的准确性、延迟和能耗。此外,计算密集型的AIGC任务可以从移动设备卸载到边缘服务器,提高推理延迟和服务可靠性。此外,生成内容的AI模型可以被缓存在边缘网络中,类似于内容分发网络(CDN)[32],[33],以减少访问模型的延迟。最后,探索移动性管理和激励机制,在空间和时间上鼓励用户参与。与传统人工智能相比,AIGC技术需要算法的整体技术成熟度、透明性、鲁棒性、公正性和洞察力,才能有效地应用于实际。从可持续性的角度来看,AIGC可以使用现有的和合成的数据集作为生成新数据的原材料。然而,当有偏数据被用作原始数据时,这些偏差会持续存在于模型的知识中,这不可避免地导致算法的结果不公平。最后,静态AIGC模型主要依赖模板来生成机器生成的内容,这些内容可能具有类似的文本和输出结构。

50a56fb14abda11359bb6cd1296c4fec.jpeg

本文概述了与AIGC和移动边缘智能相关的研究活动,如图2所示。鉴于人们对AIGC的兴趣日益增加,最近发表了一些相关主题的调研报告。表一列出了这些调查与本文的比较。

[34]中的研究提供了研究人员和行业发表的当前AIGC模型的全面概述。作者确定了9个类别,总结了生成式人工智能模型的演变,包括文本到文本、文本到图像、文本到音频、文本到视频、文本到3D、文本到代码、文本到科学、图像到文本和其他模型。此外,他们揭示,只有6个具有巨大计算能力和高技能和经验丰富的团队可以部署这些最先进的模型,这甚至比类别的数量还要少。按照[34]中开发的生成式AI模型的分类法,其他调研随后详细讨论了生成式AI模型。在[9]中的研究检查了现有的生成文本和检测模型的方法。[18]的研究提供了多模态图像合成和处理的主要方法、数据集和评估指标的全面概述。[24]的研究基于语音和图像合成技术,总结了现有的基于深度生成模型的同步语音手势生成工作。在[16]上的研究探讨了与人工智能生成音乐相关的版权法,其中包括人工智能工具、开发者、用户和公共领域之间的复杂交互。[4]中的研究为高级生成模型提供了全面的指导和比较,包括GAN、基于能量的模型、变分自编码器(VAE)、自回归模型、基于流的模型和扩散模型。随着扩散模型在产生创造性数据方面受到广泛关注,对[21]的研究给出了扩散模型的基本算法和全面分类。基于这些算法,作者[1]从艺术分析人工智能和艺术创作人工智能两个角度阐述了艺术与人工智能的互动。此外,作者还在[2]中讨论了在元宇宙中应用计算艺术来创建超现实的网络空间。

874898154cdc536587ca27b3185fa5fe.png

图3:本次调研的大纲,介绍了移动边缘网络的AIGC服务提供,并强调了移动边缘网络在提供AIGC服务方面的一些基本实现挑战。

在6G[19]中,针对智能移动网络,引入了基于边缘计算系统的移动边缘智能,包括边缘缓存、边缘计算和边缘智能。[17]研究探讨了分布式学习在无线网络中的部署。研究[15]为联邦学习提供了指南,并对在移动边缘网络中实现联邦学习(FL)进行了全面概述。作者详细分析了实现FL所面临的挑战,包括通信成本、资源分配、隐私和安全。在[12]中,详细介绍了边缘智能和智能边缘的各种应用场景和技术。此外,[20]研究还讨论了6G无线网络低功耗、低延迟、可靠可信边缘智能的前景和潜力。[22]研究探索了区块链技术如何用于实现边缘智能,以及边缘智能如何支持区块链在移动边缘网络的部署。对区块链驱动的边缘智能、边缘智能友好的区块链及其在移动边缘网络中的实现进行了全面的综述。[23]还提供了在移动边缘网络实现元宇宙的愿景。详细讨论了使能技术和挑战,包括通信与网络、计算和区块链。

与现有的调研和教程不同,本文的调研集中于移动AIGC网络的部署,以提供实时和隐私保护的AIGC服务。介绍了移动边缘网络中AIGC和协同基础设施的发展现状。随后,介绍了深度生成模型技术以及在移动AIGC网络中提供AIGC服务的工作流程。此外,还展示了创造性的应用程序和几个示范用例。确定了移动AIGC网络部署的实现挑战,从资源分配到安全和隐私。我们的调研贡献如下

    • 我们首先提供一个教程,建立AIGC服务的定义、生命周期、模型和指标。然后,提出了移动AIGC网络,即在移动边缘网络上提供AIGC服务,与移动边缘-云协作的通信、计算和存储基础设施。

    • 介绍了移动AIGC网络中的几个用例,包括用于文本、图像、视频和3D内容生成的创造性AIGC应用程序。总结了基于这些用例构建移动AIGC网络的优势。

    • 确定了实现移动AIGC网络的关键实现挑战。移动AIGC网络的实施挑战不仅来自于动态的信道条件,还来自于AIGC服务中无意义内容、不安全内容规则和隐私泄露。

    • 最后,分别从网络与计算、机器学习(ML)和实际实现考虑等角度讨论了未来的研究方向和开放问题。

如图3所示,调研的组织如下。第二节考察了AIGC的背景和基础。第三部分介绍了移动AIGC网络的技术和协作基础设施。第四节讨论了移动AIGC网络的应用和优势,第五节展示了潜在的用例。第六节讨论了实现中的挑战。第七部分探讨了未来的研究方向。第八节提出结论。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/21452.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【ChatGPTAIGC研讨社】“iPhone时刻”:未来已来

文章目录 前言一、ChaGPT&AIGC研讨社简介二、ChatGPT&AIGC研讨社的优势1.丰富充实的资料库Github开源:[ChatGPT_Project](https://github.com/shawshany/ChatGPT_Project)飞书资料库 2.重量级嘉宾3.工作机会4.投资资源 总结 前言 去年年末,Chat…

线上渠道拓展:澳洲爱他美产品如何利用新媒体平台宣传?

爱他美作为澳大利亚本土的婴儿配方奶粉品牌,在澳大利亚市场拥有越来越多的支持者,为了进一步扩大澳大利亚市场份额,开拓线上市场,有必要利用新媒体平台来推广产品。 爱他美应该利用新媒体平台进行市场宣传。新媒体平台&#xff0c…

轻松玩转开源大语言模型bloom(一)

前言 chatgpt已经成为了当下热门,github首页的trending排行榜上天天都有它的相关项目,但背后隐藏的却是openai公司提供的api收费服务。作为一名开源爱好者,我非常不喜欢知识付费或者服务收费的理念,所以便有决心写下此系列&#…

ChatGPT官方第一手资料:这七个小技巧帮你用好ChatGPT

文 / 高扬(微信公众号:量子论) 学习技术最好的方式是什么?看官方资料。 然而,官方教材总有些晦涩难懂,所以大白话将意思做个翻译,就成为了必然。我个人建议有条件的话,先看官方指南。…

【GPT】让你事半功倍特别好用的5个GPT工具

文章目录 前言一、现在还能开通ChatGPT4.0吗?二、推荐五款与ChatGPT的相关实用工具1.一款浏览器插件:ChatGPT for Google2.一款生成图片的AI工具:midjourney3.推荐两款AI自动生成PPT:闪击PPT、mindshow4.识别PFD文件内容对话&…

【PTA】谷歌的招聘(C语言)

2004 年 7 月,谷歌在硅谷的 101 号公路边竖立了一块巨大的广告牌(如下图)用于招聘。内容超级简单,就是一个以 .com 结尾的网址,而前面的网址是一个 10 位素数,这个素数是自然常数 e 中最早出现的 10 位连续…

中兴校招笔试题-算法工程师-python

两个编程题,不是很难。 一、字符串分割 一个字符串内只包含T和S,问如何分割,是的每个字串有且仅有2个T,请计算总共有多少种分割方式? 说明: 字符串字母顺序不可改变; 字符串个数为奇数时&a…

如何用ChatGPT创造财富?

在当今的信息时代,人工智能技术的不断发展已经成为推动经济发展的新动力之一。ChatGPT作为其中的代表之一,可以帮助人们创造更多的财富。在本文中,我将会探讨如何使用ChatGPT来创造财富。 一、利用ChatGPT实现个性化服务 人工智能技术在个性…

基于ChatGLM-6B模型 + prompt实现角色扮演功能

★★★ 本文源自AlStudio社区精品项目,【点击此处】查看更多精品内容 >>> 1. 引言 1.1 什么是ChatGLM General Language Model (GLM),据论文 https://arxiv.org/pdf/2103.10360.pdf 所述,是一种基于自回归空白填充的通用语言模型…

启真医学大模型

启真医学大模型 QiZhenGPT: An Open Source Chinese Medical Large Language Model 本项目利用启真医学知识库构建的中文医学指令数据集,并基于此在LLaMA-7B模型上进行指令精调,大幅提高了模型在中文医疗场景下效果,首先针对药品知识问答发…

深度思考:在 AI 时代,你会被放大一千倍的能力是什么?

Datawhale干货 作者:艾芙,复旦大学,百姓AI教育负责人 前言 大家晚上好,我是艾芙,百姓 AI 的 AI 教育负责人。 先做一下自我介绍,我是一个在技术圈和教育圈反复横跳的斜杠中年了。大约在 5 年前&#xff0c…

Langchain 新手完全指南

原文:Langchain 新手完全指南 Langchain 可能是目前在 AI 领域中最热门的事物之一,仅次于向量数据库。 它是一个框架,用于在大型语言模型上开发应用程序,例如 GPT、LLama、Hugging Face 模型等。 它最初是一个 Python 包&#x…

数据人一直做这四项工作,即使不被BI、AI取代,也躲不过35危机!

先说我的观点:数据分析职业不会被BI软件替代。顺便说一句,数据分析职业也不会被chatgpt取代。 大家首先要搞清楚:取代人的从来不是工具,而是会使用工具的人。 数据分析师工作内容 首先,先让我们来全面拆解一下国内数…

〖编程初学者的自我修养 - 优质简历篇①〗- 知己知彼,面试官是如何分析一份简历的

历时18个月,采访 850 得到的需求。 不管你是在校大学生、研究生、还是在职的小伙伴,该专栏有你想要的职业规划、简历、面试的答案。说明:该文属于 编程初学者的自我修养 专栏,购买任意白宝书体系化专栏可加入易编程社区&#xff0…

聊一聊,哪些职业受ChatGPT影响最大?

新研究发现,审计师、翻译及作家目前的工作内容中,AI工具可以更快地处理至少一半的任务。 一项新研究显示,面对生成式人工智能(AI)拥有的能力,会计师是职业最容易受到影响的 其中一类专业人士。研究人员发现,借助这项技…

ChatGPT 速通手册——摘要生成和重命名

摘要生成和重命名 当我们开始使用ChatGPT了以后,就会发现一个非常有意思的事情,我们发起的每一个对话,ChatGPT都会基于对话内容生成一个摘要展现在对话列表中,如图所示: 我们的问题是“世界上最大的桥梁是哪座大桥&am…

培训班出来的程序员现在怎么样了

文章目录 0、前言1、刚出茅庐2、南下广州3、踏上北漂4、紧张的培训4、两进两出5、站稳脚跟6、奋斗至今7、一些收获 0、前言 大多数刚出校门的同学,都有过迷茫。因为少数家里有矿的除外。都是必然要经历的过程。迷茫之后,当然都会作出选择,因…

在培训班里学IT技术,真的有用吗?

关于IT培训,JiaYu有话说 0、前言IT行业的未来发展趋势IT技术学习方法 1、学习IT上培训班的益处2、学习IT上培训班的风险3、培训班对个人的要求4、JiaYu有话说嵌入式是否值得学?去培训班学嵌入式有用吗?推荐 0、前言 IT行业的未来发展趋势 大…

42天最全月子餐

阅读目录 第一周:排恶露第二周:排水肿第三周:催乳第四周:补气血第五周:通乳注意事项‼️月子餐注意事项: 第一周:排恶露饮食时间表第一天7:30 早餐10:00 加餐12:00 午餐15:30 加餐17:00 晚餐21:…

【报告分享】产后康复行业发展报告2021-麻麻康研究院(附下载)

摘要:目前在产后康复行业服务主体中,医疗机构包含医院、妇幼保健院、社区卫生服务中心、医师诊所,产康机构包含产后恢复中心、月子中心、运动健身中心、推拿按摩中心、医美中心、美容中心等多种门店业态,家庭场景包含家庭设备厂商及上门服务从…