人工智能生成内容(AIGC)是一种使用人工智能算法创造性地生成、操作和修改有价值和多样化数据的自动化方法。本文重点研究了ChatGPT和Dall-E等AIGC应用在移动边缘网络(mobile AIGC networks)中的部署,这些应用在维护用户隐私的同时,提供个性化和定制化的实时AIGC服务。首先介绍了生成模型的背景和基本原理以及移动AIGC网络的AIGC服务的生命周期,其中包括数据收集、训练、微调、推理和产品管理。然后,讨论了支持AIGC服务并使用户能够在移动边缘网络访问AIGC所需的云边-移动协同基础设施和技术。探索了AIGC驱动的移动AIGC网络的创意应用和用例。此外,还讨论了部署移动AIGC网络所面临的实现、安全和隐私方面的挑战。最后,指出了完全实现移动AIGC网络的未来研究方向和开放问题。
https://www.zhuanzhi.ai/paper/4db7f7a43d99cc11e86982637091dba0
1. 引言
图1移动AIGC网络概述,包括云层、边缘层、D2D移动层。AIGC服务的生命周期,包括数据收集、预训练、微调、推理和产品管理,在核心网络和边缘网络之间循环。
近年来,人工智能生成内容(artificial intelligence-generated content, AIGC)已成为一种生产、操作和修改数据的新方法。通过利用AI技术,AIGC将内容生成与传统的专业生成内容(PGC)和用户生成内容(UGC)[1] -[3]一起自动化。随着数据创建的边际成本降低到几乎为零,AIGC(例如ChatGPT)有望为人工智能发展和数字经济提供大量合成数据,为社会提供显著的生产力和经济价值。人工智能技术的不断进步,特别是在大规模和多模态模型[4],[5]领域,推动了AIGC能力的快速增长。这一进展的一个主要例子是DALL-E[6]的开发,这是一个基于OpenAI最先进的GPT-3语言模型的人工智能系统,由1750亿个参数组成,旨在通过预测连续的像素来生成图像。在其最新迭代DALL-E2[7]中,采用扩散模型来减少训练过程中产生的噪声,从而生成更精细和新颖的图像。在使用AIGC模型生成文本到图像的背景下,语言模型起着指导作用,增强了输入提示和结果图像之间的语义一致性。同时,AIGC模型处理现有的图像属性和组件,从现有数据集生成无限的合成图像。
基于具有数十亿个参数的大规模预训练模型,AIGC服务旨在增强知识和创造性工作领域,这些领域雇用了数十亿人。通过利用生成式人工智能,这些领域可以实现至少10%的内容创造效率提高,可能产生数万亿美元的经济价值。AIGC可以应用于各种形式的文本生成,从实际应用(如客户服务查询和消息)到创造性任务(如活动跟踪和营销文案[9])。例如,OpenAI的ChatGPT[10]可以根据用户提供的提示自动生成有社会价值的内容。通过与ChatGPT进行广泛而连贯的对话,来自各行各业的人可以在调试代码、发现健康食谱、编写脚本和设计营销活动方面寻求帮助。在图像生成领域,AIGC模型可以根据现有图像的属性和成分处理现有图像,实现端到端的图像合成,如直接从现有的[7]图像生成完整的图像。此外,AIGC模型在跨模态生成方面具有巨大的潜力,因为它们可以在空间上处理现有的视频属性,并同时自动处理多个视频片段[11]。
与PGC和UGC相比,AIGC在内容创造方面的优势已经显而易见。具体来说,生成式AI模型可以在几秒钟内产生高质量的内容,并提供为用户需求量身定制的个性化内容[2]。随着时间的推移,AIGC的性能得到了显著提高,这是由增强的模型、增加的数据可用性和更大的计算能力[12]驱动的。一方面,先进的模型[4],如扩散模型,为跨模态AIGC生成提供了更强大的工具。这些进展归功于生成式人工智能模型的基础性研究,以及生成式深度神经网络(DNN)中学习范式和网络结构的不断细化。另一方面,随着网络日益互联,用于生成式人工智能训练和推理的数据和计算能力变得更加容易获得[9],[13]。例如,需要数千个GPU的AIGC模型可以在云数据中心进行训练和执行,使用户能够通过核心网络提交频繁的数据生成请求。
尽管AIGC具有革新现有生产流程的潜力,但在移动设备上访问AIGC服务的用户目前缺乏对交互式和资源密集型数据生成服务[14],[25]的支持。首先,可以利用云数据中心强大的计算能力训练AIGC预训练模型,如用于ChatGPT的GPT-3和用于ChatGPT Plus的GPT-4。用户通过在云服务器上执行AIGC模型,通过核心网络访问基于云的AIGC服务。然而,由于其远程特性,云服务具有较高的延迟。因此,在移动边缘网络,即图1所示的移动AIGC网络上部署交互密集型的AIGC业务,应该是一个更实际的选择[26]-[28]。具体而言,开发移动AIGC网络的动机包括:
-
低延迟:用户可以访问移动AIGC网络[29]中的低延迟服务,而不是将AIGC服务请求定向到核心网内的云服务器。例如,用户可以通过将预训练模型下载到边缘服务器和移动设备进行微调和推理,直接在无线接入网络(RANs)中获得AIGC服务,从而支持实时、交互式的AIGC。
本地化和移动性:在移动AIGC网络中,在网络边缘设有计算服务器的基站可以通过本地化服务请求[30]、[31]来微调预训练模型。此外,用户的位置可以作为AIGC微调和推理的输入,解决特定的地理需求。此外,用户移动性可以集成到AIGC服务提供过程中,实现动态、可靠的AIGC服务提供。
自定义和个性化:本地边缘服务器可以适应本地用户需求,允许用户根据自己的偏好请求个性化服务,同时根据本地服务环境提供定制化服务。一方面,边缘服务器通过对AIGC服务[2]进行相应微调,可以根据本地用户群体的需求定制AIGC服务;另一方面,用户可以通过指定偏好向边缘服务器请求个性化服务。
隐私和安全:AIGC用户只需要向边缘服务器提交服务请求,而不需要将偏好发送到核心网络内的云服务器。因此,AIGC用户的隐私和安全可以在AIGC服务的提供过程中得到保护,包括服务的微调和推断。
如图1所示,当用户通过边缘服务器和移动设备在移动边缘网络上访问AIGC服务时,有限的计算、通信和存储资源为交付交互式和资源密集型的AIGC服务带来了挑战。首先,边缘服务器上的资源分配必须权衡边缘服务器AIGC服务的准确性、延迟和能耗。此外,计算密集型的AIGC任务可以从移动设备卸载到边缘服务器,提高推理延迟和服务可靠性。此外,生成内容的AI模型可以被缓存在边缘网络中,类似于内容分发网络(CDN)[32],[33],以减少访问模型的延迟。最后,探索移动性管理和激励机制,在空间和时间上鼓励用户参与。与传统人工智能相比,AIGC技术需要算法的整体技术成熟度、透明性、鲁棒性、公正性和洞察力,才能有效地应用于实际。从可持续性的角度来看,AIGC可以使用现有的和合成的数据集作为生成新数据的原材料。然而,当有偏数据被用作原始数据时,这些偏差会持续存在于模型的知识中,这不可避免地导致算法的结果不公平。最后,静态AIGC模型主要依赖模板来生成机器生成的内容,这些内容可能具有类似的文本和输出结构。
本文概述了与AIGC和移动边缘智能相关的研究活动,如图2所示。鉴于人们对AIGC的兴趣日益增加,最近发表了一些相关主题的调研报告。表一列出了这些调查与本文的比较。
[34]中的研究提供了研究人员和行业发表的当前AIGC模型的全面概述。作者确定了9个类别,总结了生成式人工智能模型的演变,包括文本到文本、文本到图像、文本到音频、文本到视频、文本到3D、文本到代码、文本到科学、图像到文本和其他模型。此外,他们揭示,只有6个具有巨大计算能力和高技能和经验丰富的团队可以部署这些最先进的模型,这甚至比类别的数量还要少。按照[34]中开发的生成式AI模型的分类法,其他调研随后详细讨论了生成式AI模型。在[9]中的研究检查了现有的生成文本和检测模型的方法。[18]的研究提供了多模态图像合成和处理的主要方法、数据集和评估指标的全面概述。[24]的研究基于语音和图像合成技术,总结了现有的基于深度生成模型的同步语音手势生成工作。在[16]上的研究探讨了与人工智能生成音乐相关的版权法,其中包括人工智能工具、开发者、用户和公共领域之间的复杂交互。[4]中的研究为高级生成模型提供了全面的指导和比较,包括GAN、基于能量的模型、变分自编码器(VAE)、自回归模型、基于流的模型和扩散模型。随着扩散模型在产生创造性数据方面受到广泛关注,对[21]的研究给出了扩散模型的基本算法和全面分类。基于这些算法,作者[1]从艺术分析人工智能和艺术创作人工智能两个角度阐述了艺术与人工智能的互动。此外,作者还在[2]中讨论了在元宇宙中应用计算艺术来创建超现实的网络空间。
图3:本次调研的大纲,介绍了移动边缘网络的AIGC服务提供,并强调了移动边缘网络在提供AIGC服务方面的一些基本实现挑战。
在6G[19]中,针对智能移动网络,引入了基于边缘计算系统的移动边缘智能,包括边缘缓存、边缘计算和边缘智能。[17]研究探讨了分布式学习在无线网络中的部署。研究[15]为联邦学习提供了指南,并对在移动边缘网络中实现联邦学习(FL)进行了全面概述。作者详细分析了实现FL所面临的挑战,包括通信成本、资源分配、隐私和安全。在[12]中,详细介绍了边缘智能和智能边缘的各种应用场景和技术。此外,[20]研究还讨论了6G无线网络低功耗、低延迟、可靠可信边缘智能的前景和潜力。[22]研究探索了区块链技术如何用于实现边缘智能,以及边缘智能如何支持区块链在移动边缘网络的部署。对区块链驱动的边缘智能、边缘智能友好的区块链及其在移动边缘网络中的实现进行了全面的综述。[23]还提供了在移动边缘网络实现元宇宙的愿景。详细讨论了使能技术和挑战,包括通信与网络、计算和区块链。
与现有的调研和教程不同,本文的调研集中于移动AIGC网络的部署,以提供实时和隐私保护的AIGC服务。介绍了移动边缘网络中AIGC和协同基础设施的发展现状。随后,介绍了深度生成模型技术以及在移动AIGC网络中提供AIGC服务的工作流程。此外,还展示了创造性的应用程序和几个示范用例。确定了移动AIGC网络部署的实现挑战,从资源分配到安全和隐私。我们的调研贡献如下。
-
我们首先提供一个教程,建立AIGC服务的定义、生命周期、模型和指标。然后,提出了移动AIGC网络,即在移动边缘网络上提供AIGC服务,与移动边缘-云协作的通信、计算和存储基础设施。
介绍了移动AIGC网络中的几个用例,包括用于文本、图像、视频和3D内容生成的创造性AIGC应用程序。总结了基于这些用例构建移动AIGC网络的优势。
确定了实现移动AIGC网络的关键实现挑战。移动AIGC网络的实施挑战不仅来自于动态的信道条件,还来自于AIGC服务中无意义内容、不安全内容规则和隐私泄露。
最后,分别从网络与计算、机器学习(ML)和实际实现考虑等角度讨论了未来的研究方向和开放问题。
如图3所示,调研的组织如下。第二节考察了AIGC的背景和基础。第三部分介绍了移动AIGC网络的技术和协作基础设施。第四节讨论了移动AIGC网络的应用和优势,第五节展示了潜在的用例。第六节讨论了实现中的挑战。第七部分探讨了未来的研究方向。第八节提出结论。