来源:物联网智库
作者:赵小飞
导读
物联网数据作为现代社会产生的数据主力,加上未来物联网智能“社交”方面的场景,将为AIGC以及大模型提供用武之地。虽然目前还没有物联网与AIGC结合的应用出现,但未来不可避免。
2022年11月,美国人工智能公司Open AI推出ChatGPT的对话模型,迅速风靡全球,并快速迭代,在不到4个月后推出了能力更强大的GPT-4,近日又推出了联网和第三方应用插件功能,不断刷新生成式人工智能(AIGC)带来的变革,对于AIGC的行业应用也成为人们探讨的热点话题。
近年来,人工智能与物联网深度融合,使AIoT成为共识,大量人工智能企业都将物联网作为其应用的重点,AIGC如何应用于物联网自然成为业界探索的方向。虽然目前还没有双方结合的应用出现,但未来不可避免。物联网数据作为现代社会产生的数据主力,加上未来物联网智能“社交”方面的场景,都将为AIGC以及大模型提供用武之地。
物联网数据的“投喂”,AIGC拥有了新鲜的养料
众所周知,AIGC是算力、算法、数据三位一体的成果,其中包括大量的数据学习和训练。以ChatGPT为例,该模型是由庞大数据集训练而成,OpenAI曾透露,ChatGPT的训练使用了45TB的数据、近1万亿个单词的文本内容,大概是1351万本牛津词典所包含的单词数量。随着AIGC应用端不断丰富,更智能的工具需要更多的数据进行训练,更多的数据来源就比较重要。
此前,多位计算机科学家曾预测,到2026年ChatGPT等大型语言模型的训练就将耗尽互联网上的可用文本数据,届时将没有新的训练数据可供使用。业界提出了采用“合成数据”进行训练,即运用计算机模拟生成的人造数据,模拟现实世界的观察与观测,是一种应对训练、测试、验证AI模型和算法的手段。
通过物联网涵盖的海量传感器、机器设备的数据,或许也能在一定程度上解决AIGC模型训练所需的数据来源。
首先,物联网数据规模足够大,有超越互联网数据之势。根据知名咨询机构IDC的研究,2020年全球创造了大约64ZB的数据,而到2025年,全球数据总量将达到163ZB,这五年内产生的数据将是自1947年引入数字储存量概念以来创建数据总量的两倍多。同时,IDC预测,到2025年,物联网设备生成的数据量预计将达到73.1ZB,已达到全球数据总量44%。其中智能摄像头、智能汽车等强算力、大带宽终端产生的数据尤为惊人,例如,一辆智能网联汽车每天就可能收集10TB的数据。
物联网数据规模还体现在不断增长的物联网设备上。当前互联网用户数量已增长乏力,很多互联网发达的国家和地区,用户数已达到天花板,数据的增长主要通过对互联网存量用户的经营。物联网用户没有天花板,还在持续增长,到2025年,全球每分钟将有超过15万台物联网设备连接入网。海量的物联网连接,未来产生的数据量可能超过互联网,可以给人工智能模型持续输入“养料”去训练。
其次,物联网数据的鲜明特点,为人工智能带来新鲜养料。相对于互联网,由于物联网数据是物理实体产生的数据,具有鲜明的客观性,且大部分场景主要目的是用于生产经营,因此实用性也更高。物联网所产生的数据既有标签、传感器感知的设备静态数据,也有设备运行中产生的时间序列动态数据。在数据类型方面,物联网技术能够实现对物理世界的状态数据、定位数据、行为数据等采集,获得各行业能源、资产属性、诊断类数据和信号类数据,这些数据对于各行业核心的生产经营和智能化升级意义重大。
在这些特殊数据的“投喂”下,AIGC模型或许能够更深入地学习各行业具体场景知识,输出更精准的信息,为行业经营者和物联网用户参考,并进一步驱动应用创新,加速产业数字化升级的步伐,例如大幅提高预测性维护、供应链协同的效率,简化人们与智能家居、智能硬件交互的方式。可以说,AIGC能够成为物联网应用的重要助手。
近日,Open AI发布了ChatGPT的插件功能,允许ChatGPT和其他第三方应用程序的联通,首批应用插件的包括旅行软件、购物软件、支付平台、在线订餐平台、电商平台、工作软件等方面十余家合作方。在笔者看来,未来不排除ChatGPT的插件功能与车联网平台、智能家居平台甚至工业互联网平台应用的联通。在此模式推动下,物联网应用将与AIGC形成融合,物联网数据投喂和AIGC对物联网应用协助的潜力进一步释放。
“社交”物联网设备进化,以边缘计算提供定制化AIGC服务
上文所述的AIGC作为物联网应用的助手,还是聚焦于用户和经营者对物联网场景的管理,是人与物之间的互动。正如当前大部分物联网设备允许用户通过API的形式访问数据,并形成相应的服务,这种形式下物联网设备并不具备自主性。
随着物联网智能化的提升,“社交”物联网设备不断发展,尤其是物联网设备具备更多“社会性”,各类物能够在一定程度上自我进化,甚至与其他物联网设备之间自主进行“社交”。市场研究机构IoT Analytics近期发布的一份AIGC研究报告中,提出了AIGC可以从多个方面提升自主“社交”能力,即:
允许设备回答用户可能会提出的复杂问题;
允许终端用户与设备对话以改变设置;
允许设备本身使用AIGC来生成答案。
这一设想已经逐渐变为现实,尤其是一些机构探索机器人使用AIGC大模型,在机器人得不到清晰的指令时,能够与用户进行互动并完成与其他设备的协同。
例如,亚马逊开发了一个名为DialFRED的模型框架,允许机器在不确定的情况下向用户提问。亚马逊认为此前的很多只能设备通常只允许单向通信,人类用户向智能设备发出自然语言命令,智能设备只能被动地遵循命令。
图源:亚马逊
亚马逊推出的DialFRED的模型框架是支持对话的嵌入式指令集,允许智能设备主动向用户提问,智能设备可使用用户响应中的附加信息来更好地完成任务。为了训练DialFRED,亚马逊提出了一个提问者-执行者的交互式框架,其中提问者用人类标注的数据进行预训练,并用强化学习进行微调。
亚马逊的DialFRED可以说是AIGC推动“社交”物联网设备的一个实例,相信随着全球AIGC生态的发展,针对提升“社交”物联网能力的模型和技术会不断出现,推动更加智能的物联网应用落地。
由于AIGC赋能物联网应用场景需要模型能够更进一步下沉到各行业,因此已有不少针对AIGC进一步下沉的研究。笔者注意到,今年年初由新加坡南洋理工大学、电子科技大学、广东工业大学等高校研究人员联合发表的一篇《Enabling AI-Generated Content (AIGC) Services in Wireless Edge Networks》中提出了“AIGC-as-a-service”(AaaS)的概念,认为AIGC 服务提供商可以在边缘服务器上部署人工智能模型,通过无线网络向用户提供即时服务,以及更便利和可定制的体验,用户可以低延时和低资源消耗轻松地访问和享受 AIGC服务。
在这种模式下,AIGC 服务提供商需要首先在大数据集上训练AIGC模型,然后将其扩散模型托管在边缘服务器上,服务商需要持续的维护和更新,以确保AIGC模型在生成高质量内容方面保持准确和有效。用户可以提交内容生成请求,并从供应商租用的边缘服务器接收生成的内容。
这一模式允许AIGC模型根据用户的需求进行定制的内容,提供个性化的体验,而且通过在更接近用户的地方部署AIGC服务,QoS将得到显著提高。然而,这一模式对无线网络带宽、训练数据集、算力消耗等都是巨大的挑战,例如未来移动通信网络需要5.5G或6G的支持。
若这一模式的瓶颈能够突破,AaaS将和当前很多服务一样可以随用随取,对于广泛分散、碎片化但海量连接的物联网智能化化升级带来较好支持,在很大程度上提升“社交”物联网设备的部署。
当然,AIGC在物联网方面的广泛应用还非常远。我们看到,当前大多数AIGC模型主要关注文本和图像,只有非常少量的模型关注将传感器数据作为输入。另外,大量产业物联网场景中,对于AI能够给出的解决方案的确定性要求非常高,当前AIGC模型生成的文字或图片很多情况下是一种“最有可能”的答案,并不一定能够应用于生成经营场景。
例如,在工业互联网场景中,生产、质检等需要近乎100%的确定性答案或辅助;又如,联网汽车在重要场合下需要反馈完全确定性指令来采取行动。因此,对于关键任务型物联网应用,AIGC或许还需要很长的路要走。
不过,虽然AIGC在物联网的应用还不明朗,但AI与物联网深度融合的趋势已经非常明朗,除了AIGC外,未来AI仍然会有各类新的创新,和物联网结合来服务千行百业,这才是技术创新的使命。正如华为创始人任正非在近期一次专家座谈会上所述,人工智能软件平台公司对人类社会的直接贡献可能不到2%,98%都是对工业社会、农业社会的促进。
未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)大脑研究计划,构建互联网(城市)大脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。
如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”