本文首发《中兴通讯技术(简讯)》,2022年第9期,作者:中兴通讯高端交流团队部长 左罗,中兴通讯高端交流团队综合方案总工 袁越。边缘计算社区经过授权发布,以下为正文:
从经济角度看,以钢铁、电力产量衡量一个国家、地区发展水平的时代正在远去,数据、算法、算力成为智能时代的新经济要素。电气时代打破了人类体能对社会发展的制约,智能时代则在摆脱对人类脑力的依赖。算法来自于科学家,数据来自于千行百业,算力则承载算法和数据。以网络连接算力节点,从而形成一体化的算力服务平面,无论被称为“算力网络”还是“云网融合”,这种新型的算网一体服务,正在成为支撑国家产业数字化转型的新型信息基础设施。
算力网络带来基础设施和创新业务两类市场机会
巨大的投入能为运营商带来哪些收入机会?困扰过5G建设的问题,同样困扰算力网络建设。结合国家东数西算政策和运营商多要素发展战略,可以预见算力网络将在基础设施和创新业务两个层面为运营商带来新的市场机会(见图1)。
基于运营商全光底座构建的涵盖西部、东部、省级、边缘的全国一体化新型信息基础设施,可以为本地、周边、跨区域的政企客户提供灵活调度的多样性算力服务。小于5ms的省内时延圈,聚焦本地政企客户,提供最契合本地政企大客户数字化转型的方案。对于10ms周边时延圈,根据区域数字经济发展水平,可以为周边省份提供高性能实时算力,如广东可以承接广西、海南的需求,也可以作为低成本资源池,承接周边发达省份外溢的温冷数据处理、备份需求。对于西部国家枢纽所在省份,最重要机遇是承接东部冷数据存储和非实时算力需求。
新型信息基础设施,也是运营商孵化自有创新业务的重要平台。面向个人和家庭市场,促进智能视频监控业务,家庭增值业务,元宇宙早期形态的云XR、云游戏成熟。这类业务当前受制于端算力进展缓慢,将业务上移到边缘云,又对于带宽、时延、处理能力要求苛刻,而这正是算力网络可提供的关键能力。对于政企用户,通过多层次算力和确定性网络协同,开展新型云电脑、基于视频的AGV、机器视觉和安全监控等业务创新。
图1 算力网络带来两个层级的市场机会
基础设施变现场景及关键要素
新型信息基础设施最大特点是通过算力和网络深度结合,实现全国范围内算力共享和算力负荷跨域调度,从而达到成本最优、碳排放最低的效果。
跨域算力共享场景
东数西算是一个通用的提法,从场景上看至少存在东数西存、东视西渲、东数西训三类应用场景。
- 东数西存
东部经济发达地区年新增数据达EB级别,海量数据来自医疗影像、智慧城市、智慧交通、各类云盘和视频内容源等。其中大部分数据随着时间推移访问频次逐渐降低,但又必须留存备查。传统分布式存储也会根据数据访问频度,区分冷、温、热数据,采用不同策略进行存储和调度,但一般做不到跨地域调度。随着东数西算工程的实施,将分布式存储系统扩展到广域范围内,充分发挥西部地区绿色电力资源丰富、电价低廉的优势,能够降低数据存储成本,获得更大市场。
- 东视西渲
国内十大影视基地有9个在中东部地区,伴随影视作品中特效占比和内容清晰度不断提升,影视公司、广告公司、游戏公司对视频图像渲染的算力需求暴增,企业自建渲染平台成本攀升。渲染本身是时延不敏感业务,运营商可以在广域范围内,选择最具成本优势的算力资源,拓展影视渲染市场。
- 东数西训
在模拟人类认知模式取得突破前,人工智能主流发展路径是规模取胜,即AI模型越来越大和复杂,模型参数从几百万上升到百亿甚至千亿,训练所需的数据量也越来越大。业界有分析认为,如果按租用算力的价格估算,谷歌PaLM模型一次训练的算力花费可能超过1亿元人民币。将训练任务和海量的样本数据调度到西部,在西部完成AI模型训练,将可能为企业节省大量费用。
从上述三个场景的简单分析可见,“东X西X”场景本质是利用骨干网络带宽换取西部低成本算力。算力成本的下降与额外的带宽成本相比,是否存在明确收益,需要通过试点加以验证。技术上“东X西X”解决方案的关键是跨域算网一体编排调度能力。
算力调度的本质
算力调度是提升资源池算力利用率、保障服务SLA的重要手段,但算力本身并不能从一个资源池调度到另一个资源池,实际流动的是应用和服务。从业务生命周期看,算力调度会发生在两个阶段:部署过程和服务过程(见图2)。
图2 应用生命周期内不同阶段的两种算力调度
所谓部署过程调度,就是将应用软件部署到某个特定资源池的过程,包括首次部署以及运行过程中,因各种原因将一个应用软件的实例从某个资源池迁移到另一个资源池。部署过程调度核心解决应用使用哪个资源池的算力的问题,选择资源池的策略包括“就近”(靠近用户)、“就闲”(选择负荷较低的资源池)、“就碳”(选择绿色能源丰富的资源池),以及其他业务相关的策略。
服务过程调度,则是当应用软件的用户请求获得服务时,从部署在多个资源池中的应用实例中选择一个,将这个用户请求调度到对应的应用实例。目前这一调度过程由业务系统自身的负载均衡软件负责,调度策略一般以就近、就闲策略为主。由于应用对于网络的感知能力较弱,会出现业务软件负荷较低,但是网络质量不佳最终影响用户体验的问题。
算力调度平台将首先实现部署过程调度,服务过程调度如何从业务系统抽象到算力调度平台还在研究中。部分东数西算国家枢纽节点所在地政府,提出建设统一的算力调度平台,实现统一调度三大运营商及其他云服务商的算力资源。但由于算力资源管理接口标准化程度不足,政府建设统一调度平台存在较大的技术障碍,算力调度短期内将仍是企业负责。
算力网络叠加视频能力培育类视频应用
赋能千行百业数字化转型外,新型信息基础设施同样可以服务于运营商自有业务创新。算力与网络深度融合的特性,可以为视频监控、机器视觉、云电脑、云游戏等泛视频业务创新提供坚实支撑。
视频业务对算网能力提出更高要求
近年来视频业务正在发生巨大变化,图像质量从高清向4K/8K沉浸式体验演进,编解码技术从H.265向H.266等新技术演进,后者的运算量将较H.265提升5~9倍。视频业务从传统面向娱乐衍生出网购直播、视频监控、工业视觉、云会议、云电脑等创新业务。相应地视频流向从单向向双向及东西流量发展,业务时延要求从点播的数秒,到直播的秒级,再到云电脑所需的百毫秒级。视频流量越来越大,时延要求越来越苛刻,视频处理对算力的要求越来越高。
同时,随着国内外IT巨头纷纷入场,大量资本入局,元宇宙已经不再是单纯的炒作。沉浸式交互技术、AI辅助内容生成等关键技术的发展,推动云XR、云游戏、数字人等应用逐渐成熟,最终将融合形成虚实结合、治理完备的元宇宙体系。当前独立发展的这类应用,不断对于算力、网络提出更高要求。
上述因素驱动视频系统转型:泛在的编解码、转码、图像合成、AI能力模块化,并且能力模块部署到算力网络中从边缘到中心的多层算力节点,同时服务于多种视频业务。这种算力网络叠加视频能力形成的视频算网,将助力未来视频业务快速发展。
边缘算网承接端处理能力,发展增值业务
终端处理能力不足,严重制约面向存量个人/家庭用户推广创新的增值业务,例如智能家庭监控或基于机顶盒的互动教育等。频繁升级终端无论是成本,还是工程实施都是难以接受的方案。
保留端侧基本视频播放和操控能力,将新业务处理上移到边缘云,形成云化机顶盒vSTB或面向手机的云游戏、云XR业务。视频算网边缘节点为视频渲染、视频编码提供算力,同时为用户提供具备质量保障的网络连接(见图3)。
家庭监控终端保留视频采集上传能力,视频AI的推理能力放到边缘云,合作伙伴提供非法入侵识别、老人摔倒识别等算法,家宽用户可单独订购或组合订购。
类似地,对于工业机器视觉、视觉导航AGV等应用,视频算网为企业提供上行大带宽的确定性网络连接,叠加边缘AI推理能力,以及中心AI训练平台,形成“连接+算力+能力”一体服务。
图3 利用边缘算力支撑终端上移业务
新型云电脑与vCDN协同发展,扩大B端收入
美国有40%的办公PC使用云电脑,在欧洲和日本这个数据是18%,而国内不到3%,国内云电脑办公有着巨大的发展空间。制约传统云电脑业务发展的两大痛点分别是:用户体验差,网络不稳定时操作明显存在卡顿;成本高,专用虚拟化资源池导致云电脑成本和购买台式机成本不相上下。
借助算力网络,将云电脑和vCDN混合部署在同一个边缘资源池中,可以充分利用两类业务的潮汐效应,最大化提升资源使用效率,降低成本。即白天服务于视频娱乐业务的CDN负荷小,云电脑负荷大,算力资源大部分服务于云电脑业务;到了晚上云电脑负荷降低,而CDN负荷上升,算力资源大部分服务于CDN业务。
传统云电脑多数部署在企业内网的私有云,员工一旦出差到异地,通过VPN访问云电脑的效果差。运营商将云电脑部署到公网,用户出差到异地后,可以在漫游地启动云电脑,通过算力网络的云存储业务,将用户使用的数据调度到漫游地,确保用户体验与归属地一致。同时引入RTN(实时音视频传输网络)网络负责云电脑服务端到用户的数据流转发,进一步降低网络时延。
无论是基础设施层面的算力网络产品还是基于算力网络的创新业务,其商业模式仍存在一定不确定性,技术上如何构建高效、复杂度可控的算网大脑尚有诸多分歧。当前阶段需要开展技术和产品试点,不断探索商业模式并完善技术架构,为未来国家新型信息基础设施建设打下坚实基础。
错过深圳站?
没关系!来参加全球边缘计算大会·上海站!
10月29日,上海普陀区,致敬每一位勇敢向前的边缘计算人!
点击阅读原文立即报名! ! !