高通Ziad Asghar:AI处理的重心从云端向边缘侧转移,智能手机是最佳平台 | MEET 2023...

萧箫 整理自 MEET 2023
量子位 | 公众号 QbitAI

从Stable Diffusion到ChatGPT,这半年AI算法应用可谓突飞猛进。

但对于硬件领域而言,AI计算的下一个突破口或未来趋势究竟是什么?

尤其是AI应用最大的领域之一——移动端,大量AI算法在这里遭遇考验,也在这里部署落地。

作为移动硬件领域对终端侧AI最有话语权的芯片厂商之一,高通对于未来AI计算的发展方向是如何预测的?

在MEET2023智能未来大会上,高通技术公司产品管理高级副总裁Ziad Asghar分享了自己对于提升AI处理性能、以及未来AI计算发展方向的思考:

数据会不断从边缘侧产生,因此AI处理的重心正在持续向边缘转移。

边缘侧是进行AI处理的最佳选择。

3108fa085f89304db30dcbf01a346564.png

为了完整体现Ziad Asghar的分享及思考,在不改变原意的基础上,量子位对他的演讲内容进行了编辑整理。

关于MEET智能未来大会:MEET大会是由量子位主办的智能科技领域顶级商业峰会,致力于探讨前沿科技技术的落地与行业应用。今年共有数十家主流媒体及直播平台报道直播了MEET2023大会,吸引了超过300万行业用户线上参会,全网总曝光量累积超过2000万。

演讲要点

  • 数据会不断从边缘侧产生,因此AI处理的重心正在持续向边缘转移。

  • 消费者希望有更好的数据隐私,所有的终端数据能够留在终端上,希望数据可靠,处理结果即时获取。因此,边缘侧是进行AI处理的最佳选择,而高通一直在推动这场变革。

  • AI处理的最佳平台是智能手机,因为它随时随地可用,且人人都有、人人可用。

  • 过去所有的AI推理都在云端进行,如今大量推理工作正在被转移至边缘侧完成。

  • 终端侧的实际数据可能让模型的训练效果产生重要变化,同时提升其泛化能力。

  • 自动驾驶领域充满挑战,它必须能高精度分辨人类和障碍物,否则后果不堪设想,这也恰好是AI的用武之地。

(以下为Ziad Asghar演讲实录整理)

AI处理下一阶段:边缘计算

今天我将和大家分享的主题是,高通如何让智能网联边缘(Connected Intelligent Edge)成为现实。

这几年来,我们的团队研发了不少前沿AI技术,也一直在不断提升终端侧的智能水平。

在此期间,我们“将很多不可能变成可能”,不仅打造了一些全新的应用案例,增强和改进了现有产品的体验,还通过AI技术提升了终端侧和产品的性能。

聚焦终端,我们会发现数据不断从边缘侧产生,因此我们认为,AI处理的重心正在持续向边缘转移

a35db71dcc35bd5a878de1550dbcbf1f.png

主要有两方面原因:

一方面,消费者希望保护个人数据隐私,即将终端数据保留在终端设备上;另一方面,消费者又需要可靠的数据、并即时获得处理结果。

因此,边缘侧是进行AI处理的最佳选择,而高通一直在推动这场变革。

着眼当下,高通已经在智能手机领域取得了突破性的成果,也将不少AI算法应用到了影像、图形处理等功能中。

随着我们不断向前发展,这些技术还会被集成到XR眼镜、PC、物联网、汽车等产品当中,而这些产品也会应用更多AI技术,目的是带来更好的体验、突破更多瓶颈。

所以,高通究竟运用了哪些让产品脱颖而出的技术?

首先,高通专注于基于“统一的技术路线图”进行产品开发。

作为能够全面覆盖智能网联边缘、实现规模化扩展的技术,它涵盖了边缘AI、前沿的视觉效果和视觉技术、图形和游戏技术、新颖的多媒体效果、极快处理速度,以及5G连接能力等特性。

我们将这些技术进行规模化扩展,从耳机等较低复杂度的产品,一直延伸到汽车、ADAS系统等高复杂度的产品。

这张图片展示了AI技术的一系列应用场景,当然这还只是终端设备中的一小部分:

21d258285a8f3e442ef4b53bd9ce18d5.png

至于这些AI技术,则包含了自然语言处理、面部识别等多种不同的能力。

然后就是高通AI引擎了。得益于这一核心成果,目前高通的AI技术已经赋能20亿终端。

高通AI引擎包含图形处理单元、CPU、以及更关键的Hexagon处理器,其中Hexagon处理器又包含标量、向量和张量处理器。

如果从神经网络架构来看,你会发现标量、向量和张量处理器能很好地与神经网络模型的不同部分实现匹配,这正是我们模仿自然界的神经网络模型、从而打造Hexagon处理器的原因。

那么,高通AI引擎具体能做些什么?

根据一些基准测试数据,高通AI引擎表现十分出色,显著超越了同行产品性能。

从第一代骁龙8到第二代骁龙8,我们都非常专注于自然语言处理(NLP)、目标检测等模型的性能优化。

以MobileBERT模型为例。正如图片所展示,针对这个NLP模型,我们将处理速度提升了超过4倍:

5e540f009b12f3eb31bbdc795dbea868.png

我们还会持续优化性能、不断突破模型极限,在边缘侧实现更多能力。

此外,我们还开发了具有高度可扩展性的硬件架构

高通的移动平台,通常会配置一个Hexagon处理器实例;但如果扩展到计算等其他业务时,也可以使用两个Hexagon处理器实例;面向汽车、云和边缘,则可以使用多个Hexagon处理器实例来提高算力。

但这也需要针对性地面向可扩展性进行开发。而高通已经具备这样的独特算法和架构,让这种技术成为可能。

从性能和能效角度来看(既定功耗下可以释放多少性能),我们已经多方面超越了竞争对手,这是基于过去几年积累的技术不断提升的成果。

例如根据性能基准测试AITuTu,在排名前十的AI平台性能列表中,骁龙平台就占据了前四名,包括第二代骁龙8、以及此前发布的第一代骁龙8、骁龙8+和骁龙888。

17fd0f75502beac9ae944ed365adf377.png
数据来源:AITuTu

这其中甚至还有骁龙7系产品入榜,也是我们技术实力的体现之一。

如今,我们的目标是让AI无处不在——

因此,AI处理的最佳平台应该是智能手机,因为它随时随地可用,而且人人都有、人人能用。

如何提升端侧AI处理性能?

为了让AI在终端侧发挥最大作用,我们带来了哪些技术呢?

其中之一,是支持INT4精度推理

相比于INT8,INT4能够实现60%的能效提升和90%的AI推理速度提升。如果从INT8转化到INT4、或从浮点计算转化到整数计算,在同样的算力下我们就能够处理更多数据。

如果把32位浮点模型转化为INT4模型,这个能效甚至可以提升到64倍。

这些是我们已经在边缘侧实现的技术。

可以看到,将模型从INT8转化为INT4时,推理精准度和画面质量均没有受到影响。这也得益于我们打造的前沿工具和软件,用它们能够让前沿技术与我们的硬件方案充分结合。

除了持续提升性能、并应用Hexagon处理器引擎以外,在芯片子系统中,我们还集成了一个小型、“始终在线”的引擎,称之为高通传感器中枢

它能同时处理多路数据流,包括传感器、语音和音频、连接和始终感知的摄像头等,有了它我们就能实现更多应用案例。

实际上,我们将高通传感器中枢的AI能力提高了一倍,通过增加50%的存储,提升它安全方面的性能,包括人身安全、数据安全、健康等等。

举例来说,让它具备识别隐患声音的能力,比如半夜传来的玻璃破碎声,这样就能使用AI赋能的高通传感器中枢进行监测、并采取对应的预警措施。

通过高通传感器中枢,我们还能提升平台包括关键词识别、异常检测、图像分类能力在内的AI能力。从第一代骁龙8到第二代骁龙8,这些性能提升了近九倍。

如今,我们已经有了全面的解决方案,这里就包括业界领先的软件产品,高通AI软件栈

7ace9c3002c54e0eb74fee1ecbee0ba8.png

高通AI软件栈能够实现“模型一次开发,跨所有高通产品线进行扩展”。也就是说,用户只需开发一次模型,就能在所有不同产品中使用它。

这不仅为高通、也为消费者和客户带来了独特体验,让他们真正感受到这项技术带来的便利。

高通AI软件栈支持所有主流框架,包括TensorFlow、PyTorch和ONNX等等,也提供数学库、编译器等全面的工具支持,让客户能够充分利用高通独特AI硬件的优势。

但正如我前面提到的,包括INT4在内的特性和体验,都需要特别的工具能力。因此,我们开发了全新的工具产品,即Qualcomm AI Studio

如下面这个视频所示,Qualcomm AI Studio可以实现模型全面管理,包括模型创建、运行情况监测,模型分析等,从开发到运行实现全面支持。

2f2e353867a7f285a415e5763b567a45.gif

这让我们能够充分发挥INT4的能力,给用户带来更好的体验。

下面这张图清晰展示了我们对于模型完整生命周期的规划,它可以被应用到我们所有的业务和产品线,成为高通产品中一种独特的优势。

d0eab7427c49293810b812c566afda6e.png

我们还支持神经网络架构搜索(NAS)等功能和体验,它允许开发者设定某些模型优化目标,比如具体功耗优化、时延或者精准度等,同时我们还与谷歌就Google Vertex AI NAS展开了合作。

这些不同的产品线让我们大幅改善了时延、并显著提升精准度,下图的1.3%就是一个相当显著的精度提升。

4b51e5ac90fd537cbe25011d4a6e2f62.png

OPPO率先与高通基于Vertex AI NAS展开了合作,提升终端AI的体验。

边缘AI下一步往哪走?

接下来的AI发展方向是什么?

过去所有的AI推理都在云端进行。如今,大量推理工作正在被转移至边缘侧终端完成。

下一步,就是实现完全的分布式AI,即转向终端侧学习的工作方式。这一点至关重要,正如我前面提到的,我们已经开始用AI模仿一些自然行为。

现在AI像人类一样具备一定的推理能力,能够区分图片中的皮肤、毛发、织物或布料,接下来我们还会持续提升推理能力,让终端更加智能。

但问题是,我们如今已能做到一定程度的终端侧学习,这能带来什么收益呢?

目前典型的模型训练方式,通常是基于一定数量的数据进行训练。但终端侧的实际测试数据,却可能让模型的训练效果发生重大变化。这就是终端侧学习能保持甚至提升精准度的原因,同时也能提升模型的泛化能力。

这也能让用户的终端体验变得更加个性化,远超当前终端侧所能实现的能力,而这正是我们在努力的方向,高通正在采取不同的方式实现这一点。

我们的研究团队关注了很多不同的研究方向,包括小样本学习、无监督持续学习、联邦学习和低复杂度的终端侧训练,我会对其中的部分研究方向进行介绍。

基于此大家可以看出,我们已经进入了第二阶段,在边缘进行终端侧学习时,需要做到极低的功耗。

9280b63006b5d0e066a8107301e24627.png

以关键词识别为例,利用小样本学习就可以实现大幅提升,甚至在现实情况下,能让AI做到看完某一人的笔迹或者书面文字后,快速进行辨认。

我们也能做到在用户录入数据时进行局部模型适应,凭借非常少量的样本数据和出色的数据标记能力,大幅提升关键词识别的表现。

举例来说,当遇到说话有特定口音的用户时,针对异常值数据检测,借助小样本学习让关键词检测算法的检测率提升30%左右,让这个模型真正做到灵活运用。

我们探索的另一条路径是联邦学习。云端创建的模型被下发到边缘侧终端后,基于一定程度的离线学习,边缘侧终端就可以根据消费者实际情况调整模型。

同时,由于终端侧学习的过程会产生噪声,所以还能将之回传云端并进一步提升模型泛化能力。

举例来说,如果一辆汽车不断在多个不同国家、不同路况行驶,云端模型就可以持续进行适应,假以时日模型经过优化,就能够打造更优秀的自动驾驶汽车模型,这是我们通过打造平台,支持终端侧联邦学习的又一范例。

没错,包括出色的推理、机器学习或者INT4等能力在内,这些技术对于汽车同样大有用武之地。

汽车是一个充满挑战的独特领域,它的系统必须能够分辨人类和障碍物、并做到高精准度,否则后果将是灾难性的,这也恰好是AI技术的体现。

借助出色的5G能力,我们就能以超低时延将数据传输到终端,大幅提升安全性。

另一个AI落地的关键领域是元宇宙。

例如,用AR眼镜与周围世界互动时,要实现双手交互功能,就需要用到AI手势检测技术;同时,AR给平面上放置虚拟物体的功能,也需要将AI应用其中……还有不少地方也都会用到AI。

整体而言,我们非常高兴能够跨所有业务线,凭借业界领先的软硬件结合能力,以及高通AI软件栈和Qualcomm AI Studio,引领市场向着充分利用智能网联边缘的方向发展。

我坚信,目前我们所利用的终端侧AI能力只是冰山一角。

未来,终端侧AI需求还会变得越来越多,我们十分期待能够沿着这个方向继续推进,让智能网联边缘成为现实。

(最后,如果想回看大会全程,请点击阅读原文)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/24083.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Stable Diffusion免费(三个月)通过阿里云轻松部署服务

温馨提示:划重点,活动入口在这里喔,不要迷路了。 其实我就在AIGC_有没有一种可能,其实你早就在AIGC了?阿里云邀请你,体验一把AIGC级的毕加索、达芬奇、梵高等大师作画的快感。阿里云将提供免费云产品资源&…

如何通过限制 IP 相关信息 | 控制用户访问站点频率

文章目录 通过 IP 限制反爬实验介绍知识点课程环境 IP 限制实战用 Nginx 限制特定 IP关于 allow 和 deny 的使用说明Nginx 限制 IP 访问频率Python Flask 模拟 IP 黑名单 实验总结 通过 IP 限制反爬 实验介绍 在常规的反爬手段中,IP 限制是应用广泛且比较有效的&a…

win11 报错 你的IT管理员已经限制对此应用一些区域的访问 解决方法

你的IT管理员已经限制对此应用一些区域的访问,你尝试访问的项目不可用。有关详细,请与你的IT支持人员联系。 1.按下wins,在框中输入cmd,右键管理员身份运行 2.在命令提示符中输入 reg add “HKEY_LOCAL_MACHINE\SOFTWARE\Policies\Microsoft\Windows Def…

wordpress开放注册和邮件问题解决

1开放注册 WordPress后台,设置-常规,勾选任何人都可以注册前面的复选框,新用户角色改为作者,保存即可开启。 2新用户注册收不到邮件问题解决 wordpress配置SMTP服务发送邮件(以qq邮箱为例) 第一步、配置邮箱(这里介绍qq邮箱) 我试过多个…

SLAM基础知识汇总【长期更新】

SLAM基础知识汇总 特征点相关 特征点由关键点和描述子构成: 关键点:特征点在图像里的位置描述子:通常是一个向量,描述了该关键点周围的信息,朝向大小等 [ORB-SLAM2] ORB-SLAM中的ORB特征(提取&#xff…

国科大数字图像处理(复习与整理)

图像处理复习笔记: 1、证明一个系统是线性系统2、证明函数卷积的傅里叶变换等于函数傅氏变换后的乘积3、采样定理与混叠4、直方图均衡化第一节课知识点第二节课知识点第三节课知识点第四节课知识点第五节课知识点第六节课知识点第七节课知识点第八节课知识点第九节课…

3D视觉感知新SOTA BEVFormer复现nuscenes数据集测试demo

0 写在前面 分享最近在BEV感知方面的工作,欢迎自动驾驶同行交流学习,助力自动驾驶早日落地。 1.概述 对于自动驾驶而言,BEV(鸟瞰图)下的目标检测是一项十分重要的任务。尽管这项任务已经吸引了大量的研究投入&#…

CCF认证202305-1重复局面

题目背景 国际象棋在对局时,同一局面连续或间断出现3次或3次以上,可由任意一方提出和棋。 问题描述 国际象棋每一个局面可以用大小为 的字符数组来表示,其中每一位对应棋盘上的一个格子。六种棋子王、后、车、象、马、兵分别用字母 k、q、…

地鼠君黑盒测试--小白如何梳理需求,告别听不懂

没有需求文档的痛苦 刚开始作黑盒(功能)测试时,小白难免会遇到这种情况,就是需求梳理不清晰,没有需求文档或者需求文档太简单。这种一开始没人带时,不容易发觉后续测试多痛苦。 笔者一开始时,就…

记一次购买海外服务器的经历和python包管理小记

概述 最近在研究ChatGPT,需要有个服务器一直挂着,刚好看到raksmart在搞活动; 可以关注下,他们的活动页面 https://billing.raksmart.com/whmcs/index.php?rp%2Fannouncements&languagechinese-cn 刚好四月,有便…

No signature of method: build_*.android() is applicable for argument types

意思很直观:就是build的时候,android()的参数错误。 更新android studio 后出现这种问题,主要是新版本的生成的app和module模版有所变化引起的。 Android Studio Electric Eel | 2022.1.1 Patch 1 Build #AI-221.6008.13.2211.9514443, built…

01 Faster R-CNN系列

目录 一、 R-CNN 1. R-CNN流程(4个步骤 ) 2. RP的确定 3. 预训练模型微调(backbone) 4. SVM的分类 5. bbox regression的训练 6. NMS 二、 Fast R-CNN 1. Fast R-CNN算法流程 2. 候选区域生成 3. 预训练模型微调&#…

ChatGPT API 遇见 Tistory:自动化英语学习博客

这是通过集成 ChatGPT API 创建自动化英语学习内容系列中的第三部分。 转发: ChatGPT API Meets Tistory: The Automated English Learning Blogs 项目介绍 介绍 这是通过集成 ChatGPT API 创建自动化英语学习内容系列中的第三部分。 我正在尝试整合各种平台。 第一个是 Se…

cahtgpt算法压力测试(丁真版,更新gpt4(暴风哭泣了已经))

更新 补充了gpt-4版本的答案,只能说牛逼,我收回之前的替代不了高级科研工作者的结论,话不多说上答案: 可以看到这里已经吊打got3.5了,它能把这个问题解释的很清楚了 那么关于GPF算法和varimax的关系呢 可以看到gpt3…

连音乐都可以创作!Google AI部门推出交互式体验

机器学习也能应用在音乐上吗?Google AI部门的Magenta研究项目PAIR计划团队打造出第一个由AI驱动的Doodle服务,Doodle为一项交互式体验,让用户自行创造一段旋律,按下和声演奏(Harmonized)的按钮后&#xff0…

现在程序员的工资是不是被高估了?

图片来源:AIGC 文章来源:www.zhihu.com/question/295009798 韩冬 不是程序员的工资被高估了。而是在中国,IT行业是少有的劳动者议价能力强,能够比较公平的和资方分配公司收入的行业。 最近三十年我国经济突飞猛进,GDP从…

im即时通讯开发/聊天软件系统/社交APP源码搭建/私有化部署聊天原生开发源码快速搭建

由IM技术专家打造的基于 Java 实现的即时通讯(IM)项目 我们提供私有化即时通讯解决方案,独立部署在您自己的服务器上、代码可以开源、支持二次开发、苹果端上线指导,源码出售,提供远程技术指导,全程指导服务…

微分销机制设计_免费快速搭建微信分销商城_OctShop源码

现在微信的流量以及用户基数的庞大,让很多企业或商家都想在微信里面分一杯羹。搭建一个微信分销商城是一个很明智的选择, 而一个比较完善的商城系统,它的设计与开发是庞大复杂的系统工程,比较耗时耗财。 如何快速免费搭建一个大型专业级的微信…

全新开源微商城源码带分销 支持多端+搭建部署教程

分享一个全新版开源微商城源码带分销功能,支持10终端合一,功能强大,含完整代码程序包和搭建部署教程。 系统特色功能一览: 1、一个后台管理所有设备端,支持:电脑H5手机微信ipad微信小程序支付宝小程序百度…

股票左侧交易策略

文章目录 1.散户炒股常见问题1.1.满仓、重仓操作1.2.一买就跌一卖就涨-反复被洗1.3.追高被套1.4.持股数量过多1.5.过分迷恋技术分析1.6.不会逆向思考1.7.没有自己成型的操作策略 2.认识市场、认识主力、认识自己2.1.认识市场2.1.1.A股的本质是政策市 2.1.2.A股的本质是圈钱市2.…