《2022联邦学习全球研究与应用趋势报告》重磅发布,全景展示技术热点与人才画像

本报告为智谱AI团队独家所有,并拥有唯一著作权。智谱研究报告提供给订阅用户使用,仅限于用户内部使用。如引用、刊发,需注明出处为【智谱研究】,且不得对本报告进行有悖原意的删节与修改。

9 月1日至3日,2022世界人工智能大会在上海世博中心举办。在3日下午举办的“数据要素流通技术前沿探索论坛”上,由清华大学深圳国际研究生院知识工程研究中心、北京智谱华章科技有限公司、开放群岛开源社区联合编写的《2022 联邦学习全球研究与应用趋势报告》重磅发布。与会专家还就领域研究与应用趋势等问题展开了圆桌讨论。

数字经济时代,人们越来越重视个人隐私权、政策法规愈发严格、数据协作和隐私保护矛盾日益凸出,隐私计算已然成为全球新兴的一大产业,越来越多的隐私计算平台加入开源的行列。随着《数据安全法》、《关键信息基础设施安全保护条例》、《个人信息保护法》等政策的陆续发布实施,安全行业界对信息安全与隐私数据的重视程度不断升级。

联邦学习(Federated Learning)作为一种隐私保护的重要解决方案之一,自2016年首次由 Google 提出、2018年由微众银行引入国内并率先在 B 端进行创新应用以来,逐渐成为一种解决合作中数据隐私与数据共享矛盾的新路径,被大量应用于金融、安防、医疗、在线推荐系统等领域。近年来联邦学习技术得到了飞速的发展,其研究和应用的发展动向和趋势备受关注。

那么,当前联邦学习的技术发展现状如何?

《2022联邦学习全球研究与应用趋势报告》主要从技术论文发表情况、专利申请、学者地图与画像、主流框架、行业应用,以及发展趋势等几大方面做了系统的阐述,较为全面深入地介绍了联邦学习自2016年诞生以来到2021年的技术研究和应用进展,并展望该技术的未来发展方向与前景。该报告重点突出了对科研实践具有较大影响力的高被引论文及其作者画像的分析,以及知名国际顶会专题研讨会的杰出论文特征,以展示联邦学习领域具有较高技术质量、创新力的科研成果、较高影响力的学者人才。

主要核心要点如下:

“中美双雄”引领全球联邦学习发展

  • 中国和美国的联邦学习论文发布量遥遥领先于其他国家。高被引论文之中有六成以上是来自中美两国。顶会杰出论文之中有45.5%来自美国、31.8%来自中国。
  • 联邦学习全球高被引论文领先的机构是谷歌(8篇)、卡内基·梅隆大学(5篇)。中国的高被引论文量较多的机构是北京邮电大学(4篇)、微众银行(3篇)。在顶会杰出论文量领先机构方面,美国的卡内基·梅隆大学与中国的香港科技大学各以3篇而并列第一。
  • 联邦学习领域的全球高被引论文作者主要聚集在中美。美国的高被引论文作者数量最多,占全球一半,也是中国的2.6倍。
  • 全球专利受理数量以中国地区最多,约占全球受理总量的六成。专利申请数量前三名机构全部是中国机构。
  • 开源框架主要来自中美,其中OpenMined 推出的Pysyft 、微众银行的FATE和谷歌的TFF框架的热度居于全球前三位。

未来联邦学习研究趋势将更多与算法模型和安全隐私技术相关

  • 目前联邦学习研究热点主要聚焦在机器学习方法、模型训练、隐私保护三方面。
  • 未来几年研究趋势将更多涉及算法模型和安全隐私技术,如数据隐私、深度学习、差分隐私、边缘计算、物联网、云计算、移动设备、同态加密、优化问题、沟通效率等。
  • 行业应用越来越成熟,应用研究方向呈现出更多与物联网、区块链、车辆交互、5G/6G等技术融合的态势。

全球联邦学习论文发布量增长较快

基于AMiner 系统,通过关键词组在标题和摘要中检索2016年至2021年论文数据。结果显示,研究时段内联邦学习相关论文共计4576篇,自2016年被提出以来,研究论文数量逐年增多,到2021年的复合年增长率为40.78%。

图|联邦学习研究论文趋势(来源:《2022联邦学全球研究与应用趋势解读》) 

中美两国的联邦学习高被引论文发布量全球领跑

联邦学习的近年来高被引论文发表主要是来自于美国和中国。其中,美国的高被引论文占39.2%,全球最多;中国的高被引论文占26.4%,虽仍居于全球第二位,但数量比上期增加了近10个百分点。德国、英国、澳大利亚与新加坡等国家也拥有一定数量的高被引论文。

 图|联邦学习研究论文趋势(来源:《2022联邦学全球研究与应用趋势解读》)

美国的论文被引用量全球显著领先

联邦学习高被引论文之中,论文总被引用量 TOP 10 国家是美国、中国、澳大利亚、德国、新加坡、英国、印度、日本、以色列和波兰。其中,美国的论文总被引用量明显高于其他国家,占据榜首。报告期内,中国被引用最高的论文是香港科技大学计算机科学与工程学系教授杨强为第一作者、与微众银行AI部门、北京航空航天大学计算机学院的研究人员联合发表的Federated Machine Learning: Concept and Applications.

 图|联邦学习高被引论文引用量TOP 10 国家(来源:《2022联邦学全球研究与应用趋势解读》)

同时,报告还给出了联邦学习的十大算法,分别是:Federated Averaging (FedAvg)、Secure Aggregation、Federated Stochastic Variance Reduced Gradient (FedSVRG)、MOCHA、FedProx、Federated Learning with Client Selection (FedCS)、SCAFFOLD、Agnostic Federated Learning (AFL)、Secure Logistic Regression、Lossless Privacypreserving Treeboosting Algorithm (SecureBoost),并对联邦学习领域高被引论文TOP 10进行了解读。

联邦学习这一新兴技术成为当前国内外学者的研究重点,跨国合作的情况如何?

报告指出,四成以上的高被引论文研究都发生过国际之间科研合作,而中美两国论文合作数量全球最多,高达16篇。在各个国家之间合作发表的高被引论文之中,美国与中国、美国与英国,以及新加坡与中国的合作论文引用量居于前三。在中国的高被引论文之中,有60.6%存在国际之间科研合作。

 图|联邦学习高被论文中外合作情况(2016-2021年)(来源:《2022联邦学全球研究与应用趋势解读》)

七成以上杰出论文来自中美两国

一些人工智能国际学术顶会在年度会议举办期间,专门设立了联邦学习主题研讨会并且评选出联邦学习领域杰出论文,比如 FL -NeurIPS、FL-IJCAI、 FL-ICML 三个顶会系列。基于论文一作的所属国家,发现联邦学习杰出论文来自于美国、中国、瑞士、沙特阿拉伯、新加坡和韩国六个国家,其中,美国的杰出论文占 45.5%;

中国的杰出论文占 31.8%。从一作所在机构来看,美国的 卡内基·梅隆大学与中国的香港 科技大学各分别获得 3 篇杰出论文,并列第一。

联邦学习的学者人才地图与画像

报告对联邦学习的高被引论文学者人才地图与画像进行了分析,指出全球联邦学习学者主要聚集在美国和中国,明显多于其他国家的学者数量。值得注意,美国的高被引论文作者数量全球最多,占全球一半,也是中国高被引论文作者数量的2.6倍.

从机构上看,联邦学习领域高被引学者总量TOP 10机构之中,半数席位被美国机构占据,其余几家机构则来自中国、新加坡,其中,中国电子科技大学与英特尔公司并列第十。

从高被引论文作者的机构属性来看,有26.1%供职于企业;高被引论文作者数量全球前十机构有约一半是企业,而且,谷歌的高被引论文作者数量最多。可见,在联邦学习领域,企业人才是一个不可忽视的研究群体。

 图|联邦学习高被引论文作者供职机构性质分布(来源:《2022联邦学全球研究与应用趋势解读》)

对于联邦学习,学者最关注的技术又有哪些?报告团队通过对AMiner 系统论文的热词分析发现,近年联邦学习领域的研究热点TOP 10热度榜前三位的分别为物联网、区块链和边缘计算。

 图|联邦学习领域研究热点词云图(来源:《2022联邦学全球研究与应用趋势解读》)

在对联邦学习的应用、系统和模型设计和安全隐私三个主题领域的研究趋势进行分析发现,近年联邦学习在物联网、边缘计算、医疗保健、数据库以及推荐方面的应用研究热度逐渐上升。

 图|联邦学习在应用方面的研究热点趋势(来源:《2022联邦学全球研究与应用趋势解读》)

在系统和模型设计方面,从热度持续性看,聚合、优化、鲁棒性、激励机制和公平性的相关研究在研究时段内一直保持着不同程度的热度上扬。

 图|联邦学习系统和模型设计方面的研究热点趋势(来源:《2022联邦学全球研究与应用趋势解读》)

在安全隐私方面,区块链、差分隐私、多方计算、恶意攻击、隐私泄露和同态加密的研究热度总体持续逐年上涨。

 图|联邦学习安全隐私方面的研究热点趋势(来源:《2022联邦学全球研究与应用趋势解读》)

专利在一定程度上能够反映出某项技术的发展方向和潜在前景。报告对全球联邦学习专利申请现状进行了分析,指出全球专利申请呈现出逐年攀升的趋势,目前的专利布局主要聚焦安全与隐私保护方向,以及机器学习方法、模型训练等方面。

近年来受理联邦学习专利申请数最多的地区是中国,有1637件,约占全球受理总量的六成,数量优势非常突出。

 图 | 联邦学习专利申请全球受理局分布(2016-2021年)(来自《2022联邦学全球研究与应用趋势解读》)

从专利申请人来看,联邦学习专利申请量TOP10的机构主要分布在中国和美国两个地区,依次分别占据八席和两席,同时,排名前3名机构都位于中国,依次为支付宝、微众银行和平安科技。

从专利申请地来看,国内近年来联邦学习专利申请量TOP10 省市分别是广东、北京、浙江、上海、江苏、陕西、四川、山东、湖北和安徽,其中包括了较多的沿海地区省市。

联邦学习应用

通过新闻事件分析挖掘和搜索系统NewsMiner数据库,从已公开的新闻数据发现,联邦学习技术的行业应用最早出现在2018年,当时被应用在金融、IT和通信领域,后来几年其应用探索逐渐扩展到智慧城市、教育、汽车等其他多个行业领域。

在金融业的应用

联邦学习在金融业应用目前处于框架设计、合作探索、在几个业务场景中初步试点的阶段。推进联邦学习在金融业应用落地的参与主体主要是科技公司(百度、腾讯、京东等)、互联网金融机构(微众银行、蚂蚁金服等)、少数传统商业银行(江苏银行、浦发银行、建设银行等)等。

在医疗业应用

联邦学习在医疗业应用目前处于研究探索、项目试点的阶段,参与主体不仅有科技公司, 而且有较多的国内外权威科研机构、大学院所、医疗机构。国际性科技期刊 Nature《自然》曾发表关于联邦学习在医疗领域应用的文章,展示出联邦学习技术医疗应用的强大潜力。新冠疫情以来,通过使用联邦学习和来自各地区各医疗机构的数据来开发模型的研究意愿和实践更加强烈。

在电信业应用

联邦学习的最初提出就是为了解决移动设备数据训练问题,可以看作是其在电信业的最早应用。从公开的新闻数据看,联邦学习在电信业应用探索从 2018 年开始至今,应用场景从早期的通信资源分配已扩展到近期的客户体验和精准营销、6G 和卫星网络等。其中的参与主体主要是大型通信运营商、软硬件制造商等。

同时,报告还对联邦学习框架与系统进行了详细分析。

目前,市面上有许多来自于科研机构或企业的关于联邦学习的开源工程。报告通过AMiner 数据库中的新闻数据,按照开源与非开源两类,分析梳理了国内外主要的联邦学习相关系统框架,并列出了10个国内外开源联邦学习框架。

按照Github上的热度排序,开源联邦学习框架排在前三位的分别是OpenMined 推出的Pysyft 、微众银行的FATE和谷歌的TFF框架。

 图|开源的联邦学习框架(来源:《2022联邦学全球研究与应用趋势解读》)

非开源的联邦学习框架基本上都是由企业推出的。根据其正式发布时间进行排序,发现这些联邦学习框架最多集中发布于2020年。其中,发布时间较早的是翼方健数的联邦学习框架,以及星云Clustar的AIOS,两者均于2019年发布;最新发布的是2022年2月中国银联发布的联邦学习平台。

竞争激烈,机遇空前

联邦学习的发展恰好契合了新数字时代规避隐私风险的需求,联邦学习技术的发展趋势如何?又将怎么改变我们的生活?

报告对联邦学习发展趋势进行了分析。在研究趋势方面,通过对AMiner数据库中联邦学习相关论文的分析,生成大数据智能的发展趋势河流图。对比上期热点结果,本期的联邦学习技术研究热度前十主题尽管仍然聚焦于安全与隐私技术方面,但在应用方面发生了一些变化,更加突出了物联网与移动设备方面的研究。

2021 年研究热度前十的的研究主题依次分别是:

Data Privacy(数据隐私)

Deep learning(深度学习)

Differential Privacy(差分隐私)

Edge Computing(边缘计算)

Internet of Things(物联网)

Cloud Computing(云计算)

Mobile Device(移动设备)

Homomorphic Encryption(同态加密)

Optimization Problem(优化问题)

Communication Effiency(沟通效率)

 图|联邦学习技术发展趋势(来源:《2022联邦学全球研究与应用趋势解读》)

从技术成熟度方面来看,联邦学习正处于“创新触发期”(Innovation Trigger),效益评级均为“高”,属于“新兴”技术,到达生产高峰期(the Plateau of Productivity)的时间预计为5-10年,且市场渗透率(Market Penetration)目前依然低于1%。

报告还指出,技术标准化建立与实施是联邦学习技术落地应用的重要依据。如今,联邦学习从技术维度上解决了人工智能发展过程中的安全问题。中国已经成为联邦学习技术的深度参与方,国内企业和科研机构积极参与联邦学习的技术研发和应用,以及标准制定。国际与国内联邦学习标准的相继出台有力促进了联邦学习生态的建立与发展。截至目前,联邦学习生态建设较成规模的有 FATE 开源社区与开放群岛开源社区。

未来,随着人工智能技术和应用的不断升级,联邦学习的技术研发和落地应用还将进一步扩大和深入。联邦学习未来市场与商业化的实际落地将出现更多的异构场景下的应用。

更多优质科技情报类报告可关注“智谱研究”公众号。

版权与法律声明

智谱研究报告版权为智谱AI团队独家所有,并拥有唯一著作权。智谱研究咨询产品是智谱研究团队的研究与统计成果,其性质是供用户内部参考的资料。

智谱研究报告提供给订阅用户使用,仅限于用户内部使用。未获得智谱研究团队授权,任何人和单位不得以任何方式在任何媒体上(包括互联网)公开发布、复制、售卖,且不得以任何方式将研究报告的内容提供给其他单位或个人使用。如引用、刊发,需注明出处为“报告名称(智谱研究)”,且不得对本报告进行有悖原意的删节与修改。

智谱研究报告是基于智谱研究团队及其研究员认可的研究资料所撰写,所有资料源自智谱 AI 后台程序对大数据的自动分析得到。本研究报告仅用作参考资料,智谱研究团队不保证所分析得到观点的准确性和完整性,也不承担任何投资者因使用本产品与服务而产生的任何责任。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/52222.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2022 CCF中国开源大会—开放原子开源创新发展论坛顺利举办!

11月5日—6日,由开放原子开源基金会和中国计算机学会联合主办的2022 CCF中国开源大会(2022 CCF ChinaOSC)于线上成功召开。11月6日,由开放原子开源基金会、中国计算机学会主办,腾讯云计算(北京)…

斯坦福、Nautilus Chain等联合主办的 Hackathon 活动,现已接受报名

由 Stanford Blockchain Accelerator、Zebec Protocol、 Nautilus Chain、Rootz Lab 共同主办的黑客松活动,现已接受优秀项目提交参赛申请。 在加密行业发展早期,密码极客们就始终在对区块链世界基础设施,在发展方向的无限可能性进行探索。而…

港科夜闻|香港科大成立亚洲首个跨国人工智能芯片设计研发联盟

关注并星标 每周阅读港科夜闻 建立新视野 开启新思维 1、香港科大成立亚洲首个跨国人工智能芯片设计研发联盟。为了推动创新和培育人才,为人工智能驱动的未来做好准备,香港科技大学联同斯坦福大学、香港大学和香港中文大学携手成立亚洲首个研发人工智能芯…

2023开放原子全球开源峰会分论坛即将来袭,Pick你最关注的峰会话题!

2023开放原子全球开源峰会即将开启 二十余场分论坛主题重磅首发 聚焦全球开源发展最新动向 前沿技术、行业实践、开源项目与治理等 多场知识盛宴等您来享 为更好地了解大家的参与意向 分论坛投票今天正式启动! 投票时间:5月19-26日 长按识别二维码 …

像FBIF一样做会展数字化,你也有可能吸引数万观众

(点击下载) 2022疫情加时赛,FBIF论坛规模依旧喜人。 观众2w、参与企业4500、品牌方占比65%、展商规模500。 这样的成绩离不开FBIF团队的努力,也离不开FoodTalks网站。 (图片来源FoodTalks网站) FoodTalk…

推动科技教育普惠|2023 开放原子全球开源峰会校源行分论坛即将启幕

科技创新,人才先行,高校作为开源人才培养的主阵地,在开源的发展中扮演着关键角色。 6 月 13 日,2023 开放原子全球开源峰会校源行分论坛将在北京经开区亦创国际会展中心盛大举行。论坛以“聚缘于校、开源共行”为主题,…

CCF中国软件大会2023诚邀全球企业赞助合作!

继2022年以纯线上会议的形式圆满举办之后,2023年CCF中国软件大会(CCF ChinaSoft 2023)将继续由CCF软件工程专委会、系统软件专委会、形式化方法专委会以及复旦大学承办,预期将于2023年11月底或12月初在上海国际会议中心隆重举行。…

音效、配乐素材网站,免费商用

视频剪辑没素材?找不到热门音效?找不到好听的配乐? 有了这几个网站,承包你的所有音效、配乐,重点是免费!!! 1、菜鸟图库 https://www.sucai999.com/audio.html?vNTYwNDUx 菜鸟图库…

炫酷纯音乐小程序的设计与实现

小程序已上线,里面有很多我珍藏的好听的纯音乐哦,扫码直接体验: 如若无法正常使用说明我的服务器已经到期。 小程序的完整源码下载地址:https://download.csdn.net/download/qq_37518622/12313970 很久没有维护了,最…

听杰伦新歌发现QQ音乐元宇宙,权游角色关系可视化地图、VNote 工具(Typora:勿cue谢谢)、最新论文 | ShowMeAI资讯日报

ShowMeAI日报系列全新升级!覆盖AI人工智能 工具&框架 | 项目&代码 | 博文&分享 | 数据&资源 | 研究&论文 等方向。点击查看 历史文章列表,在公众号内订阅话题 #ShowMeAI资讯日报,可接收每日最新推送。点击 专题合辑&…

MATLAB演奏音乐

演奏原理:sound(y,Fs) 以采样率 Fs 向扬声器发送音频信号 y。 Fs 指单位时间对音频信号采样的次数。采样频率的选择应该遵循奈奎斯特(Harry Nyquist)采样理论:如果对某一模拟信号进行采样,则采样后可还原的最高信号频率…

分离歌曲中的人声和背景音乐(tensorflow)

有没有好奇歌星们清唱的声音怎么样?这一讲,我们将歌曲的人声和背景音乐分离出来,使用的网络是RNN。接下来一一讲解怎么实现。 下载数据集 搞机器学习,首先想到的是怎么获取训练的数据,网上有开放的数据集MIR-1k&…

推荐一个在线实现音乐可视化的网站

场景: 可以录入麦克风、MP3等,实现音乐可视化 链接 https://www.uberviz.io/

7个好用到爆的音频、配乐素材网站,BGM都在这里了

现在只要有一部手机,人人都能成为视频创作者。一个好的视频不能缺少的就是内容、配乐,越来越注重版权的当下,音效素材使用不当造成侵权的案例层出不穷。为了避免侵权,找素材让很多创作者很头疼。 今天我就整理了7个可以免费下载&…

每个人都能制作的简易版QQ音乐(HTML+CSS+JQuery)

自制系列二它来了。 如果在制作过程中有如何问题你都可以私信我,我会答复你的。 今天中秋节,首先祝大家中秋节快乐! 因为没什么礼物送给大家,所以在这里给大家安利一份简易版QQ音乐的制作,过程很简单,每…

音乐app、app原型、音乐原型、云音乐、听歌、电台、本地音乐、点赞、收藏、歌单广场、动态、社区、评论、歌词、歌手、主播、视频、云村、下载、翻唱、歌曲播放、订阅、频道、引导页、登录注册、axure原型

音乐app、app原型、音乐原型、云音乐、听歌、电台、本地音乐、点赞、收藏、歌单广场、动态、社区、评论、歌词、歌手、主播、视频、云村、下载、翻唱、歌曲播放、订阅、频道、引导页、登录注册、axure原型 Axure原型演示及下载地址: 登陆 (首次打开) (pmdaniu.com)…

音乐网站设计

设计内容: 音乐网站网站是一款提供在线播放音乐和下载音乐功能的网站,具有音乐排行榜、歌星排行榜、音乐分类三个板块,并提供查询功能,要求如下: ① 页面布局合理,色彩和谐,链接正确&#xff0c…

音乐app、音乐原型、在线音乐、云音乐、听歌、电台、本地音乐、点赞、收藏、歌单广场、动态、社区、评论、歌词、歌手、主播、视频、云村、下载、翻唱、歌曲播放、订阅、频道、引导页、登录注册、axure原型

音乐app、音乐原型、在线音乐、云音乐、听歌、电台、本地音乐、点赞、收藏、歌单广场、动态、社区、评论、歌词、歌手、主播、视频、云村、下载、翻唱、歌曲播放、订阅、频道、引导页、登录注册、axure原型、产品原型 Axure原型演示及下载地址:Axure Cloud - Gener…

【学习笔记】穿T恤听古典音乐

文章目录 1 走进古典音乐1.1 音乐中的自然法则1.2 音乐要素如何模仿1.3 模仿与超越 2 每一天的巴赫2.1 巴赫的故事与作品2.2 对位法2.3 数学之美 3 莫扎特:把日子过成歌剧3.1 《莫扎特传》序曲——唐璜3.2 历史地位与风格演变3.3 咏叹调与宣叙调3.4 《后宫诱逃》3.5…

如何找到能商用的背景纯音乐

很多时候,我们在网上下载的音乐都是不能商用的。如果要商用就必须向作者购买版权授权。对于一些自媒体、博主、小公司等,这将是一笔不菲的费用。那么,哪里有免费可商用的背景配乐吗? 有的,那就是版权协议为CC0的公共音…