对话数十位学术合作代表:如何提升前沿技术在商业领域的落地应用?

从去年火出天际的元宇宙,到今年年初的现象级应用 ChatGPT,科技圈似乎从不缺少热门的技术概念与话题。尤其是在云计算、人工智能、大数据等技术呈爆发式增长的背景下,我们愈发体会到前沿技术对于产业产生的深远影响,而这也延伸出了其他问题:前沿技术的边界在哪?如何与具体的应用场景融合?

以上这些问题或许看起来有些抽象、复杂,但我们从阿里巴巴创新研究计划(Alibaba Innovative Research, AIR)中,似乎找到了一些解决方案。自 2017 年开始,每年有大批全球顶尖高校 / 研究机构学者与阿里巴巴集团的工程师,就前沿技术问题展开研究,一方面促进学术研究深入产业;另一方面,AIR计划提供的开放性研究基金和实际的前沿场景,也有效助力了高校青年教师、学术人才的成长和优秀研究型学生的培养。

在过去的 2022 年,共有 15 个项目从众多申报项目中脱颖而出。我们邀约了获奖项目的数十位优秀学术代表,以期深入理解学术界和产业界如何更高效地协同创新,以及对整个行业和社会未来发展的影响。(文末附阿里巴巴年度优秀学术合作项目名单)

一、AIR 计划:做从基础研究到应用落地的“架桥者”

过去,从基础研究到应用落地似乎是横亘在学术界和工业界的鸿沟,这种现象在人工智能领域尤为突出。举例来说,如果一个训练模型没有与实际业务场景磨合,很可能在各种因素的影响下导致正确率的折损。把其类比到学术界与工业界也是如此,如果高校只着眼于理论问题的研究,企业只是生搬硬套,前沿技术的落地情况自然也不尽人意。

阿里发起 AIR 计划的初衷便是在学术界与工业界二者间架起一座桥梁。从这几年的实践效果看下来,企业与高校合作或许是突破应用场景技术难题的结合模式之一。

通过 AIR 计划,高校可以直接定位工业界的痛点问题,再有针对性地进行算法研究,而企业则可以提供算法的落地场景,来验证方案是否可行。两者通过不断的磨合可以定位实际问题、发现真实需求,达到有效的互动。

正如上海交通大学郑臻哲老师在接受采访时提到的:“通过 AIR 计划,我们能接触到工业界的痛点问题,从落地应用的视角思考模型算法研究,进一步加强理论联系实际,做对学术界与工业界都有影响力的工作”。大淘宝技术团队和他将机器学习特别是深度学习技术引入到工业界拍卖机制设计中,成为业界的首次尝试,取得了很多理论和技术上的突破,同时也得到了学术界的广泛关注。一些具备重大攻坚意义的课题也在不断交流、探讨中逐渐变得可行。

如果让我们评价前沿技术探索的实际价值?这个问题或许很难回答,也没有标准答案。但当一项技术在产业界产生实际价值时,前行者会实实在在感受到技术红利,以此为标准来看待这个问题似乎容易了很多。“关键性的技术突破虽然在技术上只是百分之几的变化,但带来的可落地场景却是十几倍的增加”。阿里巴巴淘宝技术团队的咏亮在采访时表示。

基于过去多年校企之间的协同,AIR 计划吸引了全球众多国家和地区的数百余所顶级科研机构参与,包括哈佛大学、斯坦福大学、苏黎世联邦理工学院、新加坡南洋理工大学等高校,中国高校与研究所申请总量的 80% 来自 985 高校和中科院,先后有十几位 IEEE Fellow 和 TR35 与阿里巴巴合作,相关成果通过论文、专利、项目等形式让产业从中受益。

二、平台搭好了,学术界与工业界如何合作实现创新突破?

上述提到的优秀学术项目,为何能取得基础理论和落地应用的双突破?双方打好配合,或许才是让合作价值最大化的关键。基于对多位优秀学术专家的访谈,总结了三点校企合作的实践经验:

第一,双方要找准自身定位。来自浙江大学的尤伟涛有一个很强烈的感慨,他认为:理论研究不仅要上天也要入地,高校做学术时也要考虑应用,否则落地就会很困难;企业也要明确定义出问题,找出学术价值。对此,大淘宝技术吕承飞也表达了相似的观点:“命题需要来源于业务又高于业务,提炼出科学理论问题是尤为关键的一步。”

第二,在优势互通的基础上,打破思维定式。就如同上文所言,高校与企业思考问题的角度其实是不同的,如果各自为营,两者之间的鸿沟只会越来越大,但如果大家能在不断磨合中,持续碰撞思路更有利于双方互通有无。

拿《端云协同超大规模分布式推荐系统的算法研究和系统实现》的推进过程举例,凭借云侧大规模模型实时训练和端侧动态感知用户的双重优势,“端云协同学习”成为了业内备受关注的焦点,并被阿里巴巴达摩院列为 2022 年 10 大技术趋势之一。然而在热潮之下,校企双方在推进时也遇到了一些挑战,“千人千模”中小样本学习过拟合便是其中之一。

受限于端侧只有单个用户的浏览量、点击量等数据,如果只根据用户自己的数据对模型训练,便会遇到中小样本过拟合的问题。上海交通大学吴帆提到:“一开始我们其实被这个问题绊住了,很难突破本地数据的限制。”但在研究过程中逐渐发现,虽然原始数据不能离开本地,但数据特征、训练参数以及一些中间的结果是可以离开本地的,需要把云作为中心服务器的协调特性发挥出来。最终,双方打破了之前的思维定式,有效地解决上述问题。

第三,校企双方在资源上的协同也是项目成功的另一关键要素。在采访《端云协同超大规模分布式推荐系统的算法研究和系统实现》的专家代表吕承飞时了解到。目前,这套体系可以在搜索、推荐、内容理解等场景中应用。

而双方的合作能够取得如此亮眼的成绩,一方面是源于双方对于端云协同技术方向的一致认同,他们认为端云协同可以有效解决人工智能服务最后一公里的问题,也是人工智能进一步发展的必要支撑;另一方面,还离不开阿里在基础设施平台的背后支持。通过阿里巴巴机器学习基础设施 Walle,实现了数据在端云之间的传输,最终才让端云协同发挥出了最大价值。值得一提的是,大淘宝技术团队还在论文中详述了阿里自主研发 Walle 的实现过程,该论文目前已入选了计算机系统领域顶级国际学术会议 OSDI,这也是淘宝系统论文首次入选该国际顶会。

三、坚持长期主义,支持优秀学者发展,创造更大社会价值

如果说校企的高效协同是优秀学术项目取得亮眼成绩的充分条件,那么日积月累的磨合则是双方发展的必要条件。

在和优秀学术项目的专家代表沟通时了解到,大多数项目的推进时间都在 3-5 年左右,AIR 计划更是陪伴了一大批学者经历了从早期起步到逐渐成熟的阶段。例如,浙江大学的尤伟涛老师在博士阶段就参与到了 AIR 计划中;上海交通大学的郑臻哲老师也是在博士后阶段就开始参与......正是这种“坚持长期主义”的精神,让我们看到了探索前沿技术的巨大价值空间。

在这一点上,《数字创意内容的智能设计》无疑是一个具有代表性的学术合作项目。伴随着大模型技术的成熟,AIGC 在近期火出新天际,但实际上这个技术并不是刚刚诞生,其已经有七、八年的发展时间。浙江大学 尤伟涛、李泽健 & 设计事业部不饱几年前就在 AI painting 领域进行探索。虽然现阶段实现了设计领域的应用,支持了鹿班平台产品的功能升级,但实现的过程中其实需要长期的尝试和验证。

阿里巴巴设计事业部的不饱提到:“针对一个痛点问题,高校即使提供了多种解决方案,但企业在实际落地时会发现,以上方案或许都不能在业务中取得成果。所以双方在解决科技问题的路上,其实没有捷径可以走,每一位参与者都要有这种心理认知。”

正是基于长期的投入,双方才在业务上取得不错的成果。在本次《数字创意内容的智能设计》中,面对“设计知识和大数据难以结合、设计创意难以形式化表征、跨媒体情感难以统一表达”等技术瓶颈,项目团队开创性地提出了结合设计经验法则和设计大数据、引入因果推理、支持视听融合的智能设计方法,提出了原型理论支撑的智能设计技术和创意因果推理支持的智能设计技术等。目前,该项目的智能设计能力已经接入鹿班生产平台,可以快速生成多样化的风格背景图片,节约设计生产成本,并且已经帮助成功孵化了鹿班平台中的互动视频产品。

针对《数字创意内容的智能设计》学术项目而言,虽然目前已经取得了小阶段的研究成果,但双方的合作并不会就此止步。三位专家在采访时表达的一致观点是:“随着虚拟空间等新载体以及新技术的出现,一定会产生新的生成素材的需求”。因此,与虚拟 3D 相关的设计素材生成依然是后续规划中的重点方向。除此之外,随着业界对于 AIGC 的接受度越来越高,后续也计划将这些能力更多地运用到实际的业务场景中。

不仅于此,校企合作在应用层面取得落地成果的同时,还会在前沿技术上进行不断地探索。以近期大火的 ChatGPT 为例,在云计算成为稳定的基础设施的背景下,学术界与工业界已经开始向智能化迈进。具体到智能化背后的技术和应用,受访嘉宾在大模型技术的探索与融合方面提出了一些前瞻共识:

一方面,对于统一的基础大模型而言,预计 3 年内将有上千个不同的任务都基于同一个基础大模型,再结合上 RLHF,AI 技术的应用门槛会进一步大幅度降低;对于预训练大模型、视觉大模型等细分层面而言,预计未来将能在节省训练时间的同时,不断提升模型的精准度;

另一方面,受访专家也针对模型的融合层面作出了进一步的预测,知识图谱与神经网络大模型将进一步互为补充与深度融合,大规模符号知识的神经网络化催生知识感更强、知识交互更符合人的预期的人工智能;针对算法模型与系统部署而言,算法模型设计与系统优化调度将紧密结合,形成算法与系统互为反馈的新工业界机器学习迭代研究的新模式。

除了业务应用和前沿技术探索,AIR计划的一些项目也在更大的社会范围内发挥着越来越重要的作用。例如,澳门大学周建涛老师和阿里安全线杨锐合作的《抗媒体传输的高鲁棒伪造图象检测与定位研究》,设计了一套可以有效对抗社交网络传输,且具有高泛化鲁棒性的图像取证技术。其伪造图像取证模型的性能远优于现前沿算法,可在多维度干扰下保持稳定,有望大幅降低各类噪声对伪造检测与定位框架的负面影响。目前这个“假图粉碎机”网站对公众开放,相应技术正在持续迭代,还计划将部分技术开源出去,促进图像篡改检测技术的进步。

四、写在最后

一项前沿技术要想掀起真正的技术浪潮,不仅要在理论方面取得突破,还需要创造出坚实的商业价值和实用价值。在此过程中,仅靠学术界或工业界一方的探索是远远不够的。如何能让学术界与工业界更加紧密地联系起来,是行业内共同的努力方向。

目前,阿里巴巴集团作为行业的先行者,通过 AIR 计划让工程师从业务中定位问题,再与学术研究专家共同携手来攻克问题的模式,大大提高了前沿技术在商业领域的落地应用率。同时,AIR 计划还会向高校老师提供开放性的研究基金,开放实际的前沿场景,助力高校青年教师、学术人才的成长和优秀研究型学生的培养。

除此以外,我们也看到了 AIR 计划的另一个野心——着眼于前沿技术的未来发展方向:如同《数字创意内容的智能设计》早在几年前就开始探索智能设计方向,经过多年的磨合,双方的合作成果已经显现——让设计师能够聚焦解决核心创意任务;在《端云协同超大规模分布式推荐系统的算法研究和系统实现》过程中,上海交通大学吴帆与大淘宝技术吕承飞一直在端云协同方向持续投入,为了给用户提供极致的个性化推荐体验,后续还会将模型的轻量化、个性化做进一步的夯实......

以上提到的前沿技术,只是 AIR  计划的冰山一角。但可以预见的是,随着校企双方的合作持续深入,不仅能够有效地打破学术界与产业界之间的壁垒,更为前沿技术的蓬勃发展起到了一锤定音的效果,也希望这些技术能够带来更大的社会价值。

附:阿里巴巴年度优秀学术合作项目名单

阿里巴巴集团2023“研究型实习生”计划已发布,面向海内外高校学生开放100多个科研选题,研究领域涵盖人工智能、云计算、自动驾驶、量子计算、搜索引擎等,入选者将与阿里团队合作探索前沿技术,优秀实习生有望获得阿里科学家的推荐信。欢迎报名。

点击立即报名2023“研究型实习生”计划

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/36698.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Gartner:数字经济如火如荼,企业该做哪些准备?

从“数据二十条”发布,到国家数据局成立,广大中国企业应该从中嗅到哪些重要信号? “数据二十条”与国家数据局 关注数据领域的小伙伴估计都知道,我国近年来一直高度重视数字经济的发展,尤其是近期更是接连出台针对数据…

快商通与美亚、华大共同申报的AI课题被纳入科技局重大科技项目

近日,厦门市科学技术局对“2022年工业及信息化领域科技计划项目”进行公示,快商通与美亚柏科、华侨大学联合申报的“基于深度学习的可信多媒体鉴定关键技术研究及其产业化应用”课题成功入选厦门市重大科技项目! ChatGPT震惊全球、效果爆棚&a…

近期最火AutoGPT|自主 AI 来了?来看怎么玩!

文章目录 近期最火AutoGPT|自主 AI 来了?来看怎么玩!1. 它是什么?2. 能做些什么?3. 本质是什么?4. 怎么尝试5. 注意点6. 期待 近期最火AutoGPT|自主 AI 来了?来看怎么玩!…

如何同步公众号内容到头条自媒体?

公众号的内容是无法直接同步到头条自媒体当中的,我们需要借助其他工具进行辅助,才能够在其他平台一键发布。在这个大数据时代,有很多自媒体创作者希望自己的作品能够在各大平台进行发布,这样不仅可以第一时间将自己的作品展示给粉…

如何将微信公众号内容同步到头条自媒体?

微信公众号上的内容是无法直接同步到头条自媒体上的,需要我们借助媒体管家才能够进行同步,如果我们想要将微信当中的公众号内容实的同步到头条自媒体,我们可以利用融媒宝,进行一键发布,这样我们就可以第一时间将自己的…

产品设计公司的头脑风暴是什么?

产品设计公司做产品设计的关键方法之一是兼收并蓄。正所谓千人千面,每个人都有着自己的想法。因此,在产品设计的早期阶段,产品的整体构思需要结合每个人的概念来激发产品的设计理念!头脑风暴在任何领域都起着至关重要的作用!产品的不断发展是…

头脑风暴在计算机中的具体应用,什么是头脑风暴,在实际中到底怎么应用

头脑风暴基本概念 头脑风暴是一种激发参与者产生大量创意的特别方法。在头脑风暴过程中参与者必须遵守活动规则和程序。它是重多创造性思考方法的一种,有一个假设的前提是:数量成就质量。 什么时候使用此方法 头脑风暴可用于设计过程中的每个阶段&#x…

思维导图——头脑风暴

前言 最近这段时间我们一直在进行思维导图的学习,听了老师的系列讲课之后又重新激发起了我对学习的激情,根据课堂内容,我做了以下简要总结以及包括自己的个人感受。 主要内容 1、成长性思维 对于学习,我们应该树立终身学习的观…

我,沪漂,33岁,总资产26万...

作者| Mr.K 编辑| Emma 来源| 技术领导力(ID:jishulingdaoli) 上个月,K哥举办了线下读者见面会,参加活动的朋友都是跟了K哥两三年的老读者,大家从工作到生活,都聊得非常融洽,话题也很宽泛。其中有几位读者…

“推荐算法”究竟是什么?这篇科普报告帮你快速了解

省时查报告-专业、及时、全面的行研报告库 省时查方案-专业、及时、全面的营销策划方案库 【免费下载】2023年5月份全网热门报告合集 无需翻墙,无需注册,ChatGPT4直接使用 ChatGPT提词手册,学完工作效率提升百倍 马斯克谈AI:中美差…

体验丝滑,用 Cloudflare Workers 直连 GPT-4

这篇文章特别适合有下列特征的读者朋友: 嫌 US 代理慢,担心挂代理访问 ChatGPT 被封控封号。 想用 GPT-4,但嫌 ChatGPT Plus 贵。 经常更换 api token(懂的都懂)。 众所周知,在 Open AI 苛刻的风控下&a…

来啦|深度讲解风控模型中的参数调优

大数据时代的风控体系必有模型部分的参与,用策略贯穿整个风控体系,以数据为驱动,模型一定是标配内容。于是在模型的建设上,如何精细化地输出一套有效的模型,就是在精细化管理上非常重要的一个差异点。不管传统的逻辑回…

风控模型算法

目录 1 蚂蚁金服2 陆金所3 京东金融4 苏宁金融5 百度金融6 腾讯理财通7 宜信8 钱大掌柜9 万达金融10 网易理财11 美团金融 主要是整理目前市面上的风控模型以及风控算法。(不间断更新中) 1 蚂蚁金服 (1)对接第三方征信公司芝麻信…

[Python] 500万彩票网微信推送中奖号码

有时候回家偶尔经过彩票店,也会花个小钱买个希望,嘿嘿。不过更多的是忘记去看看有没中奖。想想还是写个爬虫,爬下500万彩票网的大乐透和双色球信息吧。通过调用企业微信来推送。。。阿门,什么时候来个大奖砸晕我吧。 参考http://w…

兼职项目分享,在家就可以做的八个副业项目,利用业余时间增加收入吧

很多人都希望能找到一个合适的项目去赚钱,但是又不知道自己适合做什么。今天小编就来给大家分享八个可以赚钱的项目,做好了完全可以当主业。 咸鱼一件代发 咸鱼上有很多二手商品出售,其中也有不少的无货源专卖店,像有一些卖抽纸的…

推荐一个比较好的国外软件项目外包网站(比较适合兼职)

友情提示:网上兼职有风险,请大家谨慎,小心骗子,多用网站的中介功能(escrow payment) 描述: 这个网站在国外兼职网站中的地位就相当于新浪在国内新闻网站的地位 注意事项: 这个项目…

Python兼职有哪些?最适合学生党的Python兼职攻略

Python很火。 现在不止程序员学python,运营/产品/金融/财会/行政等、甚至客服行业,如果你会Python,至少可以释放你60%的重复劳动,让你拥有更多专注去提升自己,让自己在职场有不可替代的技能。 学习编程不仅仅可以帮你…

程序员去哪接私活?分享10个兼职平台,人已赚麻

你们当程序员不会都拿着几千、万把块钱的死工资吧,今天为大家分享一些可以接私单的平台,我反正已经赚麻了。 如果你的工作相对没那么费时间,可以空闲的时候去接点私活。或者是还没有找工作之前,可以通过一些平台接一些兼职&#…

Python兼职有哪些?最适合学生党的Python兼职攻略以及接私活经验~

Python很火。 现在不止程序员学python,运营/产品/金融/财会/行政等、甚至客服行业,如果你会Python,至少可以释放你60%的重复劳动,让你拥有更多专注去提升自己,让自己在职场有不可替代的技能。 学习编程不仅仅可以帮你…

推荐一款兼职小程序

真正的大师,永远都怀着一颗学徒的心! 推荐这么多项目,除了方便同学们好找之外,也算是对自己搜集的项目的一个总结,一个积累。以后,遇到了类似的项目,可以做个参考。也不至于,做什么项目都从头来…