乾明 雷刚 发自 凹非寺
量子位 报道 | 公众号 QbitAI
刚刚,百度一年AI成绩单官宣。
作为中国AI头雁,百度的成绩单不止代表巨头公司业绩,也代表了技术前沿现状和产业基本情况。
而且诸多进展,也是全新起跑线上全球AI发展的侧影,比如最明显的4大趋势特点:
-
语音语言领衔基础技术突破,AI突破从感知智能进入认知智能时代。
-
巨头玩家忙于打造“底座”优势,搭建生态平台。
-
AI落地进入工业化大生产时代,价值在基础业务中展现,也通过新场景中验证潜力。
-
自主可控性进一步加强,自研芯片服务器量产,并与国产AI框架、算法产生整合优势。
所以百度这份2019年度成绩单,究竟说了啥?又体现了哪些行业共同趋势?
我们提纲挈领、抓取归纳其中要点,从点到面一文看懂。
百度AI的2019:技术→平台→生产力
整份成绩单中,技术突破与生态建设是重中之重,占据了一半篇幅。
剩下的一半中,应用落地与产业升级占据了很大篇幅。
这也体现出了AI当前发展阶段——技术仍旧占据核心,但落地以及产业应用正在被放到更加重要的位置。
整体上来看,百度的成绩单可以分为三大部分:
-
一是基础研究。
-
二是技术生产力转换。
-
三是生态平台的建设。
首先看基础研究,一年包揽了23项国内外竞赛冠军。
集中于百度大脑,语音、视觉、自然语言处理、知识图谱等方面都有成果出现。
特别是语音语言,在2019年迎来阶段性丰收时刻。
语音识别方面,百度提出了流式多级的截断注意力模型 SMLTA,这是全球范围内首次实现流式注意力建模,超越整句注意力模型的性能,大幅提升了语音识别准确率和速度(15%-20%),也是国际上首次实现在线语音识别大规模使用注意力模型。
语音合成方面,针对风格迁移、音色模拟和情感拟人的三大领域内挑战,百度推出语音合成技术 Meitron ,仅需20句话就可以制作一个人的专属声音。
此外,作为认知智能的“奥林匹克”,自然语言处理技术(NLP)的进展在今年最为夺目,全球亮点频出。
代表中国“参赛”的百度,交出了可持续学习的知识增强语义理解框架ERNIE(艾尼),在16 个中英文任务上超越BERT、XLNET,取得SOTA 。
2019年12月,ERNIE在GLUE上登顶第一,并以9个任务平均得分首次突破90大关,刷新榜单历史,超越微软、谷歌提出的一众国际顶级预训练模型。
基于语音和语言方面的突破,百度还提出了基于深度注意网络的多轮响应选择匹配模型——DAM,口语理解能力被大幅提升。
值得一提的是,虽然全球范围内视觉为核心的感知智能已经迈步广泛落地应用期,但在2019年,百度还是秀出了“百尺竿头更进一步”的基础研发实力。
除了形成包括图像、视频、AR/VR、重要垂类、软硬一体化五大方向的特色视觉技术矩阵。
百度还在CVPR 2019豪夺10项冠军,包括OCR、物体检测、视频理解、目标跟踪等图像与视频技术领域。
此次AI复兴,除了算法,另一项重要基础变革在于计算力。
百度也在成绩单中详细分享了突破:
2019年12月,基于百度自主研发的中国首款云端全功能AI芯片“昆仑”的云服务器正式上线,在150瓦功耗下能带来260万亿次定数的AI运算,提供512GB/s的内存带宽。
量产了专为远场语音交互打造的百度鸿鹄芯片,100mW 左右平均工作功耗,即可支持远场语音交互核心的阵列信号处理和语音唤醒能力等等。
而且,百度的算力发展并不仅仅只是单点发展,也已经与算法、飞桨框架连点成线,并交织成了坚实的基础层,形成了协同效应。
通过芯片、连接、系统和调度的协同设计和技术创新,对AI计算架构进行升级,可以提供百万TOPS的强大算力。
正在建造的计算集群,基于百度飞桨研发的AI控制系统,设计年均PUE1.15,基础设施能耗降低70%,每个可用区每年节电超过2亿度,相当于10万户居民一年的用电量。
下一代计算——量子计算方面也有新突破。
研发出国际领先、国内第一的云上量子脉冲系统“量脉”,可将量子计算软件指令(逻辑门)转换成控制量子硬件的脉冲序列,算法性能较同类工具实现成倍的提升,是实现量子软硬件连接的关键桥梁。
当然,区别于科研机构,百度作为企业组织,基础技术突破自然不会止步于理论本身。
在技术转化成生产力方面,百度展示了一幅AI落地全景图。
百度旗下的多款应用与业务中已经转换成了AI引擎,而且其也正在开放能力,共享产业升级红利。
在小度助手5.0 上,成熟应用了全双工免唤醒能力,实现了“一次唤醒,多轮交互”免唤醒词连续对话,这也是全球领先的技术落地。
援引第三方机构数据,第二季度小度系列智能音箱出货量位居全球第二、国内第一,同比增长率高达3700%。
而且技术突破和落地,也进一步打破产品旧边界。作为“音箱”被归类的AI交互硬件,在小度系狂飙突进下,开始真正展现AI时代交互终端的样子——AI音箱不再是音箱。
百度输入法方面,刚才提到的重要基础突破,流式截断的多级注意力模型(SMLTA)已经上线,效果立竿见影,在线语音识别相对准确率,比同领域最优玩家还有高15%。
好消息是,离线语音识别准确率已经达到在线识别水平,且可以实现高精准中英文混合语音输入、方言免切换语音输入,这也是业内首次。
在机器翻译方面,继提出了多任务学习、多智能体联合训练等前沿方法,在2019年WMT评测中取得中英翻译第一,提出了首个具有预测和可控时延的同传模型,也是首个语义单元驱动的上下文同传模型,并研发了语音到语音的同传系统,无需经过语音识别转录,同样是业内首次。
而视觉为代表的感知智能落地,最具业内反响的是自动驾驶。
在业内“华山论剑”顶会CVPR 2019,百度Apollo公开了国内唯一的纯视觉L4级自动驾驶解决方案——Apollo Lite,能够支持对10路摄像头、200帧/秒数据量的并行处理,单视觉链路最高丢帧率能够控制在5‰以下,实现全方位360°实时环境感知,前向障碍物的稳定检测视距达到240米。
相比旋转式激光雷达感知方案,视觉感知方案价格低廉且便于获得。并以计算机视觉和AR技术研发了一种增强现实的自动驾驶仿真系统(AADS),使用激光雷达(LiDAR)和相机扫描街景。
合成虚拟形象也是今年最“性感”的落地应用之一,并且达到了量产的水平。
百度与央视合作打造AI虚拟主持人小灵,亮相央视2019五四晚会;与澎湃新闻合作打造了第一个真人形象的虚拟主播早晚新闻栏目;与浦发银行合作打造了业内首个“金融数字人”。
基于知识图谱的视频语义理解,则已经在百度视频搜索、推荐、内容生成等多个产品上线。
通过对视频的视觉、语音、文本的多模态知识解析,在多元异构知识图谱上建立关联,并通过计算推理,建立对视频的深度语义理解,大幅度提升视频理解效果。
而且AI落地在今年也不再阳春白雪,更多接地气、可以被寻常百姓家感知的科普式方案也引起反响。
比如百度AI开发者大会上,打造了能说会道的机器臂“茶博士”。
利用3D视觉技术,可以对茶杯的位置进行检测和追踪。通过机器人运动规划和控制,可以对工作空间进行碰撞检测,避开障碍物。完成实时规划运动后,可自动生成倒茶轨迹。语音语义联动技术解析,更是让机器人像“人”一般,听得懂,说得好,做得准。
最后,有技术、有落地应用之外,百度更宏大的雄心也徐徐展露——基于技术与应用优势,百度希望更进一步:打造平台,打造生态,成为AI世界的底座。
今年成绩单中,开发生态方面的数据同样非常醒目。
从百度当前的业务布局来看,其已形成了4大底座平台:
-
百度大脑AI开放平台
-
飞桨产业级深度学习开源开放平台
-
Apollo自动驾驶开放平台
-
小度开放平台
并且在2019年都实现了爆发。
百度大脑开放平台已经在语音、视觉、语言等方面实现全面升级,具备深度学习框架、场景化AI能力、定制化训练平台到软硬一体模组和解决方案等。
自2016年以来,百度已开放228项AI能力,开发者数量超过150万,日均调用量突破1万亿次,语音、人脸、NLP、OCR调用量中国第一,是业内最全面、最领先、服务规模最大的AI开放平台。
援引IDC最新报告,百度飞桨与谷歌、Facebook名列前三,领衔中国深度学习平台市场,也是市场份额前五中唯一的国货。
Apollo自动驾驶开放平台已经汇聚了全球156家生态合作伙伴;在全球,有97个国家超过3.6万名开发者使用Apollo开源代码,开源代码数量超过65万,已成为全球最强大、最开放、最活跃的自动驾驶平台。
而且开放能力进一步打破边界,在刚召开的首届Apollo生态大会上,百度Apollo拓展裂变成三大平台:自动驾驶开放平台、车路协同开放平台,智能车联开放平台,成为中国自动驾驶基建国家队代表。
小度技能开放平台上,技能开发者数量已经超过3.7万人,可提供包括游戏、效率工具、网络电台、直播、儿童教育、智能家居等3500多种技能支持。合作伙伴数量已经超过500家,可以控制的IoT智能家居设备已经超过了7000万。
此外,百度还开源了中国首个边缘计算框架BAETYL、自研底层区块链技术,并发布了多个工业级的领域数据集,如大规模自动驾驶数据集、街景图像数据和文字场景数据集、视频精彩片段、场景解析、机器阅读理解、中文句子及相应的开放域信息提取事实数据集等等,来促进算法研究,推动AI发展。
比如下图,就是ApolloScape数据集示例:上半截为彩色图像,下半截是其二位语义标签:
正如百度董事长兼CEO李彦宏所说:“作为一家平台级企业,成就他人、造福社会,这是百度创始初心与能力之所在,更是百度在行业发展关键时刻责无旁贷之所在!”
正是基于如此,百度才能够通过百度智能云的“云+AI”能力,为各行各业大规模输送百度的AI技术成果与平台能力,成效也非常显著。
根据IDC在11月底发布的中国AI云服务市场报告,百度智能云在AI技术、市场和商业上处于中国领先地位,超过了阿里云、AWS等一众厂商。
百度CTO王海峰感慨,百度在2019年提出“人工智能进入工业大生产阶段”,如今他们已经探索了AI进入“工业大生产”的真实路径,推动AI迈入自动化、标准化和模块化的新阶段,并与百度业务以及各行各业的生产实践深入结合,加速产业智能化进程。
在互联网、金融、智能城市、工业制造等行业已经拥有标杆性落地案例。
比如,与中国联通打造的智能客服已经在中国联通三省一基地上线;与央视网共建人工智能研发中心,打造媒体行业的AI软硬件产品;与精研科技打造智能质检车间,提升制造业质检效率,降低用工成本等等。
但百度的技术,并不仅仅希望体现在商业价值上,还希望通过社会价值,展现AI福祉。
成绩单中披露,2019年“百度 AI 寻人”平台,用户发起照片比对超过了36万次,9000多个走失者与家庭重新团聚。
百度还发布了听障儿童无障碍阅读计划,推出了全球首款听障儿童AI手语翻译小程序,能将绘本文字翻译为手语,帮助听障儿童实现无障碍阅读。
此外还将AI应用在了台风路径查询、濒危土家语保护、改造盲人按摩院等方面,进一步发掘AI价值。
所以百度AI如何回答2019?上述种种业绩就是关键要素。
而且巨头玩家年度交卷,自然也是整个AI产业的共性、趋势反映。
正所谓窥一斑见全豹,百度的成绩单又反映出怎样的AI 2019?
百度成绩单背后的全球AI六大趋势
或许你会疑惑,百度上述新突破、新进展,为何发生在2019?
背后有百度的技术积累开花结果,但也是AI发展进程使然。
这也是为什么百度的2019更值得被复盘解读,其中展示全球AI领域发展的六大趋势。
趋势一:CV之后,NLP领域成为下一个突破频出的领域
在百度交出的AI成绩单中,更多的AI突破与生产力转换都集中在语音语言理解方面。
比如语音识别、语音合成、虚拟主播、机器翻译、人机对话、知识图谱等等,并落地到了小度助手、百度地图、百度视频等等产品与应用之中。
这也体现出了整个人工智能当前的技术突破集中点:自然语言处理方向。
计算机视觉是人工智能产业中最为成熟的方向,人脸识别已经进入了寻常百姓家,整个方向彻底进入落地期。
早年围绕这一技术发展起来的第一波AI独角兽,也已经在想办法向更多的方向拓展。旷视发力IoT供应链,依图做起了芯片,而商汤在教育、AR、自动驾驶方向频频发力等等。
与此形成对应的是,NLP方向突破频频。谷歌的BERT直接催生出了更多的变体,机器在自然语言处理与语义理解上更为突出,GPT-2的问世也进一步彰显出了整个方向的创造力与活力。
众所周知,AI可以被划分为“感知智能”和“认知智能”两大版块。
但2012年ImageNet石破天惊开始,感知智能的进展要遥遥领先于认知领域,直观类比来说,感知就像一个人类能考到95分的试卷,而认知领域,够到及格还挑战连连。
于是2019年,全新气象和里程碑进展频频,以语言语音为代表的认知,进入突破期。
趋势二:落地为王,价值重估,AI发展回归理性
2019年,整个人工智能产业变得更加务实。
绚丽的Demo少了,关于将AI应用到产品、落地到场景中呼声更多了。
这是对前些年人工智能领域“大跃进”的最直接回应,AI发展理性回归,从资本方到企业,整个行业的参与者都在要求AI展示“降本增效”,来转化成真实的生产力。
2019年的百度,在落地与AI生产力转换方面再明显不过。
最典型如自动驾驶领域有L4级视觉感知解决方案Apollo Lite和增强现实的自动驾驶仿真系统,对于自动驾驶落地,全球都在要求进入“平民”时代,依靠堆高精尖传感器的“贵族”玩法,市场空间越来越小。
这也是全球自动驾驶经受重估的一年。
国际上,Waymo模式遭遇质疑和重估,摩根大通将其估值调低40%,而在货运领域自动驾驶落地则热火朝天,两种不同形态一对比,才知道“看不见的手”想要的不再是遥远的迷人图景,它想要的是——少废话,证明价值吧。
趋势三:人工智能进入工业大生产阶段,需要标准化、自动化和模块化
在谈到人工智能的时候,很多人都会将其提为“新一轮的科技革命”,并将其比作蒸汽、电力等等。
但现实给出的种种反馈都颇为直接地展现出,在给出这一结论的时候,要用将来时态。从现在到将来缺了什么?
王海峰在2019年提出观点称,前三次工业革命的核心技术都具有很强的通用性,呈现出标准化、自动化和模块化的工业大生产特征。
而人工智能想要如此,自然也需要具备这些特征。这也是人工智能产业向前发展的根本所在。
前些年的人工智能落地,都体现在一个case接一个case的模式,现在进入工业大生产阶段,则要求人工智能体现出更加通用特征,一个产品能够处理多个case,人工智能的能力要标准化、自动化和模块化。
百度的成绩单中,百度大脑、飞桨、小度助手、Apollo等平台,都是百度对这一趋势给出的回应。
飞桨、Apollo等开放平台被国际知名第三方机构波士顿咨询,作为中国AI发展的代表,并在全球范围内与谷歌相提并论,认为开放平台正是巨头优势和推动智能化变革的关键。
由此第四大趋势也愈加风劲。
趋势四:大公司大平台争夺“底座”愈加激烈
毫无疑问,将人工智能转化为生产力需要生产工具。谁提供的生产工具使用的越多,谁就能在生产力转化中占据上风,毕竟这是人工智能驱动的世界底座。
伴随着2019年人工智能落地提速,大公司大平台争夺“底座”愈加激烈。TensorFlow和PyTorch展开“厮杀”。前者推出2.0版本,后者将目光也进一步强化端侧部署,各不相让。
毕竟以深度学习框架为核心的深度学习平台,下接芯片,上承各种应用,是“智能时代的操作系统”。
百度飞桨也在2019年迎来多次进化,推出多端多平台部署的高性能推理引擎Paddle Lite、发布超大规模深度学习模型训练技术等等动作,也为其更好地展开竞争提供了支撑。
国内竞争中,华为加入战局、阿里从底层芯片和架构出发,腾讯也加大开源力度……
所以争夺的AI时代“底座”,也是新时代的“铁王座”。
趋势五:AI向善、伦理问题更受关注
在人工智能技术产生商业价值的同时,如何更好地利用人工智能技术也成为世界范围内被广泛讨论的话题。
在学界,有今年3月斯坦福大学正式成立以人为本AI研究院,李飞飞担任联合主任,推动人工智能研究、教育、政策和实践,以改善人类状况。在业界,Facebook、谷歌等科技巨头在AI应用方面的做法也屡遭抗议与审查。
国内也不例外,关于AI伦理的探讨、探索也在展开。在百度的成绩单中,AI伦理、安全以及社会责任都被着重强调,并给出了探索成果。
一方面是打造了完整的AI安全体系,另一方面在AI向善方面落地:“百度 AI 寻人”平台帮助超过9000个走失者与家庭重新团聚。
AI在台风路径查询、濒危土家语保护、A改造盲人按摩院等方面也都发挥着重要作用。
此外,另一巨头腾讯,也在AI时代变革思考后,把“科技向善”正式写入公司使命和愿景,体现了对新时代伦理的重视。
全球范围内,谷歌的AI军用代表事件则内外广受争议,Facebook年初开始的数据泄露事件则被批判至今……AI时代面临的新伦理、隐私边界,并非说说而已。
趋势六:自主可控正在成为中国AI热词
最后,全球局势带来作用力,中国呈现反作用力。
2019年的断供危机以及“实体清单”威胁,让自主可控成为新的关键词。
在百度成绩单中,完全自主研发的“百度昆仑云服务器”,让中国AI跑在自主可控的AI芯片上,与飞桨、ERNIE等国产算法形成了软硬件一体的核心竞争力。
而且,百度的努力也不仅仅体现在自身体系之中,飞桨还与华为麒麟、寒武纪等国产芯片深度合作,打通深度学习框架与芯片AI算力,提升中国的AI竞争力。
而且更进一步,所有中国AI公司、科技公司,经此一役,已经明白“原创”、“自主”和“脱钩方案”的必要性和重要性。
AI造芯浪潮复兴,依图等算法公司深入AI芯片腹地,联想等公司也推出自主可控防断供方案,国家层面则在底层技术和基础科研方面,前所未有重视。
虽然短期内对所有技术公司形成了挑战,但长远来看,或许也是历史性机遇:
自强则万强。
中国AI人才培养基地,专利申请重镇
对基础和底层重视,最直接体现就是对人才、专利方面的重视。
这一次百度成绩单中,也有重点展示。
今年是百度创立20年,过去20年中,从人才角度而言,国内以技术著称的百度,直接和间接培养了大批人才,成为名副其实的技术领域的“黄埔军校”。
而更令人欣喜的是,百度在AI发展中主动展现出的人才培养心态。
根据百度成绩单,百度AI已经形成了囊括师资培训、学生赛事、课程共建以及教材出版等多个维度产学融合生态。
推出了“全国高校深度学习师资培训班”、“飞桨博士会”、“AI快车道”、“黄埔学院”、“在线深度学习集训营”等项目,一共培养1000名专业教师,助力200+高校开设深度学习课程,为近1000家企业提供技术和应用培训。
而硬件方面,百度上线AI Studio 教育版,这背后是价值超过千万人民币的上千张GPU卡,作为师资培训配套“教具”,免费提供给高校使用等等。
虽然百度人才培养模式,更多出于“底座”雄心,但客观而言,一定会加快中国AI技术进一步普及,以及更多人才带来星火效应。
从整个产业发展而言,乐见其成,也希望巨头投入更大资源。
人才之外,还有专利。
重视基础科研,自然会体现在知识产权能力上。国家工业信息安全发展研究中心12月发布的《人工智能技术专利深度分析报告》中给出例证,百度专利申请数量在国内排名第一,达到5712件,超过第二名近1600件。
在中国专利申请数量超越美国方面,可以说是当为头功。也算是作为国产AI第一大厂的实力和担当。
One more thing…
回顾2019年,正如王海峰所总结的那样,百度AI打造了扎实的底座;推动了真实的改变;创造了值得信赖的未来。
当然,AI突破还在继续、AI落地也还在继续,从这份百度成绩单中我们也能窥见到中国AI领域的一个缩影,让更多人了解AI,也能给大小公司的AI之路提供参考,知晓智能时代变革如今身处何处、未来又走向何方。
不过,每个人都有每个人的AI见证时刻。
所以也想小小互动一下:
2019年里,你印象最深刻的AI事件是哪一个?
— 完 —
2019年度奖项发布!锁定AI Top玩家
50家领航企业、10大商业突破人物、10大最具创新力产品3大奖项出炉。
跟大咖交流 | 进入AI社群
量子位 QbitAI · 头条号签约作者
վ'ᴗ' ի 追踪AI技术和产品新动态
喜欢就点「在看」吧 !