12月5日,百度副总裁、AI技术平台体系(AIG)总负责人、兼百度研究院院长王海峰接受了财新专访。
这里是视频地址(复制链接打开)👇
http://video.caixin.com/2017-12-05/101180688.html
王海峰表示,人工智能正在成为这个时代技术变革的核心驱动力。其实际作用绝不仅仅在互联网,在各商业领域的渗入,将会给各行各业带来革命性的改变,也会对人们的日常生活产生巨大的影响。
视频里透露了非常多干货,DD工作组专门整理了文字版实录,供大家学习~
🌕🌖🌗🌘🌑🌒🌓🌔🌕
目前人工智能无疑是整个高科技领域最热的概念,百度作为中国人工智能技术发展最快,也是最早布局AI(人工智能)技术的互联网公司之一,被公认为中国AI(人工智能)技术的领军企业。
作为全球最大的中文搜索引擎公司,百度拥有17年的AI(人工智能)技术积累,具备最完整的AI技术布局、语音、视觉、NLP、自然语言处理、知识图谱等AI技术领先业界。AI开放平台,DuerOS和Apollo构成的AI开放生态,使百度占据了AI的制高点。2017年百度更是提出将“ALL IN AI”。为了推动行业发展,目前百度已开放80余项AI核心技术,为创业者提供更多商业化机会。
2017年3月时任百度副总裁王海峰出任AI技术平台体系(AIG)总负责人,王海峰是自然语言处理领域的知名科学家国际学术组织ACL,50多年历史上唯一出任主席的华人,同时也唯一来自中国大陆的ACL会士。曾获2015年国家科技进步奖二等奖,2017年首届全国创新争先奖,并作为负责人承担多项国家级重大项目。
主持人:前一段时间您在清华大学有一个演讲,然后您在里面提到了人工智能可能会给人类带来第四次工业革命这么一个说法。上一个的工业革命浪潮,应该说我们的电脑,互联网给我们人类带来很大的普惠的普及,您认为这一轮人工智能革命会给人类到底带来一个具体的改变是什么呢?
王海峰:我们都知道科技是第一生产力,从第一次工业革命开始,大工业就将巨大的这种自然力。自然科学带进了人们的生产过程,大大提升了生产力,而现在社会科技已经融入人们生产的方方面面。带来了生产力巨大的提升。而人工智能作为第四次工业革命的一个核心科技,必然也会改变人们生产和生活的方方面面,进而会带来整个人类的这种社会关系和社会结构的深刻变革。
主持人:它会带来哪些具体的一些,在日常生活之中大家就能感受到的一些物品,或者是一些行为生活吗?比如说相对应的电脑,我们人工智能会带来哪些,可能以前我们都想象不到的一些产品?
王海峰:首先的现代已经有一些产品,背后都是有非常多的人工智能技术,比如说我们为用户提供信息服务,要做搜索,现在百度的搜索引擎和以前已经发生了非常大的变化,现在应该说就是一个智能的搜索引擎。再比如说我们现在仍然是看新闻获取信息,浏览资讯,但现在的方式和以前也不一样了。
现在更多都是通过人工智能的算法进行个性化对用户进行理解,对内容进行理解,然后给用户推荐他更喜欢的内容。再比如说我们现在正在做无人车,和自动驾驶,一旦这些真正商业化产品化以后,很显然对我们的出行方式会带来巨大的变化,再比如我们做这种智能的语音人机交互。
这种自然的语音的交互实现之后,那就彻底改变了人机交互的方式,这次真正的人工智能爆发是从互联网行业开始的,它影响肯定远远不止互联网行业,也会影响到各行各业。
主持人:在您看来,人工智能的本质究竟是什么。
王海峰:人工智能的本质呢,我认为是让机器像人一样可以去感知世界,更重要的是可以去思考,所以我通常会把人工智能的一些技术分成两个层次,就是感知层面的技术和认知层面的技术。比如说我们人有听觉,有视觉。相应的,如果我们让机器也具有听觉和视觉,这就是我们要做的语音技术,我们要做的计算机视觉技术,里边可以去做语音识别,语音的合成,可以做图像的识别,人脸的识别,视频的分析处理等等,这都是人感知外界的第一步要做的事情,但这并不是人特有的。我们知道其实很多动物也有听觉,也有视觉,甚至听觉和视觉可能比人还灵敏。
那么人特有的是什么呢?是认知层的这些能力。
应该说,比如说人有语言,语言是人所特有的。然后语言同时又是人类知识的载体,知识通过语言不断的凝练传承下来,才有人类逐渐的发展,而这些也需要计算机去掌握。同时人和人之间,比如咱们俩之间有一个互相的认知,人和人之间做用户的画像,而最后任何一个人工智能的产品,往往不是单一技术去支撑的,而是各种不管是感知还是认知的技术综合在一起,针对某一个特定的问题,特定的产品,最有效的解决方案。
主持人:您刚里面提到的一句话,还是我觉得挺重要的,您说提到人工智能的本质是让机器具有像人一样思考的能力,但其实这个观点也有很多科学家和业界的人士反对的,就是让机器人具有思考的能力,难道不是一件很恐怖的事情吗?
王海峰:我们做人工智能呢,其实是让(机器)人具有一定程度的思考能力,但并不是说让机器彻底变成一个和人一样的生物。其实机器会有一些能力会比人更强,现在其实也有很多能力比别人更强,比如存储能力,计算的能力,记住大规模知识的能力,但也有很多能力,我认为机器是永远不会替代人的。科学家也好,工程师也好,在研究人工智能的过程中,并不会把人工智能变成了最后一个去对人造成伤害的技术,而是帮助人们的生活变得更加美好。
主持人:那在全世界范畴之中,您认为人工智能在接下来一段时间率先可能在哪几个领域能够爆发,或者它更具有市场的受欢迎程度?
王海峰:这一轮的人工智能我们刚才说起了。首先是从互联网行业起来的,而互联网行业现在本身仍然有很大的发展空间,所以人工智能对互联网行业本身的这种影响,贡献还远远没有达到顶峰。
主持人:才刚刚开始。
王海峰:对,还有很大的空间。同时除了互联网行业,其实很多行业在受人工智能的改变已经很明显,比如说金融。现在越来越多的互联网金融,互联网金融其实背后也是有大量的人工智能,包括大数据分析等等,这些技术都在起作用,再比如说刚才说起这种智能驾驶,实际上已经不是那么遥远,虽然说完全无人的这种车要上路还有一段时间,但实际上现在智能驾驶技术已经在逐渐用到车里面,已经给人带来很多方便。
主持人:那其实现在很大程度上我们所面临的挑战,就是很多都是处于实验室技术这么一个阶段,怎么把它具体产业化和商业化,其实是所有人都在思考的问题。您也好,百度也好,或者您看到整个产业在这方面,您认为有一些共同可以借鉴的一些地方都有哪一些?
王海峰:有,首先我们得承认,所有的先进的科技最初都是从实验室出来的,这一步是非常重要的。但实验室的技术研究有一个特点,它并不是面向最终的应用中的实际问题去做的,它往往是做了很多假设。在这些假设的前提下,然后去构造这样一个实验的环境,或者准备一些实验的数据,然后基于这样一些假设以及这个假设下的实验环境去做实验,把一个技术得到进步。
但是最终应用中往往并不是单一的技术在起作用,所以在应用中我们通常会注意两件事。
第一是所有最终我们要一个技术实用化的时候,首先要考虑这个实用的环境是什么。在这样一个真实的实用环境下去解决这个实用环境中的问题。
第二,因为需要考虑真实环境,往往不是单一技术突破就行了,而是很多技术组合起来。这些技术我们在实用环境中解决每一个问题的最好的技术,把这些技术最后形成一个综合的整体的方案,达到最好的效果。这个是从实验室到最终产品中间要走的很长的一段路,都是在解决这样的问题。
主持人:人工智能在全世界的范围内,其实中国在这一波浪潮当中,不知道在您的评判当中,它是处于一个什么样的位置?就是我们迎头赶上了,还是说处于中下层,我们核心技术研发力还没有,包括我们中国市场有什么样的特殊性吗?在您看来。
王海峰:在这一论的人工智能浪潮当中,我认为中国整体还是处在一个很先进的位置上,和美国一起处在第一梯队。不管是从科学研究,还是从产品实用化技术的开放和整个行业生态,中国现在都处在一个很好的机遇期。从科研的角度,像深度学习这样的技术,最初原创是在美国,在北美我们是承认这一点。但是呢,中国现在也做了大量的人工智能相关的科研,像我年初参加AAAI人工智能领域顶尖的这种年会,中国的文章和美国的文章基本上各占1/3,其他占1/3,大概是处于这样一个水平。
主持人:我们文章的水准应该也是真实水准。
王海峰:这个会议本身是顶尖的,能够被这个会议录用,本身就是很不容易的一件事情。中国有很多企业现在人工智能都做得非常火热,也有大量的应用成果。而对于我们来讲,其实还有很多,甚至比国外更有优势的一些机会,比如说像PC互联网这个渗透率已经基本上饱和了,但是在移动互联网,尤其是在人工智能的各种新的产品里边,这个渗透率其实还有非常大的增长空间,而且不断创新的产品也会不断出来。
同时还有一个特别好的一点就是,中国整体的用户群还是特别乐意尝试新鲜事物。任何一个新产品出来会有很多用户,很多粉丝迅速跟进在用。任何一个人工智能的技术也好,产品也好,就是在用户不断的使用过程中,得到用户的反馈,得到更多的数据,再不断的改进,所以这一点甚至我们可能是世界上最有优势的。
主持人:中国在人工智能这样一个潮流当中,无论是市场的广度还是包容度都很强,那我们现在面临的一些问题,具体会在哪几个方面就紧居中国市场而言。
王海峰:与其说中国市场,我认为其实可能是世界各国会面临的一些通用的问题。我从几个方面来说:
首先从技术角度来讲,虽然现在人工智能技术发展日新月异非常快,但实际上也是存在风险的。要知道真正,尤其是要在行业里,比如说要投资,要创业,要做一些产品,这时候要知道技术的边界在哪儿,现在人工智能虽然已经能做很多事情了,相比五年十年以前进步非常大了,但这个技术仍然是有边界的,并不是无所不能的。如果我假设说要去投资,投人工智能,就看了几个科幻片,觉得那里面的东西都能做了,就开始投,那肯定会出问题,就是技术本身是有边界的。
第二方面就是市场的风险,因为现在市场大家很看好,这个行业市场有大量的资金,大量的人都进到里边来。但在这个过程中也会产生一些不切实际的预期,而这个时候一旦,比如说预期是不切实际的,最后是无法达成的,这时候就会有很大的落差,就会带来一些问题。
第三方面,我认为是财务方面也要注意,因为人工智能在开始投入的时候,往往现在很多人会愿意投人工智能,对这个行业的发展是有一定好处的,但同时呢,也会出现一些开始投的时候不计代价的去投入,比如要做人工智能相关的业务,还是要知道一个回报的周期的,任何的投资不是无限期的。
主持人:那百度现在在这方面上,您认为在哪些领域是可以做到的,然后又放弃了哪些领域呢?
王海峰:比如说我们现在布局了很多领域,比如从语音到图像处理到自然语言处理的知识等等都有很多布局,然后也取得了很多的成果。但这每一件事我们做到现在的程度,就已经在应用中取得了很多的效果,其实是相当于已经带来了这种应用的收益。
但也并不是说什么都可以做得到,比如我们做了很多年的机器翻译,翻译现在使用量已经非常大,很多用户每天都在用,每天都上亿次在用,对大多数需求来讲也满足得不错,但如果我们把对翻译的期望是做到像这些翻译家这样,翻译翻译到那样的水平,翻译个文学作品那样完美是做不到的,现在是做不到的,不单是现在做不到,在很多年以后也做不到。
主持人:差异在哪儿?差异在情感思维的把握。
王海峰:翻译家到这个比较高的境界,他实际上是一个艺术再创造的过程,这个过程现在电脑还很难做得到。
主持人:您大概给我们介绍一下,百度在人工智能未来一段时间的规划。
王海峰:我们还是比较有层次的,首先最基础的我们有百度研究院,做一些很前瞻的基础的人工智能的研究,再往上一层会做很多应用技术的研究。比如刚才我讲到的,不管是图像的技术,视频的技术,增强现实的技术,语音的技术,还是自然语言处理这事,图谱用户画像等等。再往上一层就是各个业务,比如像搜索,信息流这些百度一直很核心的业务,也包括一些基于AI新兴的这些业务。
像搜索,实际上是在百度大规模投入AI之前就已经有了,对吧,而像智能驾驶也好,还是度秘好多,更多是进入AI技术才产生了这样一些新业务。还有一些是这种平台性的,当然其实像智能驾驶和度秘也是两个平台,我们分别开放了Appollo平台和DuerOS平台,但比如说还有百度云,我们做云和其他公司会有什么区别呢?就是云本身会强调基础设施,强调它的计算存储能力。云本身是C cloud,同时我们A和B加进去,A就是AI,B就是big data,大数据就相当于是人工智能,大数据和云的基础能力三位一体的,这样的话也会产生一些新的业务。
主持人:您是从2010年加入百度的,应该说也是见证了百度人工智能的这么一个历程。在这七年当中,您个人也好,百度也好,其实对人工智能的理解有没有什么巨大的变化,就是有几个阶段。
王海峰:我是百度第二个十年开始的时候加入百度的,因为百度是2000年成立的,其实百度成立之初就是做搜索,搜索背后实际上一直就会有一些人工智能的技术。比如今天我们提了几次的自然语言处理搜索,从开始做的时候就要处理网页上的这些文字,要处理用户输入,就要用一些自然语言处理的方式。我来百度以后做的第一个方向就是自然语言处理,这是现在人工智能也是非常热门的一个方向。后来陆陆续续的做语音,做图像,做深度学习,做大数据等等。做了很多都是人工智能相关的这些技术。
我们认知的变化是什么呢?我觉得有两方面,一方面是从技术角度。从技术角度呢,我刚加入的时候,像现在来说是七年多,八年以前,那时候我们更多是用一些相对传统的人工智能的方法,比如规则的方法,一些统计机器学习的方法在做。经常是解决应用中的一个单点的问题,比如说搜索里,我要解决query(查询)理解的问题,我要解决用户点击怎么反馈的问题。
我用一个算法去解,那时候数据量也没那么大,相对来讲是特定问题,有限的数据集在做。而随着我们整个工作的进展,积累的数据越来越多,然后计算平台也越来越强大,同时算法也在进步。我要加入百度两年以后,就是2012年初,我们就开始去做深度学习的这种技术,然后这样的话,更大的数据,更强的计算能力,再加上我们更先进的算法,这时候整个方法就逐渐的就有一个非常大的变化。更多的是三位一体,大数据,大计算以及先进的算法,三者更好的结合起来,在做这种技术的创新。
第二方面,更重要的是在应用中怎么用这些技术。刚才我说起来开始早期更多就是单点的解决问题,后来越来越多,其实是一个系统性的创新。系统性创新不止体现在,比如我们的搜索系统,后来就基本变成一个彻底的人工智能的系统了,还是产生一些新的业务的时候,往往不是一个技术,一个算法所能解决的,而是针对这个应用问题,很多技术综合起来运用,最后包括实际应用中,实际环境中各种复杂问题,去综合解决这样一个系统性的创新。
主持人:您刚刚也提到,您也是自然语言处理方面的一个专家。您能不能用一个比较具体的过程给我们观众解释一下,百度究竟是怎么做到,让一个机器人能够听懂人是怎么说话的?
王海峰:首先听懂了,既要用自然语言处理的技术,还要用语音的技术。第一步是接收到你的声音信号,我用计算机处理,把它转换成一段文字,这个过程是语音识别的过程,就是从一个声学信号接收进来,转换成一段文字,这个过程语音识别,通常讲我们要用声学模型,去对它这个声音进行建模,转化成文字,我们还要对这段语言进行建模。同时还有一个解码器,就相当于完成这个转换的过程,这是语音识别。
拿到这段文字以后,接下来的事情就是自然语言处理了,因为中文还比较特殊,一段文字放在这儿,中间也没有空格,词和词之间也没有边界,甚至中文的语法和西方语言的语法不一样,中文实际上更多的是靠词语的顺序来表示这个语义的,所以要做这种语法层面的分析,做语义层面的理解,这些都做好了以后其实还不够,这就是语言和刚才我们说感知和认知的区别。
认知层面语言其实是一段文字,但是不仅仅是一段文字。人理解一句话,比如说听到同一句话,可能你的理解和我的理解是不一样的,这个是跟你的背景知识,跟你对这个世界的认知是相关的,所以我们要做这是知识图,要建立知识库,要对整个客观世界进行建模,这些一起支撑着,才能真正理解一段话。
主持人:那您今年3月份的时候担任的是百度AI技术平台的总负责人,这个平台是一个什么构想,当初设立的时候?
王海峰:这个就是相当于人工智能,是有很多通用的这种基础技术要做,所以百度AI技术平台体系就是在做百度所有AI的这种基础性技术工作。这些技术既有刚才我讲像百度研究院做一些更基础的未来的,暂时不见得用到百度产品的技术,同时也要做很多应用技术。这些技术会支持百度所有的业务,但是不限于此,我们这个平台同时也会支持合作伙伴。AI的这种技术能力输出给很多合作伙伴,他们也会对他们的业务产生帮助,这样双方实现一个双赢。
同时我们还会把很多技术开放出去,现在我们已经开放了80项AI的核心技术,很多开发者会基于我们开放的这些技术,再开发他们的产品。我们既会做基础技术的研究开发,也会支持百度内部的业务,也会对外提供支持,提供开源开放,还有一个就是刚才讲更多的围绕技术,同时也希望这些技术不断的探索新的一些商业化的机会,所以虽然百度的AI技术平台体系,但同时也承载着一个探索新的商业化机会的这样一个使命。
主持人:这是度秘也是您在百度期间做了一个非常重要的项目,你以为语音助手在未来会扮演一个什么样的角色呢。
王海峰:我最初做度秘的时候呢,的确是把它定位成一个语音助手,实际上度秘是我们2015年发布的,但在之前我们已经积累了一段时间,我们更早的时候,百度曾经就发布过语音助手,但这个我刚才也说起,其实人对AI这个认知,包括我自己在内,也会有一个升级的过程。它并不仅仅是一种助手,它更多是这样一种新一代的,更自然的人机交互的方式,刚才我说起唤醒自然万物,我们把这个能力赋予各种各样的智能设备,会带来各种设备的更新换代升级。
主持人:它是一种媒介,相当于一个大使的角色。
王海峰:也可以说是一种新的交互方式,这样很重要的一层,人跟任何智能设备打交道都会经过这一步,这个已经远远超越于早期我们在手机上做的那个语音助手的概念。
主持人:但是现在在国外业务,亚马逊也好,美国也好,苹果也好,其实不管您称不称它为语音助手啊,对这一类型的产品其实已经打得非常火热,但是我们国内其实用户习惯还是没有培养起来的,包括产品的体验,坦率的说也比较一般,您对这样一类产品未来在国内,您有具体的规划吗,您想象它在几年规划内会是什么样子?
王海峰:比如说亚马逊的Echo,的确是走得比较快。而国内这个市场是增长很快的,各家也都在做相关的这种工作,我刚才讲起,其实国内整个这个环境是一派欣欣向荣的景象。所以比如说像百度的DuerOS平台,一发布出去以后迅速的,因为我们是跟整个生态合作伙伴一起。
大量的生态合作伙伴就是迅速的加入这个行业里边,的确像亚马逊起步的更早,但我相信国内这方面增长会非常迅速。当然这个过程的这些公司单方面做也不行,肯定最终还是市场接受,用户接受,这个过程也有一个用户习惯培育的过程。
主持人:百度在AI这个领域之中,如果能用最简单的话概括,您认为他的目标是什么?或者他想做什么?他想做成什么样子?
王海峰:几方面,首先是技术上,我们的确是要做最领先的技术,而这个技术不只是说应用技术,同时一些基础研究上,我们也希望有贡献。同时从应用角度呢分为三方面,
一方面是要更好的支撑百度自己的这些业务和产品,让这些产品具有AI的能力,AI给它们赋予最好的核心竞争力。
第二方面就是我们会把百度AI的能力广泛提供给百度各行各业的合作伙伴,帮助他们提升他们的能力。
第三就是开发者,应该说这一次工业革命还处在初期,需要全社会各行各业,各方面的开发者,我们都希望借助百度的AI技术,AI时代让它更快的到来。
主持人:也有人提出来,毕竟算法,核心商业应用场景等等数据都掌握BAT手里面,所以会不会造成BAT强者愈强这么一个状态,那对于中小企业创业者而言在这股浪潮当中有机会吗?
王海峰:我认为当然是有的,首先我承认大公司会有很多优势,有平台的优势,人才的优势,包括数据等等也有一些优势,所以大公司的确会在一些他看中的领域里做得非常好,但是我们今天也讲到,这次人工智能的浪潮会带来一次工业革命,而这次工业革命会影响社会的方方面面,会影响各行各业,这远远不是任何一个公司所能完全垄断的。同时,创业者也有创业者的优势,创业者他可以看到很多这种机会,未来会成为一个很大的机会会出来的,会产生未来新的大公司,新的巨头。
主持人:您认为百度在自己分析和总结的过程中,可能对我们自己而言,面对的最大的挑战是什么?或者说整个BAT其实面临最大的挑战是什么?
王海峰:首先呢,我刚才说了一些人工智能,我们要注意一些什么,比如说技术的边界等等,刚才我说的那些问题,像BAT这样的公司其实一样也需要注意。但另一方面,比如对我们来讲,我们有非常强的人工智能的技术能力,然后也在一些方向上一些产业里,我们在加大投入在落地。技术是基础,但最终有多大成功,还是取决于商业化落地的最终效果和速度。
对于我们来讲,我们一方面不断的夯实这个技术能力。刚才我讲起我负责这个AI技术平台体系很重要一个使命,也是探索这种商业化的机会,所以我们认为最重要商业化落地的能力,速度和最终的效果可能是成败的关键。
主持人:会不会BAT这种,因为已经在前一轮浪潮中,互联网浪潮中占据了这样一个王者的地位,所以它庞大的这样一个管理体系和已经成熟的运行规则,反而是他创新的一种阻力,尤其是在管理上。
王海峰:这个会有挑战,但是解决得好它不会成为阻力,反倒会借助这个平台的优势更好的抓住这个机会。比如说对于百度来讲,就是看到人工智能,这个机会看到的还是很早,布局也很早。然后呢,我们这些也说,其实我们已经要迎接下一幕,就是人工智能这一幕。所以现在百度公司整体的战略,一方面我们仍然夯实技术基础,另一方面要决胜AI时代,实际上这两方面的确会有一些不同。但这个呢,就是相当于公司真的是能很清楚地认识到,把这个战略想清楚,然后这个布局布好。就是我们已经有传统优势在哪里,技术继续做得更牢靠,另一方面会开拓出新的业务了。
主持人:似乎一夜之间,AI吹遍了中国的大地,这股浪潮目前来讲,您认为有一定的泡沫化吗?就仅目前来讲。
王海峰:我认为是这样,任何一个新兴行业,在它发展的时候都会不可避免的带进来一些泡沫,但这个泡沫本身并不可怕。随着这个技术的创新,产品的创新,整个这个行业的发展,慢慢这些泡沫就会逐渐的被挤出,但挤出的结果不是一个灾难性的结果,而是说行业逐渐的在发展成熟,包括整个用户环境各方面,用户的这种认知理解,接受程度也都逐渐成熟。所以我认为泡沫是一个行业发展过程当中肯定会有的,但是没有关系,只要我们真正的看清楚,这个行业会往哪个方向走。
主持人:所以所有行业和投资最重要的就是看清楚,了解它。
王海峰博士于2010年加入百度,现任百度副总裁、AI技术平台体系(AIG)总负责人,兼任百度研究院院长,负责百度研究院、语音技术部、自然语言处理部、知识图谱部、大数据部、视觉技术部、人脸技术部、增强现实技术部、AI技术生态部、及若干创新业务部门等。