格灵深瞳CTO邓亚峰:AI学习的三种路线

导读:人工智能多年来一直是行业热门,AI人才也受各大公司争相聘请。如何能快速掌握AI技能?高水准的AI人才应该具备哪些专业能力?AI大牛是怎么炼成的?格灵深瞳CTO邓亚峰总结的AI学习路线,十分值得一读。

邓亚峰,现任格灵深瞳信息技术有限公司首席技术官,毕业于清华大学,具有16年的计算机视觉和人工智能方向的研发经验。在过去的工作中,他发表过论文十余篇,申请中国专利超过100项,其中已经授权的有95项。他曾任职百度深度学习研究院,负责人脸识别方向,曾经多次带领团队在主流的人脸检测、人脸识别竞赛上取得过优异成绩。其主要的兴趣是关注人工智能特别是计算机视觉技术如何从技术、产品和商业角度在真实世界中大规模落地。

高可用架构:很高兴采访到您。您是AI领域的老兵了,能否简单介绍一下您以及您选择深耕AI领域的初心是什么?为什么看中了AI的发展方向?

邓亚峰:2002年,我本科毕业到清华读研究生,当时很多同学选择的是通信这些当年比较热门的方向,我自己选择AI本身有偶然因素,但后来回想确实是因为自己很喜欢这个方向,感觉让计算机能看懂图像视频中的内容或能识别语音中说话的内容都是非常有趣、很酷的事情,于是就选择了这个方向。

开始做这个方向,主要是出于兴趣和对技术的热爱,感觉做AI是很有挑战很有趣的事情,就进来了。在2012年前的时候,AI因为落地很少,一直都是一个在工业界很冷门的方向,当时做这块的公司很少。我自己能够坚持下来,一方面是兴趣和热爱起了很大的作用,另外一方面,我从一开始就相信AI技术的价值和对我们未来生活的巨大影响。AI可以看作是工业自动化的延申,帮助人从简单重复的工作中解放出来,增强人的能力,提高人的效率,从而让我们过上更好的生活,让我们拥有更好的世界。
 

高可用架构:格灵深瞳在计算机视觉等领域有非常高的知名度,您觉得计算机视觉最大的难点是什么?在落地的过程中,遇到最大的困难又是什么?

邓亚峰:计算机视觉虽然取得了巨大进步,但依然难以真正产品化,往往需要针对场景调整和适配,目前的主要挑战是如何研发出性能指标、成本、支持规模都能够大规模复制的标准化产品。而落地过程中,和其它人工智能技术一样,最大的难点是技术能达到的水平和大家的需求之间没办法百分之百匹配。比如,在过去很多年中,人脸识别需求一直都存在,但技术无法充分满足,也就无法落地。即使在今天,技术依然不是完美的,但我们不能等待技术完全成熟才去落地。所以,当前阶段的主要挑战在于,基于现有不完美的技术,如何综合市场、产品、技术各方面的因素,尽快让技术变成产品、服务落地产生价值,并利用落地产生的营收、数据,帮助人才、技术、产品和市场形成良性循环。
 

高可用架构:数据在AI领域扮演很重要的角色,模型训练通常需要很多的数据,业内一般采用什么方式做数据标注?人肉标记吗?格灵深瞳是怎么做的?

邓亚峰:由于深度学习模型的特点,现在的模型训练往往需要大量数据,以人脸识别为例,往往需要几亿几十亿的数据。用暴力方式标注这么多的数据,一方面成本非常高(一般标注一张图需要几毛钱),另外一方面,很多数据标注任务难度超出了人的能力。我们一般采用了半自动方式进行处理,利用现有算法模型把数据进行预处理,然后将其中机器无法做好而人可以做好的部分采用人工标注,通过数据之间的内在关联来大大减少标注工作量,并提升标准质量。

高可用架构:数学是人工智能的基础,需要学习哪些数学知识才能进入该领域?不同的人工智能方向是否需要掌握不同的算法?人脸检测、人脸识别一般包含哪些算法?

邓亚峰:数学知识对从事人工智能的同学而言非常重要,当前的人工智能主要是基于统计的,同时神经网络中有很多关于求导、矩阵相关的运算,所以,如果可以掌握高等数学、概率统计、随机过程、线性代数或矩阵论相关的知识将会很有帮助。当然,如果已经掌握了机器学习的各种知识,上述的数学知识并不是必需的。而且人工智能是一门需要动手亲历才能掌握的学科,所以,并不一定要先学好上述课程才可以开始人工智能的学习。

不同的人工智能方向,因为有不同的任务,有不同的领域知识,所以需要有不同的模型或者方法来表示,算法上自然会有所区别。比如视觉里面的检测任务就是其它领域较少用到的,而语音识别和语义理解里面会用到很多序列相关的模型,视觉领域用到的会少一些。但现在,语音识别、自然语言理解的方法和机器视觉在方法上越来越统一,不同领域的方法也会相互借鉴,所以,作为算法工程师,最好可以都掌握一些。

人脸检测在早期有相对独立的算法,比如boosting等,但在深度学习时代,人脸检测算法和物体检测的算法基本上趋同,目前使用较多的包括SSD、R-FCN等通用物体检测框架。而人脸识别的整个过程分为检测、特征点定位和特征表示几个模块,其中最重要的特征表示模块,需要利用训练数据的身份信息学习得到普适的人脸表示,除了网络结构设计,最重要的是设计损失函数,早期的特征表示在损失函数上有softmax、contrastive-loss、triplet-loss等方法,近期,softmax的很多改进算法慢慢成为主流。

 

高可用架构:对于想掌握或者提升AI技能的人,能否给他们总结一下快速上手的学习路线?

邓亚峰:对于没有基础的同学,我建议的学习步骤是:
Step1,阅读相关深度学习的基础知识,了解神经网络、SGD优化方法、损失函数等基本概念;
Step2,花一点时间熟悉一个训练框架,tensorflow、pytorch、mxnet任何一个;
Step3,找一个任务上手做,哪怕是MNIST的简单分类任务,遇到问题,自己查资料解决或者找人请教解决,总之,在做中学是效率最高的;完成这个任务后,再找一个更难的任务去完成。

对于想提升的同学,一方面是找一个对自己能力而言更有挑战的任务来完成,另外一方面非常重要的捷径是一定要加入一个很厉害的团队,在团队中学习提高要远远好过自己摸索。

高可用架构:高水平的人工智能人才应该具备哪些专业能力?您觉得普通的人工智能工程师要想成为专家通常需要提升哪些方面的能力?

邓亚峰:在工业界,高水平的人工智能人才,需要在算法能力、工程能力以及对行业和产品的理解能力上都非常强,既要看到大的趋势,和技术的价值,也知道如何将技术通过算法和工程打磨产品化。普通的人工智能工程师如果想提升为专家,先需要在本职工作中,提升算法和工程能力,并扩展自己的视野和技术领域,并慢慢提升在行业和产品上的理解能力。

高可用架构:深度学习对于计算机视觉的意义不言而喻,现在前者基本上也成为了后者的标配,然而一方面,深度学习对于大规模数据具有非常强的依赖性;另一方面,在很多现实应用场景中又往往难以获得大规模的数据,在您看来,该怎样在深度学习和数据的规模间找到平衡?

邓亚峰:深度学习对数据的依赖是由于其模型学习过程中的优化方式决定的,如果想根本上改变,需要优化方式有非常巨大的突破,短期看是比较难的。在实践中,有一些减少数据依赖的方式,比如利用迁移学习思路,利用其它领域的数据训练模型的基底,再用少量领域数据去学习,还比如利用半监督或非监督方法,将大量的未标注数据利用起来。除此之外,还可以考虑利用问题的约束条件,加强对模型的约束,提升泛化能力,减少对数据的依赖。当然,数据增广也是非常重要的提升数据量的方法。在目前的技术条件下,在工业界,如何低成本获取大量标注数据依然应该是最先被想到的方法。

高可用架构:作为 GIAC 的联席主席、AI 专场的出品人兼讲师,本次演讲您将主要从算法、数据、计算等角度来分析打造大规模计算系统上的经验,那在您看来,现在的大规模计算系统的打造存在哪些难点?关键点在哪?以及大规模计算系统有哪些方面的现实意义呢?

邓亚峰:机器视觉的终极目标是希望让各种视觉传感器拥有智能,理解物理世界中人、车、物的特征、身份、行为、关系,将物理世界数字化。目前为止,还没有产生真正的大规模视觉计算系统。打造大规模视觉计算系统的难点和关键在于,一方面需要不断提升算法的准确性和场景适应性,才能在海量数据中,产生可以接受的错误,另外一方面需要不断提升算法的效率并降低成本,使得对于海量数据的处理时间和成本可以承受,第三则是需要配合大数据技术挖掘跨传感器目标间的关系。一旦能够真正打造出成本可接受的大规模视觉计算系统,那么将会在智慧城市、智慧商业等很多领域中对安全、管理和商业运营都会产生巨大的影响,使得线下世界将可以用更加智能、数字化的方式运营,线下世界和线上世界将融合打通,产生更多的商业模式和价值。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/55008.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

格灵深瞳赵勇:计算机视觉在安防、交通、机器人、无人车等领域的应用

赵勇关注的领域主要按照它的产业规模和离现实的关系来综合进行考量 三年前,计算机视觉对于绝大部分人来说,都是一个非常陌生的名词。但是三年过去了,今天如果你身在科技互联网圈,如果你偶尔也会参加一些科技行业的大会&#xff0c…

云从科技在科创板IPO注册获批,收入远高于格灵深瞳同期

近日,证监会披露的消息显示,同意云从科技集团股份有限公司(下称“云从科技”)首次公开发行股票并在科创板上市的注册申请。这意味着,云从科技已经从证监会取得IPO批文(即“上市通行证”)&#x…

格灵深瞳 CEO 赵勇深度总结:揭开国内智能安防与人脸识别的真实现状

[转] http://www.leiphone.com/news/201703/FDSaYcZGDi6iLZho.html AI 技术的成熟,使得由人工智能来自动消化海量监控视频数据成为可能。目前,人工智能已经逐步渗透到安防行业,最终将会把以视频网络为核心的安防产业,重塑为以结构…

FRVT赛程全纪录:格灵深瞳全球排名前五

作者 | 张德兵,格灵深瞳首席科学家&算法部负责人 来源 | 转载自知乎张德兵 最近两个月,格灵深瞳首席科学家&算法部负责人张德兵与算法团队参加了全球人脸识别算法测试(FRVT、Face Recognition Vendor Test)。虽然是第一次参加此比赛,…

格灵深瞳开源量化算法EasyQuant

深度学习给人工智能算法带来了跃阶式的突破,引领了近几年的AI繁荣发展。相应的,“AI”和“AI”落地应用在各产业领域遍地开花。而深度网络模型的嵌入式应用和加速,则是人工智能落地的重要方向。 为了实现深度网络模型的加速,量化…

格灵深瞳上市的背后:AI商业化得打技术牌还是内容牌?

当今时代的人工智能,可谓是正值热潮。随着人工智能应用场景的不断扩展,AI赛道也变得越来越热闹。 近日,AI企业上市大潮又将再添一员。 3月17日,国内知名人工智能科技公司格灵深瞳成功挂牌上海交易所,正式成为A股科创…

格灵深瞳重回视线,沉寂多时后宣布新融资,抢占物联网也备战科创板?

作者|震霆 同步首发至 新芒xinmang.ai 出品|新芒X 公众号|xinmangx 55亿韩元! 当看到这笔投资金额时,多少还是会惊叹一下。 但通过简单换算,差不多3353万元人民币,也就是刚好500万美金&#…

持续高营收增速,格灵深瞳正式成为A股科创板人工智能第一股

成立于2013年的格灵深瞳,是国内计算机视觉行业和算法技术的早期探索者和实践者,在计算机视觉领域拥有大量自主研发的核心算法,并多次在国内外人工智能算法竞赛中夺冠。成立多年来,保持着持续的高营收增速,据招股书显示…

科创板首发过会,格灵深瞳“三变”交出IPO答卷

杨净 发自 凹非寺量子位 报道 | 公众号 QbitAI 就在昨日,格灵深瞳科创板首发过会。 创业8年,这家CV公司,终于向IPO发起最后的冲刺。 格灵深瞳,以视觉感知起家,由前谷歌总部研究院资深研究员赵勇创办,是国内…

格灵深瞳,天才AI公司跌入谷底之后 | 小败局

https://www.toutiao.com/a6714998702441759246/ 文 | 苏建勋 编辑 | 杨轩 一年前入职格灵深瞳时,陈乐就觉得有些不太对劲,“没有加班费,项目提成算进年终奖”,熬到年尾,上司的一句话比北京冬天的风还刺骨&#xff0…

V神身价超过马云,你不知道的天才少年成长历程

作者 | 0x28 本文转载自区块律动BlockBeats 作为以太坊的创始人,Vitalik 究竟有着怎样的成长史?是什么意念在驱动着这位少年前进? 创业 5 年,这位 24 岁的小伙子创办的区块链公司市值高达 3000 亿元,超过马云的 2700 …

格灵深瞳将登陆科创板募资18亿,AI天才未来能否走出巨亏困局?

数据智能产业创新服务媒体 ——聚焦数智 改变商业 又一家顶着巨亏压力的AI公司上市了。 3月4日,上交所发布公告,格灵深瞳首次公开发行股票并在科创板上市。本次发行定价39.49元/股,发行股数不超过4624万股,发行后总股本约1.85亿股…

格灵深瞳发布“深瞳阿瞳目”,体育课离AI越来越近

向上探索更普适的大语言模型,向下寻找更具体的应用场景,AI厂商正在这两条路上狂奔。 在众多应用场景中,教育是AI最重要的应用方向之一。中国有2.91亿在校学生、1844.37万专任教师、2800万台校园终端设备,庞大的用户体量汇聚了海量…

读《徐远的投资课》

双休的周末、阴天,看了段永平的一些资料、阅读了他公开的言论(博客、媒体访谈等),对“价值投资、StopDoingList、“安全边际”等理念想加深认识,于是便找到了这个投资入门课——徐远的投资课。 ☺☺☺原始语音pdf

华为荣耀9升降级系统 | 华为荣耀9变砖后如何救砖 | 华为荣耀9获取BL解锁码以及如何解BL锁 | 华为荣耀9如何通过写ramdisk.img来获取root

文章目录 1. 按2. 通过官方华为手机助手升降级以及修复系统和安装驱动3. 使用百分之五模式刷高维禁用包355来安装指定的系统版本8.0.0.3554. 故意(或意外)刷错包把手机变砖5. 使用救砖模式刷高维禁用包355来安装指定的系统版本8.0.0.3556. 刷B212包以切换…

Android 手机如何改造成 Linux 服务器?

👆 “Python猫” ,一个值得加星标的公众号 剧照 | 《饮食男女》 目录 瞎比比什么都别说,先看看效果怎样?需要什么材料、设备?root 手机为 Android 手机装上 Linux 系统最后 瞎比比 自从没有了学生身份之后&#xf…

手机测试陨石软件,不用仪器检测,肉眼就能教你辨别你手上的陨石!

不用仪器检测,肉眼就能教你辨别你手上的陨石! 近几年,国内逐步兴起了一股陨石保藏热潮。三四年间,不光陨石的价钱飙升,国内陨石保藏商场也日渐成形。四五年前,陨石所带来的经济价值还不为人所熟知。“无人知晓、无人关心、无人过问、无人重视”,山东省出名陨石保藏喜欢者…

基于智能手机传感器数据的人类行为识别

原文链接: http://www.infoq.com/cn/articles/human-behavior-recognition-based-on-smart-phone-sensor-data?utm_sourcetuicool&utm_mediumreferral 人类行为识别的目的是通过一系列的观察,对人类的动作类型、行为模式进行分析和识别,…

android手机连nas,安卓手机照样行 NAS存储器大盘点_群晖 USB Station 2_移动存储新闻-中关村在线...

笔者在发布厅外面的走廊,使用安卓系统的HTC手机连接发布厅里的群晖小型家用NAS网络存储器,实验一下效果如何? 使用安卓系统的HTC手机,安装好DSM4.0系统 同样需要到网上下载相应的安卓版DSM4.0软件,安装后,和…

手机壳释放致癌物质“苯”吗?专家:确实会

央视视屏截图 □记者 宁田甜 贺笑天 文图 核心提示 | 手机壳真的会释放出致癌物质苯吗?在运行中的电梯和地铁里打电话,辐射会是平时的多倍,这是真的吗?针对这些网络传言,大河报《生活实验》栏目,联手央视财…