谈起人工智能(Artificial Intelligence),英文缩写 AI,人们理解模糊、众说纷纭、喜忧参半,乐观者认为它极大地推动了产业界的进展,是目前乃至未来引领科技前沿的硬核方向之一,悲观者认为即使在某些场景它能解决很多问题,但它所引起的道德问题、伦理问题、失业问题、隐私问题已引起了很多民众的焦虑。而绝大多数民众对它的理解,仅限于“它很热”。的确,近期对于 ChatGPT 的报道与讨论更是强化了乐观者的乐观与悲观者的焦虑,也更是强化了绝大多数民众的认识— “它很热”。 那么什么是人工智能[1][2][3][4]呢?通识的理解,它可以拆成两部分—“人工”和“智能”[1][2]。“人工”就是指“人造的科学和工程的产物”,“智能”就宽泛多了,在研究领域,它主要包含思维、意识过程的模拟以及推理。合起来呢,就可以理解为像人一样的思考的科学和工程的产物。对人来说呢,人吸收信息能整理总结沉淀成知识,也能直接接收知识再综合信息来进行推理和决策。那对于人工智能呢,它的思想也是类同的,它既有信息、 知识性的、只能在设计的程序范围内形成动作的,不具备推理能力、独立意志的弱人工智能,又有在设计的程序 范围外能独立推理及自主决策的强人工智能。下图为作者编辑合成的选自百度图片中的“人工智能”图片。
人工智能是计算机科学的一个分支,该领域的研究从应用层面包含图像分析与理解[5][6]、语音识别理解与合成[7][8][9]、自然语言处理和理解[10][11]、搜索系统、推荐系统[12][13] 、专家系统[14][15]、脑机接口[16][17]、机器人[18][19]、自动驾驶[20][21]、无人机[22][23]和无人船等。下图呈现了我认为各应用的交叉情况。
图像分析与理解中,又包含图像分类、图像识别/检测、图像分割、图像检索,现在我们认证中用到最多的车牌识别、文字识别、人脸识别、指纹识别、字体识别都是图像识别中的细分领域。图像分割在医疗领域应用比较多,比如对CT图像和核磁共振扫描图像中感兴趣的区域进行分割等。在搜索平台可以通过关键字搜索图片,在电商购物平台中已有“以图搜图”应用。语音识别与理解系统还没有发展的很完善,但是应用却已经很广泛,比如小米的小爱同学、苹果的Siri、TCL电视中的小T、小汽车中的语音识别系统和电话客服系统都已经产生了辅助的价值。语音合成,一种会带来机遇与风险并存的技术[24][25],选好适合的应用场景尤为重要。下两图为分别说明图像分析与理解的细分领域和语音识别与理解—Siri助手的功能而编辑合成的选自百度的图片。
说到自然语言处理和理解,它们都既像是技术,又像是应用。说它们是技术,是因为它们也部分支撑着语音识别与合成、搜索系统、推荐系统和专家系统。说它们是应用,是因为它们由机器学习、深度学习、关键词提取算法、关键词排序算法、向量化算法等多种算法作为支撑。谈到搜索系统,我们再熟悉不过了,必应、百度、电商中的搜索、音/视频中的搜索,我们大多数人天天都在用吧。说到推荐系统,电商平台、读书、音/视频平台也应用得很广泛了。说到专家系统,其实所有的搜索系统和推荐系统也都是专家系统。但是之所以单列出专家系统,我认为主要是为没有规律、没有统一的解决方案、又依赖于专家的知识和经验而设计的解决方案的系统。最近异常火爆的ChatGPT[26]就是自然语言处理与理解、专家系统、搜索系统、推荐系统的集大成者,也同样是备受讨论与争议者[27][28]。
谈到脑机接口,它已不单单是科幻片里才有的呈现,在2020年,就有“用活猪演示脑机接口技术”的报道[29],今年也既有“脑机接口新技术为脑疾病诊疗提供新思路”[30]的乐观的声音,也有人们对人伦等不安全因素的担忧[31][32]。机器人在我们生活中有不少应用了,比如扫地机器人,制造业中用到的工业机器人等,医疗机器人、手术机器人、煎饼果子机器人也都有公司在做[33][34][35]。如果未来的机器人,集成了前面提到的所有人工智能技术,那我们人类会不会很恐慌?下图为脑机接口及几种典型机器人图片的编辑合成图片。
谈到自动驾驶,不得不说它也是争议比较大的领域[36][37][38][39],对于它比较通识的理解是自动驾驶汽车,目前,低速自动驾驶小车在自助送、买餐/商品方面已经有了落地的应用。自动驾驶汽车领域,我们关注包括百度在内的前5家路测公里数最多的公司就大概能了解此行业的落地情况了。无人机领域经过资本、技术与市场的角逐,行业生态已基本明朗。无人船相关的书籍不多,它的技术核心也可以归结为低速无人驾驶+船体设计,相关领域被报道的不多,可以参考几个公司的产品[40][41]。下图为自动驾驶餐车/汽车、无人机、无人船的编辑合成来自百度的图片。
特别说明:“人工智能应用”图为原创,其他编辑合成图选材自百度无版权要求的图片,旨在帮助读者理解,并已在图片中标出说明,感谢百度图片团队,如图片版权要求有变或不想被作者编辑引用,请联系作者删除。
参考文献或网址:
[1] Richard Urwin, Artificial Intelligence: The Quest for the Ultimate Thinking Machine[M], 2016. Chapter 2: Chapter 1 What is Artificial Intelligence? - Artificial Intelligence: The Quest for the Ultimate Thinking Machine
[2] Richard Urwin著,吴乔译,极简人工智能[M],电子工业出版社,2018。
[3] 周志明,智慧的疆界:从图灵机到人工智能[M],机械工业出版社,2018。
[4] 王晶、李贵民等,科学+预见人工智能[M],人民邮电出版社,2017。
[5] Rafael C.Gonzalez(拉斐尔·C.,冈萨雷斯),Richcard E.Woods(理查德·E.,伍兹)著,阮秋琦、阮宇智译,数字图像处理(第四版)[M],电子工业出版社,2020。
[6] Kenneth R. Castleman(卡斯尔曼)著,朱志刚、林学、石定机等译,数字图像处理,电子工业出版社,2004.
[7] 韩纪庆、张磊、郑铁然,语音信号处理(第3版)[M],清华大学出版社,2019。
[8] 俞栋、邓力、俞凯、钱彦旻,人工智能:语音识别理解与实践[M],电子工业出版社,2020。
[9] Jan P.H. van Santen, Richard W. Sproat等编,蔡莲红、杨鸿武等译,语音合成,机械工业出版社[M],2005。
[10] 冯建周,自然语言处理,水利水电出版社,2022。
[11] James Allen著,刘群、张华平等译,刘群审校,自然语言理解(第二版)[M],电子工业出版社,2005。
[12] Dietmar Jannach, Markus Zanker, Alexander Felfernig, Gerhard Friedrich著, 蒋凡译,推荐系统[M], 人民邮电出版社,2013。
[13] 李东胜,推荐系统:前沿与实践[M],电子工业出版社,2022。
[14] Joseph C. Grarratano(吉奥克),Gary D. Riley著,印鉴、陈忆群、刘星成译,专家系统原理与编程[M],机械工业出版社,2006。
[15] 尹朝庆,人工智能与专家系统(第2版)[M],中国水利水电出版社,2009。
[16] BJ Fisch, R Spehlmann, Fisch and Spehlmann' s EEG (Electroencephalography) Primer - Basic Principles of Digital and Analog EEG, 1999。
[17] Schomer, Donald L., Lopes Da Silva, Fernando H., Niedermeyer’s Electroencephalography: Basic Principles, Clinical Applications, and Related Fields, 2011。
[18] John J. Crag(约翰J. 克雷格)著,贠超、王伟译,机器人学导论(原书第4版),机械工业出版社,2018。
[19] Kevin M. Lynch(凯文· M.林奇),Frank C. Park(朴钟宇)现代机器人学:机构、规划与控制[M],机械工业出版社,2020。
[20] 刘元盛、杨建锁等,低速无人驾驶原理及应用[M],科学出版社,2019。
[21] 瑞佩尔主编,智能汽车无人驾驶与自动驾驶辅助技术,化学工业出版社[M],2021。
[22] Daniel Frenzel(丹尼尔·弗伦泽尔),Alex Keyes(亚历克斯·凯斯),Tihomir Nedev(蒂霍米尔·奈德夫)等著,韩萌译,无人机详解与剖析[M],人民邮电出版社,2020。
[23] 大疆创新,DJI 大疆创新 - 官方网站
[24] 让数字人出圈的技术秘籍,https://www.shangyexinzhi.com/article/5415726.html,2022.11
[25] 小冰最新融资10个亿,30万数字员工准备大升级|ai|人工智能|微软_手机网易网,2022.11
[26] ChatGPT专题报告:GPT,大模型多模态应用展望,https://baijiahao.baidu.com/s?id=1760215241923928657&wfr=spider&for=pc,2023.3
[27] 两会三人谈丨ChatGPT是一场“虚火”还是颠覆性技术革命?https://baijiahao.baidu.com/s?id=1759897401604443186&wfr=spider&for=pc,2023.3
[28] ChatGPT恐怖的可能性,https://36kr.com/p/2168261136331014,2023.3
[29] 马斯克用活猪演示脑机接口技术:实时读取猪脑信息 心灵感应成真了__财经头条,2020.8
[30] 【新华网】脑机接口新技术为脑疾病诊疗提供新思路----中国科学院,2023.1
[31] 马斯克的Neuralink又被查,脑机接口设备运输中涉嫌传播病毒_澎湃号·湃客_澎湃新闻-The Paper ,2023.1
[32] 脑机接口人体实验申请被拒,https://baijiahao.baidu.com/s?id=1759315976425901943&wfr=spider&for=pc,2023.3
[33] 2021年医疗机器人企业排行榜TOP50(附榜单)-中商情报网,2022.5
[34] 手术机器人公司排名2022已更新,https://baijiahao.baidu.com/s?id=1744109624713214953&wfr=spider&for=pc,2022.9
[35] 北京一地铁口现煎饼果子机器人:全程自动化,三分钟做一套 - IT之家,2023.2
[36] 2022年,自动驾驶的“退”与“进”,https://baijiahao.baidu.com/s?id=1754052010689589326&wfr=spider&for=pc,2023.1
[37] 自动驾驶又进一步 智能汽车基础地图标准体系有望加速落地,https://www.ccn.com.cn/Content/2023/03-13/1148089188.html,2023.3
[38] 【专题报道】新能源汽车自动驾驶未来一片光明-新浪汽车,2023.3
[39] 2023第1家倒下的自动驾驶上市公司-面包板社区,2023.3
[40] 云洲智能官网 无人船艇行业领航者
[41] 雪窦智造无人清漂保洁船Alligator-L350