文章目录
- 人工智能的发展
- 人工智能应用场景
- 机器学习与深度学习
人工智能的发展
人工智能的产生是在多方面条件共同作用下所实现的。早在数理逻辑初创期,亚里士多德所创立的演绎法,就提出了演绎推理的一般原则,即三段论。在逻辑代数时期,德国数学家莱布尼茨将形式逻辑符号化,从而奠定了数理逻辑的基础。在人工神经网络层面,美国生物学家詹姆士首次阐明人脑结构和功能,为后续建成神经网络模型奠定基础。
而为人工智能的研究提供位置基础的,则是在1946年2月14日研制成功的第一台通用计算机ENIAC。英国数学家图灵于1936年创立了自动机理论亦称为图灵机,他设计了一个实验,试图通过让机器模仿人来回答一些问题,从而据此判断它是否具备智能。直到1956年夏季,人工智能才正式诞生于一次历史性的会议中,此次会议的目的是让计算机更加“聪明”,或者说使计算机具有智能,自此,“Artificial Intelligence”一次被正式采用。
1980-1987年是人工智能发展的黄金时期,专家系统让人们看到了人工智能应用于各种领域的可能性,是AI发展史上的一次重要突破与转折。它可以看做一个智能计算机程序系统,其内部含有大量的某个领域专家水平的知识与经验,采用人工智能中的知识表示和知识推理技术来模拟通常由领域专家才能解决的复杂问题。在后续的发展过程中,虽然也有过波折,但AI技术的发展总体较为平稳,尤其是机器学习、人工神经网络、智能机器人等领域的研究逐渐趋向深入。
人工智能应用场景
当1842年人类第一次开始构思可编程计算机时,就已经在思考计算机能否变得智能。如今,人工智能已经是一个具有很多实际应用和研究课题的领域,并且仍在蓬勃发展着。人们希望的是通过智能软件自动化处理常规劳动、理解语音或图像、帮助医学诊断和支持基础科学研究。
当前的人工智能研究,仍有很大一部分的发展空间,与人类智能的水平相比,人工智能仍具有很多差距和不足。另一方面,在应用领域,人工智能也应该朝着更加丰富的应用场景发展。一些主要的应用场景如下。其中重要的一项就是智能出行领域的应用。随着人工智能技术、云计算、物联网等技术的高速发展,全球出行领域正面临一场前所未有的深刻变革。汽车电动化、智能化、网联化、共享化“新四化”的跨界融合发展,正在重塑出行产业和出行方式。
国内外许多公司目前已经加大投入到自动驾驶和无人驾驶的研究中。例如Google的GoogleX实验室正在积极研发无人驾驶汽车GoogleDriverlessCar,百度也启动了“百度无人驾驶汽车”研发计划。今年在上海临港举办的全球人工智能开发者先锋大会上也有AI智能出行前沿主题论坛。智能出行领域的不断发展,数字化转型已成为行业内的关键词汇,企业也需要通过数字化转型来构建数字化基础设施,实现智能出行服务的高效运营和优化。
另一项具有划时代意义的应用场景就是自然语言处理。自然语言处理是研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法,其基础是各类自然语言处理数据集,是计算机科学、人工智能、计算机和人类语言之间的相互作用的领域,技术难点在于单词的边界界定、语义的消歧、句法的模糊、不规范输入、语言行为等内容。最近引爆科技领域的ChatGPT,围绕ChatGPT打造硬件生态,可能产生新的生态。ChatGPT也在创作诗歌、教育培训、协助办公等领域都有着极高的应用价值,甚至新发布的版本已经能准确地预测风险并合理规避。
机器学习与深度学习
人工智能发展的早期,那些对于人类智力来说非常困难但对于计算机来说相对简单的问题可以很迅速地被计算机解决,就比如那些可以用数学化语言来形式化描述的问题。但对于那些人类可以凭主观思维很容易解决、但无法用形式化语言去描述的问题,才是人工智能面对的真正的挑战。为了解决这样的问题,我们不得不提供一种解决方案,这种解决方案是为了让计算机从经验中学习,并通过层次化概念体系来认识和理解世界,其中每个概念通过与比较简单的概念之间的联系来定义。当我们让计算机通过像人类一样利用已有的经验来获取知识,就不再需要人来形式化的列举出计算机解决问题所需要的所有知识。这种层次化的概念让计算机构建较简单的概念来学习复杂概念。如果绘制出这些概念如何建立在彼此之上的图,我们将得到一张相较于传统机器学习算法而言更“深”(层次更多)的图,出于这种原因,我们将这种解决方案称为“深度学习”。
深度学习是指多层的人工神经网络和训练它的方法。一层神经网络会把大量的矩阵数字作为输入,通过非线性激活方法作为输入,再产生另一个数据集合作为输出。这就像生物神经大脑的工作原理一样,通过合适的矩阵数量。多层组织链接一起,形成神经网络“大脑”进行精准复杂的处理,就像人们识别物体标注图片一样。
在AI早期相对形式化且简洁的环境中,计算机不需要具备很多关于世界的知识就可以解决相应的问题。例如1997年IBM的深蓝国际象棋系统击败了世界冠军Garry Kasparov。但国际象棋实际上是一个相对比较简单的领域,仅仅含有64个位置并只能够以严格限制的方式移动32个棋子。它完全可以由一个非常简短的、完全形式化的规则列表描述,并可以轻松由程序员提前提供。这类抽象的、形式的任务对人类而言是最困难的脑力任务之一,对计算机而言却属于最容易的。
计算机能够轻松打败最好的人类棋手,但直到最近计算机才在对象识别或语音任务中达到人类平均水平。人工智能所面临的一个关键挑战就是如何将人类日常生活所需要的关于世界的巨量主观、直观的知识传达给计算机。人们首先考虑的是人工智能的知识图谱方法,这些项目力求将关于世界的知识用形式化的语言进行硬编码,但都没有实现重大的突破。
这种依靠硬编码的知识体系面对的巨大困难表明,AI系统需要具备自己获取知识的能力,即从原始数据中提取模式的能力,才能更好地解决同类型问题。这种能力被称为机器学习。大体来讲,机器学习就是用算法真正解析数据,不断学习,然后对世界中发生的事做出判断和预测。研究人员不是像传统操作一样亲手编写软件、确定特殊指令集、然后让程序完成特殊任务,相反,研究人员会用大量数据和算法“训练”机器,让机器学会如何执行任务。
引入机器学习使计算机能够解决涉及现实世界知识的问题,并能作出看似主观的决策。在过去很长一段时间里,机器学习的最佳应用案例是“计算机视觉”,要实现计算机视觉,研究人员仍然需要手动编写大量代码才能完成任务。并且,对于许多任务来说,很难知道应该提取哪些特征来组成一个合适的特征集。假如想实现对照片中的车子实现检测,可能会联想到用车轮的存在作为特征,但却很难准确地从像素值的角度描述一个车轮的外观。车轮的外观是简单的几何形状,但它的图像可以因为环境而变得很复杂,各种细节的影响都会极大加剧分析问题的难度。
深度学习则是通过较简单概念构建复杂的概念。它是从机器学习中的人工神经网络发展出来的新领域。早期所谓的“深度”是指超过一层的神经网络。深度学习本来并不是一种独立的学习方法,其本身也会用到有监督和无监督的学习方法来训练深度神经网络。但由于近几年该领域发展迅猛,一些特有的学习手段相继被提出(如残差网络),因此越来越多的人将其单独看作一种学习的方法。
深度学习是AI的途径之一,它并不是一个全新的概念。具体来说,它是一种特定类型的机器学习。人们坚信深度学习可以构建出在复杂实际环境下运行的AI系统,它具有强大的能力和灵活性,将大千世界表示为嵌套的层次概念体系。深度学习已将以前需要视觉专业知识的应用转变为非视觉专家即可解决的工程挑战。深度学习将开发和编写规则算法的应用开发人员所肩负的逻辑重担转至培训系统的工程师。它还为解决应用程序开辟了新的可能性,且这些应用程序在无人工检查员的情况下从未进行过尝试。因此,深度学习使机器视觉变得更易于使用,同时扩展了计算机和相机的精确检查极限。
更深的神经网络层数使深度学习能够学习到更加复杂丰富的特征,从而提高了其在识别、分类、预测等各类任务上的表现。比如网络深度的增加,让神经网络可以从原始数据中自适应地学习到更多高层次、高抽象的特征,提高了数据的表示能力以及解决复杂问题的能力,同时实现端到端的学习,即从原始数据到直接学习得到最终的目标,从而化简了传统机器学习的繁琐手工设计过程,也方便进行模块化设计和组合,建立出更加复杂全面的系统。