作者|王飞跃,缪青海,张军平,郑文博,丁文文
为贯彻落实国家《新一代人工智能发展规划》,科技部会同自然科学基金委近期启动“人工智能驱动的科学研究”(AI for Science)专项部署工作。
1. 什么是“人工智能驱动的科学研究”,最大的亮点或者特色是什么?
人工智能驱动的科学研究(AI for Science, AI4S)主要是指应用正在兴起的智能科学与技术(IST)来促进和变革传统科学研究方法。AI4S的当前特色是通过人工智能(AI)与机器学习和推理等方法处理和分析大量数据,高效发现数据之间的关联,帮助科学家克服“维数灾难”,更快、更准地理解复杂的自然现象和社会现象。AlphaGo和ChatCPT之后,现有AI技术和成果表明,AI4S能够帮助人类发现 数据中隐藏的规律,有效地助力科学家发现新的现象并提出新的假设。同时,AI也可以用于创建模拟和预测模型,引导探索,使科学家能够测试理论并发现复杂系统的行为。
AI4S虽然是最近才被广为关注,特别是中国正成为焦点,但在国际上已通过各种各样针对的产品开发的DAO(Decentralized Autonomous Organizations/Operations, 即分布式开放自主组织和运行)和针对基础研究的DeSci(Decentralized Science Movements, 即分布式开放科学运动)蓬勃兴起,特色就是利用IST,基于区块链和智能合约的数字组织和数字治理。实际上,AI4S可追溯到AI的创始年代,例如早期华人哲学家和数学家王浩利用原始的IBM计算机进行定理证明并催生计算复杂性科学,AI创始人纽厄尔和司马贺于1956年提出的逻辑推理家(Logic Theorist),他们用今日看来简陋的机器,几分钟就证明了罗素和怀德海费尽十余年心血在其三卷本数学巨著《数学原理》中包含的主要数学定理,以至罗素闻之后感叹:早知今日,何必当初。近几年来,在深度学习的大力推动下,AI4S在数学、物理、生物、材料等领域更是取得了许多令人瞩目的重大进展,简述如下:
在数学领域,求解偏微分方程是流体力学、空气动力学、交通流建模等领域的共性难题。2017年以来,科学家尝试使用机器学习、ResNet、seq2seq模型等技术求解偏微分方程,获得了更快更准的结果。DeepMind 2021 年的工作,开发了基于机器学习的框架,用来引导数学家寻找新模式和证明新定理的直觉灵感。数学家和 AI 研究人员的合作带来了两项发现:一个是Knots理论,监督学习模型帮助找到了两种不同类型的数学结之间的新关系,从而导致了一个全新的定理;另一个是Kazhdan-Lusztig 多项式的证明,这个问题已经提出40 年之久,最终在AI的帮助下得以证明。该框架验证了人工智能如何帮助数学家的新范式。
在物理领域,除了实验数据采集、预处理和分析之外,人工智能方法还帮助科学家设计实验、优化参数。高能物理是最早引入人工智能辅助研究的领域之一。1990 年代,粒子物理学界就组织了一系列高能与核物理人工智能 (AIHENP) 研讨会,报道了使用神经网络和符号人工智能用于事件选择和微扰理论计算。2014 年,人工神经网络赢得了 ATLAS 实验中识别希格斯玻色子的挑战。2015 年,CERN 成立了机器学习工作组来处理大型强子对撞机 (LHC) 产生的海量数据。AI 方法的一些新进展,如生成对抗网络 (GAN),已被用于更快的事件和检测器模拟。最近,DeepMind 在 Nature 上发表了他们的工作:通过深度强化学习对托卡马克等离子体进行磁控制。2022 年报告说,物理学家在通过使用基于包含多年实验收集的 4,618 个样本的数据集的神经网络,找到了质子中存在隐内魅夸克(隐性内含粲夸克,Intrinsic Charm Quarks)的证据,这一发现可能会改变量子色动力学的教科书。
在生物医学领域,AlphaFold是继著名的 AlphaGo 之后人工智能领域的又一大成就。从 2016 年开始,DeepMind 构建人工智能系统来挑战蛋白质结构 3D 预测任务,这对于揭示蛋白质的性质至关重要。AlphaFold 基于大约 100,000 种已知蛋白质的序列和结构训练,增强了预测新蛋白质形状的能力,将预测误差缩小到原子尺度,而计算时间从数年缩减到数分钟,效率得到了显著提升。AlphaFold 数据库中超过 2 亿个蛋白质结构预测已发布以供开放访问,这加速了科学研究,包括拯救生命的药物研究和有前途的发现。AlphaFold 并不是唯一可以预测蛋白质结构的人工智能系统,RoseTTAFold 、ProtENN 也是 AI4S杰出代表,生物界正在使用像 AlphaFold 这样的系统来改进医学、推进针对疑难疾病药物的发现。
在材料领域,人工智能改变了传统以实验和经验为主的材料研发模式。2011年美国提出“材料基因组计划”(Materials Genome Initiative, MGI),旨在解码材料的不同组成成分和性能的对应关系,通过结合计算工具平台、实验工具平台和数字化数据(数据库和信息学)平台,借助高通量计算、大数据、人工智能等技术,有效整合现有的材料研究力量和设备,将高通量实验工具的效能发挥最大,以缩短材料研发周期和研发成本至少50%。2016年Nature发布了哈佛福德学院和普渡大学的研究成果,科研人员利用机器学习算法,用“失败”的实验数据预测了新材料合成,意味着机器学习将改变传统材料发现方式。通过整合元材料(Metamaterials) 、虚拟材料、计算材料,平行材料正通过计算机建立“小材料,大模型”,利用机器学习和平行智能技术,根据所需要的性能预测和引导候选材料,从而加快新材料的研发速度和效率,降低研发成本,提高使用安全性、可靠性和经济性。
AI4S有以下亮点或特色:
首先,AI4S可以处理和分析大量的科学数据,克服“维数灾难”。牛顿正是在前人的研究和观测数据之上提出了万有引力定律,但当今海量的科学数据远超个人的能力和精力。AI技术可以有效地处理从实验、观测和模拟中获得的数据,并从中提取模式、趋势等重要信息,帮助科学家发现新的现象和趋势,推进科学研究的进展,加速更多新时期“牛顿”的诞生。
其次,AI4S可以提供高效的科学计算和模拟,这对于研究复杂的自然现象和系统至关重要。科学家可以使用AI技术来创建高度准确的模型,进行大规模并行模拟,使他们能够预测和测试新的假设,从而加速科研探索的迭代演进。
最后,AI4S更加突出做为科学家的人之核心和关键的作用,强化交叉学科和新文科的主导性,直面其社会和生态效应,提倡人类命运共同体,这正是以DAO和DeSci为代表的新科学和开放运动的本源和实质索求。这一点,似乎被许多注重技术的人士所忽略,但必须引起我们的深入思考和积极回应。
2. 从国际竞争、发展经济、技术储备等角度出发,开展这项工作对我们有何重要性?能带来哪些变革?
AI4S能够提高科学研究的效率和准确性,帮助科学家在更短的时间内做出更多的发现和进展。AI4S正加速推动科学研究的范式转移,一场改变世界格局的科学革命正在发生。
从国际竞争的角度看,AI4S能够快速提高国家的科技实力,AI和Science将相互促进,为各国的科学研究提供更大的竞争优势,加速形成高科技壁垒。不能有效加速AI4S研究的国家,将在这场变革中掉队,最终处于十分被动的地位。从发展经济的角度看,AI4S将加快各个学科领域的基础研究,促进行业应用,科学技术的进步势必会推动现有行业的发展、创造新的行业、新的就业机会。从技术储备的角度看,AI4S助于建立和完善科学技术体系,提高技术储备和创新能力。
AIS的良性发展,必须要有适应“新科学研究范式”的“新组织方式”和“新科研生态”。为此,我们提出的HANOI框架,这是一个包含人类(Human)、 人工世界(Artificial World)、自然世界(Natural World)的有组织化的智能(Organizational Intelligence)研究范式,以DAO和DeSci为基础,同时为 AI4S 和 Science for AI (S4AI)的研究提供公开、公平、公正的可持续性支持。
3. 专项部署工作,紧密结合数学、物理、化学、天文等基础学科关键问题,围绕药物研发、基因研究、生物育种、新材料研发等重点领域科研需求展开,本次专项部署工作结合的学科与围绕的领域有哪些考虑?
专项部署工作,紧密结合数学、物理、化学、天文等基础学科关键问题,围绕药物研发、基因研究、生物育种、新材料研发等重点领域,希望AI4S的学科交叉特色,能够促使甚至迫使传统学科变革,加速迈向交叉化新学科大发展的时代。
以新材料研发为例,人工智能所带来的数据、算力和算法是“AI+材料科学”的三大技术核心。数据方面,原始数据主要来自高通量实验及高通量计算,经过多轮数据清洗,最终获得可建模的数据,并储存于数据库中。算力方面,GPU、云计算等资源为“AI+材料科学”提供了重要的计算支撑。随着高性能计算设备及云计算等科技的发展,算力已逐渐不再成为制约其发展的决定性因素。算法(核心)方面,使用人工智能技术的材料研发,能够在物性预测和新材料研发过程中,基于更强的数据分析能力,同时利用知识工程技术,根据人类知识经验自动优先选择最能提供实验合成和测试所需信息的化合物,简化材料科学家耗费在数据分析、大规模文献查阅和实验等工作上的时间。此外,机器学习已被证明可以有效加速材料的研发进程,通过机器学习获得的材料模型及机理,进而用于材料发现设计。材料模型建立在足够多且质量高的数据之上,建模步骤包括选择合适的算法,从训练数据中进行训练,进而做出准确的预测。
当前,一些新思想和新技术的出现,为AI4S范式创新带来了机遇。例如,由 Web3 和区块链及智能合约技术驱动的DeSci浪潮正在带来科学研究组织方式的变革。
随着人工智能研究进入快速迭代,人们呼吁建立新的研究机制来克服传统科学合作中的问题,例如缺乏透明度和信任等。DeSci 致力于为科学家创建一个开放、分布、透明和安全的网络,以共享数据、信息和研究成果,直接采用数字化、水平化治理,使科学家能够以更公开和公平的方式一起工作。开放分布自治组织(Decentralized Autonomous Organizations)和开放分布自治操作(Distributed Autonomous Operations)是DeSci的实现方式,为人工智能的创新和应用提供了新的组织形式。DAO是一种通过代码运作,运行在区块链网络上的数字组织。DAO通过智能合约进行数字化治理运维,这意味着 DAO 的成员拥有决策和执行行动的投票权,使其成为一个透明和公正的系统。为了应对上述挑战并利用新机遇,学术界基于 DAO 已经完成了一系列工作,我们也提出了 HANOI框架,作为新时期助力AI4S研究的基础。目前, DeSci已涌现成为世界范围的时代潮流,必须引起关注。
4. 当前,我国人工智能领域呈现哪些发展特征?随着这项工作的开展落实,人工智能的又一轮风口是否来临?将产生哪些新的应用浪潮?
当前,人工智能领域的国际前沿发展,已经从以AlphaGo为代表的算法智能(Algorithmic Intelligence, AI)进入到以Chat GPT为代表的语言智能(Linguistic Intelligence, LI)阶段,正在加速进入想象智能(Imaginative Intelligence, II)新时代。未来,人类的科技想象能力将成为第一和最大的科技生产力,知识自动化必须成为社会发展的常态技术,这正是AI4S和DeSci等的本质和目的。我国人工智能领域的研究也符合这一发展特征,国内企业、实验室和高校等各方力量,正紧随国际前沿,力争保持处于第一梯队的态势。
人工智能将不再是过去单点替代的形式,而是真正融入到其他科学及其产业的研发、制造、供应链等各环节中,推动我国制造产业的研发、工艺、流程等核心业务的高效创新。先进的制造技术使构建更复杂的多尺度特征成为可能,从而改变化合物性能,这取决于几何特征、制造技术和工艺参数。如面对新材料研发领域日趋激烈的同质化竞争,AI技术在材料研发过程中带来的诸多底层创新无疑也展现出巨大的价值。
应该说,“人工智能驱动的科学研究”(AI4S)专项部署工作,并不是催生下一轮风口,因为人工智能还没有进入低谷,而是又被新技术进展再次推向新的高峰。在AI4S方面,除了数学、物理和生物等领域之外,人工智能还被用于许多学科。来自 AI 和科学领域的科学家正在研究 AI4S的前沿领域。正如我们所见,人工智能在科学研究中的角色随着深度学习的繁荣而发生了变化。早期,人工智能方法只是作为辅助工具,帮助分析实验数据。如今,人工智能方法已被视为更复杂任务的关键技术,包括定理证明、结构设计和知识发现。
尽管人们对像 AlphaGo、AlphaFold 、ChatGPT这样的进步感到兴奋,但在AI4S成为流行范例之前,我们还有很长的路要走。而且, 教育必须先行,否则无法持续。首先,人工智能与各个科学学科之间的知识差距是显而易见的,研究人员必须有一个学习曲线来学习另一边的技能。而且, 也许人工智能研究人员学习科学中特定领域知识的学习曲线更陡峭,因为建立一个全新背景的知识体系更加困难。相反,在大多数 AI4S案例中,最受欢迎的工具是深度学习模型,它相对容易掌握。其次,目前还没有一个将人工智能与某一科学领域相结合的通用框架。然而, 在 AI 领域,工具和平台已经很成熟并且易于使用,特别是ChatGPT之后,AI的大众化前所未有。当然,在科学领域,也有许多在特定领域里广泛使用的成熟软件。无论如何,我们必须以“小问题、大模型”的理念,“小任务、大设计”的原则,利用AI开发并实施更多像AlphaFold和ChatGPT这样的智能系统来辅助科学研究。我们相信,弥合差距之各种各样的通用平台将在不久的将来出现,使AI4S成为科研的主流,使S4AI成为教育的主体。
5. 随着人工智能的快速发展,人们越来越担忧工作流失以及它对劳动力市场的影响,在缓解潜在的焦虑方面,您认为社会各界可以做些什么?
随着人工智能技术的快速发展,特别是ChatGPT等大模型在内容生成、艺术创作等领域的突破,加快了社会变革。确实有一些重复性的工作可能会被取代,这引起了不少人的担忧。然而,正像百年前的工业革命和半世纪前的信息产业革命展示的一样,作为群体的我们根本无需担心,历史和现实也不许我们担心,特别是担心也根本没有任何用途。工业革命机器没有取代农民,但让许多农民成为工人;信息革命计算机没有取代工人,但让许多工人成为软件工程师, 尽管回归到新时代的码民;智能革命AI 更不会让我们失业,而且,就像百年前的“杰文斯悖论”表明的:人工智能将需要更多的人工,为我们提供更多更好的工作。当然,为了缓解时下的民众焦虑和现实问题,社会各界可以采取以下措施:
首先,引导社会对人工智能的认知和理解。通过宣传舆论,让人们认识到,电灯取代蜡烛、汽车取代马车、电动机取代蒸汽机,每一次技术革命都有很多行业消失,但同时创造出更多的行业,带来更多的机会。
其次,投资于新兴产业。人工智能里的机器学习、深度学习等的进展促进了新产业的诞生,社会各界可以投资于新兴产业,支持小企业和初创企业,以及鼓励创新和创业。这些产业需要更多的人才,有更多的就业机会,更好的生活待遇。
为社会全体提供人工智能驱动的专业及相关行业的教育、科普和培训,帮助人们获取新技能和知识,以适应新的工作、市场需求。实际上,AI4S的基础和关键,是AI for Education (AI4E)和Education for AI (E4AI),变革当代的教学与教育,已成为刻不容缓的任务。
参考文献:
[1] Q. Miao, M. Huang, Y. Lv and F.-Y. Wang, "Parallel Learning between Science for AI and AI for Science: A Brief Overview and Perspective," in 2022 Australian & New Zealand Control Conference (ANZCC), Gold Coast, Australia, 2022, pp. 171-175.
[2] 袁勇, 王飞跃, "区块链技术发展现状与展望," 自动化学报, vol. 42, no. 4, pp. 481−494, 2016, doi: 10.16383/j.aas.2016.c16015.
[3] 袁勇, 王飞跃, 区块链理论与方法, 北京: 清华大学出版社, 2019.
[4] 袁勇, 王飞跃, 区块链+智能制造: 技术与应用, 北京: 清华大学出版社, 2021.
[5] S. Wang, W. Ding, J. Li, Y. Yuan, L. Ouyang and F.-Y. Wang, "Decentralized Autonomous Organizations: Concept, Model, and Applications," IEEE Transactions on Computational Social Systems, vol. 6, no. 5, pp. 870-878, 2019, doi: 10.1109/TCSS.2019.2938190.
[6]丁文文, 王帅, 李娟娟, 袁勇, 欧阳丽炜, 王飞跃, "去中心化自治组织:发展现状、分析框架与未来趋势," 智能科学与技术学报, vol. 1, no. 2, pp. 202-213, 2019.
[7]欧阳丽炜, 王帅, 袁勇, 倪晓春, 王飞跃, "智能合约: 架构及进展," 自动化学报, vol. 45, no. 3, pp. 445−457, 2019, doi: 10.16383/j.aas.c180586.
[8]S. Wang, L. Ouyang, Y. Yuan, X. Ni, X. Han and F. -Y. Wang, "Blockchain-Enabled Smart Contracts: Architecture, Applications, and Future Trends," IEEE Transactions on Systems, Man, and Cybernetics: Systems, vol. 49, no. 11, pp. 2266-2277, 2019, doi: 10.1109/TSMC.2019.2895123.
[9]王飞跃, “SciTS: 21世纪科技合作的灯塔? ,” 科技导报, No. 12, pp. 81, 2011.
[10]F.-Y. Wang, "From AI to SciTS: Team Science and Research Intelligence," IEEE Intelligent Systems, vol. 26, no. 3, pp. 2-4, 2011, doi: 10.1109/MIS.2011.49.
[11]S. Hamburg, "Call to join the decentralized science movement," Nature, 767 vol. 600, no. 7888, p. 221, 2021, doi: 10.1038/d41586-021-03642-9.
[12]F.-Y. Wang, W. Ding, X. Wang, J. Garibaldi, S. Teng, R. Imre, C. Olaverri-Monreal, "The DAO to DeSci: AI for Free, Fair, and Responsibility Sensitive Sciences," IEEE Intelligent Systems, vol. 37, no. 2, pp. 16-22, 2022, doi: 10.1109/MIS.2022.3167070.
[13]W. Ding, J. Hou, J. Li, C. Guo, J. Qin, R. Kozma; F.-Y. Wang "DeSci Based on Web3 and DAO: A Comprehensive Overview and Reference Model," IEEE Transactions on Computational Social Systems, vol. 9, no. 5, pp. 1563-1573, 2022, doi: 10.1109/TCSS.2022.3204745.
[14]F.-Y. Wang, "The Metaverse of Mind: Perspectives on DeSci for DeEco and DeSoc," IEEE/CAA Journal of Automatica Sinica, vol. 9, no. 12, pp. 2043-2046, 2022, doi: 10.1109/JAS.2022.106106.
[15]W. Ding, J. Li, R. Qin, R. Kozma, F.-Y. Wang, "A New Architecture and Mechanism for Decentralized Science MetaMarkets," IEEE Transanctions on Systems, Man, and Cybernects: Systems, 2023.
[16]F.-Y. Wang, "Parallel Intelligence in Metaverses: Welcome to Hanoi!" IEEE Intelligent Systems, vol. 37, no. 1, pp. 16–20, Jan. 2022, doi: 10.1109/MIS.2022.3154541.
[17]Q. Miao, W. Zheng, Y. Lv, M. Huang, W. Ding, F.-Y. Wang, "DAO to HANOI via DeSci: AI Paradigm Shifts from AlphaGo to ChatGPT," IEEE/CAA Journal of Automatica Sinica, vol. 10, no. 4, pp. 887-897, 2023.
[18]F.-Y. Wang, Q. Miao, X. Li, X. Wang, and Y. Lin, ”What does ChatGPT say: The DAO from algorithmic intelligence to linguistic intelligence,” IEEE/CAA J. Autom. Sinica, vol. 10, no. 3, pp. 575–579, 2023, doi: 10.1109/JAS.2023.123486.
[19]F.-Y. Wang, J. Yang, X. Wang, J. Li, and Q.-L. Han, “Chat with ChatGPT on Industry 5.0: Learning and decision-making for intelligent industries,” IEEE/CAA J. Autom. Sinica, vol. 10, no. 4, pp. 831–834, 2023.
[20]J. Zhou, P. Ke, X. Qiu, M. Huang, J. Zhang, "ChatGPT: Potential, Prospects, and Limitations," Front Inform Technol Electron Eng, 2023, doi: 10.1631/FITEE.2300089.
[21]H.Du, S. Teng, H. Chen, J. Ma, X. Wang, C. Gou, B. Li, S. Ma, Q. Miao, X. Na, P. Ye, H. Zhang, G. Luo, F.-Y. Wang, "Chat with ChatGPT on Intelligent Vehicles: An IEEE TIV Perspective," vol. 8, no. 3, pp. 2021-2029, March. 2023, doi: 10.1109/TIV.2023.3253281.
[22]J. Zhang, J. Pu, J. Xue, M.Yang, X. Xu, X. Wang, F.-Y. Wang, "HiVeGPT: Human-Machine-Augmented Intelligent Vehicles With Generative Pre-Trained Transformer," vol. 8, no. 3, pp. 2030-2038, March. 2023, doi: 10.1109/TIV.2023.3256982.
[23]Y. Gao, W. Tong, E. Q. Wu, W. Chen, G. Zhu, F. -Y. Wang, "Chat with ChatGPT on Interactive Engines for Intelligent Driving," vol. 8, no. 3, pp. 2039-2042, March. 2023, doi: 10.1109/TIV.2023.3252571.
END