互操作性(Interoperability),也称为互用性,即两个系统之间有效沟通的能力,是机器学习未来发展中的关键因素。对于银行业、医疗和其他生活服务行业,我们期望那些用于信息交换的平台可以在我们需要时无缝沟通。 我们每个人都有成千上万个数据与我们的生活息息相关,涉及我们的健康、财务状况以及生活中的其他重要方面,这也解释了为什么可以利用机器学习和人工智能 (AI) 的最新发展,从而使我们在数据协同工作中受益。
互操作性的应用: 医疗
我们可以以医疗为例,来说明可互操作的机器学习技术将如何改善我们的生活。譬如像 CT 扫描这样的高科技医疗程序。它能为单个患者自动生成大量传感器数据。这些数据不同于医生在例行检查时手动输入专有数据库的健康信息。如果没有一种方法来快速、自动整合这两种类型的数据进行分析,就会错失快速诊断重大疾病的可能性。 因此,就产生了对各种不同的信息模型进行优化的需求。就互操作性而言,当前的方法对旧系统非常不友好。随着机器学习和机器学习算法的不断发展,有望实现信息平台之间更强大、更快速的转换。机器学习的未来发展将极大地提高医疗服务水平和优化研究实践。
神经网络的作用
神经网络是一组算法,建模在人脑之后,被设计为识别模式。它们通过机器感知、标记或聚合原始输入来解释感官数据。它们识别的模式是数字,包含在向量中,所有存在于现实世界中的数据(图像、声音、文本或时间序列)都必须转换为这种形式。 根据《麻省理工学院新闻》 (MIT News) 2017 年刊登的一篇文章,神经网络是沃伦·麦卡洛 (Warren McCullough) 和沃尔特·皮茨 (Walter Pitts) 于 1944 年首次提出的,两人均为芝加哥大学的研究人员。1952 年,他们以认知科学系创始人的身份进入麻省理工学院,有些资料认为这是世界上第一个认知科学系。从那时起,这种方法便不再流行,但在机器学习的未来发展中得以回归。 2017 年,开放式神经网络交换 (ONNX) 格式面世,成为一种用于深度学习和传统机器学习模型的社区主导型开源标准。该项目的目标是通过创建一个标准化框架,以解决分散的 AI 生态系统内部形成的限制。 在 AI 社区众多公司的支持下,ONNX 在软件和硬件行业中的应用方面取得了进展。ONNX 将开发人员和数据科学团队在面临未来性能和兼容性方面的挑战降至最低,同时为各种以技术为中心的领域大规模创新打开了大门。ONNX 使开发人员能够使用自己选择的机器学习框架并消除兼容性障碍。这样一来,在现在和未来的迭代中,硬件和软件产品都能更轻松地协同工作。 在兼容性方面,根据微软公司的 Faith Xu 在一篇媒体文章中的描述,“…ONNX 社区贡献了许多不同的工具来转换和高效运行模型。通过 TensorFlow-ONNX 和 ONNXMLTools (Keras、Scikit-Learn、CoreML 等) 之类的工具,可以将在各种框架上训练的模型转换为 ONNX 格式。PyTorch 1.2 已经能够支持本地 ONNX 导出功能。此外,ONNX 模型库还提供深受欢迎的现成模型。”
语义互操作性 – 成功部署 AI 的必备条件
虽然 ONNX 格式已经帮助统一了许多大公司的 AI 和机器学习成果,但显而易见的是,仅仅使所有数据保持同一格式并不意味着一定会成功。这一点激发了人们对未来项目语义互操作性的持续关注。当数据由表示不同含义的来源混合而成时,您未必能够得知数据的模式、预测值或异常情况。 语义互操作性是指计算机系统具有交换明确、共享含义的数据的能力。为此,无论您的数据是否是从单一来源或多种来源合并的并通过 ONNX 风格的格式转换,都需要使用高质量、人工标注数据集来准确地训练机器学习模型。