在工业领域谈GPT和大模型究竟是不是“扯淡”？

来源：物联网智库原创

作者：Sophia

导读

在接受智次方研究院调研的30余家工业互联网企业中，超过70%是生成式AI技术的“观望者”，在他们看来，该类技术在工业领域的应用落地还很遥远，甚至可能是个“伪命题”。当然，也有接近30%是生成式AI技术的坚定“支持者”，他们认为虽然生成式AI在工业制造领域的应用还不成熟，但其改变传统生产方式、推动制造业未来数字化转型的趋势已经势不可挡。

“最近GPT和大模型这么火？您怎么看待生成式AI在工业领域的落地和应用？”

“说实话，我觉得在工业领域谈大模型纯属扯淡。”

“我们之前采访XXX公司CEO的时候，他非常看好生成式AI对工业领域带来的颠覆。”

“呵呵......”

这是一段我们近日在调研工业互联网企业时真实发生的对话。

从2022年11月Open AI推出ChatGPT开始，如今不过半年的光景。在短短近6个月的时间内，人工智能的进化几乎在以“天”为单位疯狂迭代，生成式AI对许多行业带来的颠覆足以用“摧枯拉朽”来形容。游戏、传媒、电商、影视、教育、金融等领域的从业者已经直面感受到了被AI“抢饭碗”的压力，但与之相比，承担着国民经济支柱重担的工业/制造业对生成式AI的态度却显得有些“谨慎”和冷淡。

在接受智次方研究院调研的30余家工业互联网企业中，超过70%是生成式AI技术的“观望者”，在他们看来，该类技术在工业领域的应用落地还很遥远，甚至可能是个“伪命题”。当然，也有接近30%是生成式AI技术的坚定“支持者”，他们认为虽然生成式AI在工业制造领域的应用还不成熟，但其改变传统生产方式、推动制造业未来数字化转型的趋势已经势不可挡。

观望者：为什么在工业领域谈大模型是伪命题？

先来看看“观望者”们为何不看好生成式AI。

首先，“观望者”认为当前大多数生成式AI模型主要关注文本和图像，只有非常少量的模型关注将传感器数据作为输入。同时，工业场景中的很多数据是不可读取的，或者即使读取了也需要一个翻译和解读的过程才能理解。

这个观点不无道理，不过在笔者看来，这并不是主要原因。此前就有多位计算机科学家曾预测，到2026年ChatGPT等大型语言模型的训练将耗尽互联网上的可用文本数据，届时当没有新的互联网训练数据可供使用时，由传感器、机器设备等生成的物联网数据自然会成为“香饽饽”。

同时，相对于互联网，物联网数据是物理实体产生的数据，具有鲜明的客观性，且大部分场景主要目的是用于生产经营，因此实用性也更高。在这些特殊数据的“投喂”下，生成式AI模型或许能够更深入地学习各行业具体场景知识，输出更精准的信息，为行业经营者和物联网用户参考，例如大幅提高预测性维护、供应链协同的效率。

更重要的是，在数据之外，工业领域对安全、稳定、可靠等指标极其严苛的追求，才是生成式AI不能满足的地方。

今年2月，计算机科学家 Stephen Wolfram 在推特发表了一篇万字长文解释 ChatGPT 的工作原理。简单来说，ChatGPT 的核心任务始终是对已有的文本生成一个“合理的延续”，“合理”的意思是指根据人类在数十亿个网页中撰写内容的规律，来推测接下来可能出现的内容。

例如，我们随机输入了一句文本，ChatGPT 就会在数十亿页的人类文本中查找类似文本，然后统计下一个单词出现的概率。需要注意的是，ChatGPT 并不是直接对比文字本身，而是以某种意义上的“意思匹配”为依据。最终，ChatGPT 会生成一个可能的单词列表，并给出每个单词的概率排名。也就是说，当 ChatGPT 完成像写文章这样的任务时，它实际上只是一遍又一遍地询问：“在已有文本的基础上，下一个词应该是什么？”并且每次都会添加一个词（更准确地说，它添加一个“token”，这可能只是单词的一部分，这就是为什么它有时会“创造新词”的原因）。

换言之，生成式AI的技术原理往往是寻找一种“最有可能”的答案，所以我们在实际使用过程中经常会遇到一些ChatGPT胡编乱造的“惊喜”，但是工业界不需要“惊喜”，工业生产最害怕“意外”，因为一个小小的故障和停机就可能带来成百上千万的巨额损失。

上海优也信息技术有限公司首席科学家郭朝晖博士曾在和智次方创始人彭昭的一次对话中表示：“工业这个领域讲究的是确定性的东西，安全稳定可靠。为什么要求六西格玛？因为它关注的是确定性的东西和物理世界的规律。而人工智能——无论是写诗还是理解语言等等，都是研究人类自身。针对人类，人工智能研究的是一种随机性。而工业过程很多时候是针对一种确定性的，即针对某种对象。从这个角度来看，GPT-4对工业的理解可能还是不会太深，但是对于研发和服务，尤其是研发出能够满足用户需求的产品，它可能会发挥比较大的作用。对于生产制造过程，它的作用可能会相对较弱。”

更进一步，工业制造细分领域众多，各领域在生产流程、工艺、生产线配置、原材料及产品类型上均具有较大差异，强调的是细分行业的机理融合和行业知识，没有海量数据标签，因此工业领域基本上不可能形成类似GPT这样的通用大模型。

对此，天泽智云联合创始人李杰（Jay Lee）教授认为：“工业智能如果通用化，不应单纯是一个语言的生成式模型，它应该是一个操作的精密模型。操作的生成式预训练模型（OperationGPPT）应该有三个特色：第一个是它的目的性，要产能最大，维护成本最低，这是优化的目标函数（objective function）；第二个，它有它的逻辑性：什么时候该做什么，随工况（regime）变化而变化，它一定有是由某种操作逻辑决定的；第三个，很重要的，它有因果性，好跟坏、大跟小、高跟低，它一定有因果关系。”

AGI生成式预训练模型ChatGPT与IAI操作优化的精密模型OperationGPPT特性对比

ChatGPT	OperationGPPT
发散的	收敛的
提供可能性	聚焦使用性
通用	精密

支持者：生成式AI将深入制造企业的流程优化

当然，“支持者”们也有自己看好生成式AI的理由。

一位受访者告诉智次方·物联网智库：“过去，工业AI通常着重于故障检测、预测性维护等用例，但2023年的一个新趋势是生成式AI将深入制造企业的流程优化。”

第一，在产品开发阶段，生成式AI能够压缩设计和迭代的过程，从而带来显著的效率提升。

初创公司Divergent 3D使用生成式AI为英国的豪华跑车制造商阿斯顿·马丁设计的概念车打造后车架，从设计的提出、对比分析，到评估其可制造性，在短短一个小时之内就可进行30~40次迭代。

无独有偶，Monolith AI公司在2023年工博会上带来其机械工程仿真解决方案，基于该方案，创建者依靠实时数据每次进行仿真都会开发一个模型，省去许多测试程序，该公司的目标是到2026年将100000名工程师的产品开发时间缩短50％。

第二，除了研发，数据追踪和分析的流程或许也将被重塑。对制造业管理者而言，实时了解生产进度是重中之重。在一些比较传统的中小制造企业车间里，生产流程的记录往往依靠纸质单据或者Excel表格，生产信息整体传递滞后。为了解决这类问题，不少企业开始部署数字化系统，但却存在周期长、成本高等痛点。而生成式AI可以使用自然语言处理和机器学习技术从工业现场的仪表板上，甚至纸质数据和表格中读取数据（GPT-4已经具备了识图能力），并快速提取有用的特征和信息。

国外的一位博主进行了这样的尝试，他为ChatGPT提供了Zerynth 仪表板的链接，生成式AI立即就读取了仪表板中的数据和图表，实时提供了正在发生的事情的概览。虽然分析结果很肤浅，但这的确有助于初步分析和了解工厂的运行情况，包括哪些机器运行情况良好，哪些指标值得关注等。

第三，人们与机器沟通的方式会发生深刻的变化。过去运营人员一般通过各种软件与机器沟通，现在则可以直接通过自然语言与机器交流。有了ChatGPT，不用学习编程，人们就有能力调动各种机器，达成某种结果。再往远处看，生成式AI和大模型让人们看到了利用虚实结合的方式控制物理世界的可能性。用数字虚拟的方式训练生产机器，最终实现全自动化的制造业，让机器制造机器，工厂成为产品。

实际中已经开始出现一些初步的用例，比如——阿里工程师通过钉钉对话框向机器人发出指令后，通义千问大模型在后台自动编写了一组代码发给机器人，机器人开始识别周边环境，从附近的桌上找到一瓶水，并自动完成移动、抓取、配送等一系列动作，递送给工程师。这一演示表明，AI大模型已经突破了机器人的局限，让人类可以通过自然语言指挥机器完成负责任务，让机器人真正拥有了“大脑”。如果相关成果能在工厂得到复现，将会具备广阔的想象空间。