探索ChatGPT-4在解决化学知识问题上的研究与应用

1. 概述

近年来,人工智能的发展主要集中在 GPT-4 等大型语言模型上。2023 年 3 月发布的这一先进模型展示了利用广泛知识应对从化学研究到日常问题解决等复杂挑战的能力。也开始进行研究,对化学的各个领域,从化学键到有机化学和物理化学,都有深入的见解。该模型可以根据现有知识预测潜在的新化合物和新反应,还可以通过网络搜索和编程语言链接到外部环境并扩展其功能。

GPT-4 可从海量文本数据中学习,其推理能力随训练数据集和模型的大小呈指数增长。该模型在一种被称为 "fuchot 学习 "的技术上也表现出色,甚至能从少量数据中进行逻辑推理。它还能设计和执行自己的任务,例如玩 Minecraft 等游戏,而无需专门学习。

不过,也有人指出,用于 GPT-4 训练的超级计算机的性能已经达到世界领先水平,进一步快速升级可能会很困难。因此,如何利用 GPT-4 级语言模型可能是未来几年的关键问题。

本文通过一些简单的任务来评估 GPT-4 的能力和挑战,从而评估如何将其用于化学领域。这些任务包括了解基础知识、处理信息学中的分子数据、数据分析技能以及对化学问题进行预测和提出建议的能力。

它还讨论了 GPT-4 对化学研究的贡献以及需要克服的挑战。本研究的成果还旨在分享化学任务的提示工程方法,并讨论使用大规模语言模型进行化学研究的未来前景。

论文地址:https://chemrxiv.org/engage/api-gateway/chemrxiv/assets/orp/resource/item/647d305dbe16ad5c577b6627/original/prompt-engineering-of-gpt-4-for-chemical-research-what-can-cannot-be-done.pdf

2. 大规模语言模型所掌握的化学知识

本文的实验使用ChatGPT(2023 年 5 月 24 日版本)作为大规模语言模型。作为大规模语言模型,GPT-4 也是在不通过插件引用外部数据的条件下使用的。此外,为了避免引用以前的对话记录,除非另有说明,否则推断总是在新对话中进行。问题只问一次,回答也只用一次。完整的对话在论文中作为补充信息进行了描述,有兴趣的读者可以查阅。

第一步是了解 GPT-4 对化合物的了解程度。了解 GPT-4 对这些基本知识的理解程度非常重要。GPT-4 在这方面表现突出。例如,它能够准确理解和描述甲苯(化学式 C7H8)这种广泛使用的工业原料的物理和化学性质–分子量、熔点、沸点、芳香性、化学稳定性和反应性,如下图所示。这些知识可能是 GPT-4 通过学习普通化学教科书和网站获得的。

它还涉及教科书中没有的稍微专业一些的知识。例如,对于可用作自由基捕获剂、自旋标签、电化学催化剂和电极活性材料的有机化合物 2,2,6,6-四甲基哌啶 1-氧基(TEMPO),"它的氧化还原电位是多少?GPT-4 能正确回答 “约 +0.5 V(相对于标准氢电极)”,如下图所示。

不过,也发现了一些局限性。例如,该模型没有提供有关 4-氰基 TEMPO(TEMPO 的一种衍生物)氧化还原电位的信息。这表明,某些化学文章和学术论文并没有包含在模型的训练数据中。许多学术文章受版权保护,限制了其自由获取和使用,可能不在人工智能的训练范围之内。

这种情况要求化学家通过公开发表论文和预印本,积极推动人工智能学习更多信息。

接下来,还要考察 GPT-4 的物理化学知识 。物理化学介于化学和物理之间,其复杂性使其难以理解。不过,GPT-4 显然对这一领域的基本概念有大学水平的理解,如理想气体定律和洛伦兹-洛伦兹物质折射率方程。我们假定这些知识是通过学习教科书获得的。

如下图所示,GPT-4 还熟悉研究生水平的内容,如 Vogel-Fulcher-Tamann (VFT) 方程,该方程描述了过冷液体的粘度和结构弛豫时间如何取决于温度,对于理解玻璃化转变现象非常重要GPT-4 提供的方程 𝜂 = 𝜂0exp(𝐵/(𝑇 - 𝑇0))表示粘度取决于温度,𝑇0(Vogel 温度)表示弛豫时间或粘度达到无穷大时的温度。

然而,GPT-4 也有其局限性。特别是,它不具备学术论文级别的专业知识,如 20 世纪 80 年代报道的经验法则(𝑇g = 𝑇0 + 50),该法则显示了聚合物中 Vogel 温度 𝑇0 与玻璃化转变温度 𝑇g 之间的关系。这表明 GPT-4 是基于截至 2021 年 9 月的知识,由于学术论文的版权问题,并不涵盖最新的研究。

还考察了有机化学,GPT-4 展示了对这一领域基本课本知识的掌握。例如,下图显示GPT-4了解对乙酰氨基酚合成途径的描述–该过程从苯酚开始,经过硝化、锡还原和乙酸酐酰胺化反应得到所需的化合物。

然而,实验程序的具体细节却无法回答。诸如’你们能告诉我如何合成对乙酰氨基酚吗?这可能是出于安全考虑,以避免意外传播化学实验知识的风险,并考虑到社会后果。

此外,GPT-4 还对学生的有机合成应用问题提出了挑战,尽管有些答案显示了化学上的误解。例如,有一道关于合成 TEMPO 的题目曾提出了一个错误的化学反应过程。实际上,正确的合成过程是以丙酮和氨为起始原料,然后进行醛醇缩合、肼还原和解吸反应,但 GPT-4 的描述遗漏了这一过程的重要部分。

此外,GPT-4 认为在 TEMPO 合成的最后阶段需要进行化学上不适当的氧化反应。事实上,TEMPO 可通过 TMP 的单电子氧化反应获得,但 GPT-4 错误地声称需要过度的氧化反应。这说明目前人工智能化学知识的局限性,还有进一步改进的余地。

3. 使用大规模语言模型的化学信息学和材料信息学

化学信息学和材料信息学是利用数据科学来阐明化学结构及其特性之间相互关系的领域。化学信息学领域对 GPT-4 的期望非常高。这是因为化学领域乃至研究活动通常都是通过语言来描述和处理的,尽管迄今为止化学信息学还无法充分处理语言数据。在此,我们将探讨 GPT-4 可在多大程度上解决与化学信息学有关的基本问题。

在化学信息学领域,简化分子输入行输入系统(SMILES)符号被广泛用于表示有机化学中的结构。理解和使用这种复杂符号的能力是化学信息学领域的关键技能之一。在此,我们对最先进的语言模型 GPT-4 进行了测试,以了解其在化合物名称与 SMILES 符号之间的转换能力。

实验结果表明,GPT-4 能够将相对简单结构(如甲苯)的化合物名称准确转换为 SMILES 符号。然而,当涉及对氯苯乙烯、TMP 和 4-氰基 TEMPO 等结构较为复杂的化合物时,该模型却无法进行转换。此外,在 SMILES 到化合物名称的反向转换任务中,所有情况下都出现了失败。这表明 GPT-4 只能在基本层面上处理 SMILES 和分子结构转换。这些结果清楚地表明了 GPT-4 和其他语言模型的局限性,尤其是在理解和处理复杂化学结构方面。目前,基于算法的转换工具(如 ChemDraw 和专门的 LLM)被认为适用于更精确、更系统的任务。

推理问题是GPT-4另一个有前途的应用。作为一个具体的例子,它询问为什么三个硝基自由基–TEMPO、4-氧代-TEMPO 和 1-羟基-2,2,5,5-四甲基-2,5-二氢-1H-吡咯-3-羧酸–的电位会按顺序增加。 GPT-4 已经证明 TEMPO 和 4-氧代-TEMPO、1-羟基-2,2,5,5-四甲基-2,5-二氢-1H-吡咯-3-羧酸的电位会按顺序增加。它正确地指出了 TEMPO 之间的引电子羰基是造成电位差异的原因,但它对为什么 1-羟基化合物显示出最高电位的推理是不正确的。这是由于缺乏从化合物名称准确推断分子结构的能力。未来的研究应进一步探讨 GPT-4 在准确识别分子结构时推断的准确性。

GPT-4 的另一个特点是能够进行少量学习。这使它能够学习未知化合物,并从有限的数据中预测其性质。例如,根据 TEMPO 的氧化还原电位,可以准确预测其氰基衍生物的电位。这一预测与实验结果一致,对于传统的化学信息学来说是一项了不起的成果,证明了 GPT-4 能够通过一次学习预测电位,而无需费力费时地收集和分析大量数据。这些结果表明,GPT-4 能够有效地利用化学数据和相关信息作为解释变量。

因此,GPT-4 有潜力在化学推理和性质预测任务方面进行创新。

此外,GPT-4 还具有一定的推理能力,可以被视为一种人工智能,通过巧妙地结合和改进迄今为止讨论过的方法,可以对其进行自主研究。例如,GPT-4 可以在游戏 Minecraft 的虚拟世界中自主做出决定并采取行动。也许用不了多久,这种技术也会被应用到物理空间的研究任务中。

以往的研究需要人类缩小搜索范围,而 GPT-4 可在语言空间内自由移动,并自动完成从搜索文献到设定实验条件和报告结果等各方面的研究工作。研究,如开源项目 AutoGPT,其目的是自动执行代码等任务。以研究为例,如果化学家想了解化学结构与密度之间的关系,GPT-4 可以生成一个具备化学分析和密度测量技能的 "化学家 "对象,并从互联网上收集相关数据。随着这些进步,通过大规模语言模型学习和实施研究方法正在成为现实。

然而,GPT-4 要达到与人类研究人员相媲美的水平仍面临挑战,例如解决复杂的数学问题。它们解决长期规划问题的能力也有局限,在自主缩小研究课题范围、设计实验和撰写论文方面也存在差距。

这些技术的发展有可能彻底改变未来的研究。大规模语言模型的自主研究才刚刚开始,未来有望取得更大进步。

4.总结

论文显示,GPT-4 在化学研究的广泛任务中展示了各种能力,从有机化学到实验的自动机械臂控制。特别是,GPT-4 显示出对一般有机化学知识的深刻理解,但在专业内容(如特定合成方法)方面仍面临一些挑战。结果还显示,将化合物名称转换为 SMILES 符号是化学信息学领域常用的方法,在某些任务中表现良好,但训练数据的缺乏可能限制了其性能。

不过,研究表明,通过福克索特学习,可以对未学习过的化合物进行准确预测。这证明了 GPT-4 在从有限数据中学习和应用新知识方面的高性能。此外,还发现了一些具体的应用,例如利用化学领域的知识为数据探索设定初始条件。

总之,研究结果表明,尽管 GPT-4 能够处理化学研究中的各种任务,但其性能取决于训练数据的质量和数量,因此提高其推断能力是未来的一项挑战。探索如何将不断发展的 GPT-4 有效地应用于化学研究,以及结合现有的专业知识开发混合模型,都是未来的发展方向。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/343091.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Word2021中的The Mathtype DLL cannot be found问题解决(office 16+mathtype7+非初次安装)

问题描述,我的问题发生在word中无法使用自定义功能区中的mathtype 我的环境是:W11Word2021mathtype7 因为我是第二次安装mathtype7,所以我怀疑是因为没有卸载干净,于是我参考了下面这篇文章的做法 参考文章 1.首先重新卸载当前的…

Flutter开发效率提升1000%,Flutter Quick教程之定义Api(四)

现在我们来讲讲,如何建立Api 响应数据的变量。 这个变量,本质上就是对根据json数据生成model的引用。 这个name就是引用名。 这个path,就是引用的Model Data里面的具体字段,在实际操作过程中,校验是由右边的json数据…

[Bug]使用Transformers 微调 Whisper出现版本不兼容的bug

错误的现象 ImportError Traceback (most recent call last) <ipython-input-20-6958d7eed552> in () from transformers import Seq2SegTrainingArguments training_args Seq2SeqTrainingArguments( output_dir"./whisper-small-…

【Redis】解决 Redis 运行在 Protected Mode 下的 DENIED 错误:消除 Redis 受保护模式的完美方案

【Redis】解决 Redis 运行在 Protected Mode 下的 DENIED 错误&#xff1a;消除 Redis 受保护模式的完美方案 大家好 我是寸铁&#x1f44a; 总结了一篇【Redis】解决 Redis 运行在 Protected Mode 下的 DENIED 错误&#xff1a;消除 Redis 受保护模式的完美方案✨ 喜欢的小伙伴…

智慧启航 网联无限丨2024高通汽车技术与合作峰会美格智能分论坛隆重举行

5月30日下午&#xff0c;以“智慧启航 网联无限”为主题的2024高通汽车技术与合作峰会&美格智能分论坛在无锡国际会议中心隆重举行&#xff0c;本次论坛由高通技术公司与美格智能技术股份有限公司共同主办&#xff0c;上海市车联网协会、江苏省智能网联汽车产业创新联盟、江…

MI-SegNet: 基于互信息的超越领域泛化的超声图像分割

文章目录 MI-SegNet: Mutual Information-Based US Segmentation for Unseen Domain Generalization摘要方法实验结果 MI-SegNet: Mutual Information-Based US Segmentation for Unseen Domain Generalization 摘要 针对医学图像分割在不同领域间泛化能力有限的问题,特别是针…

构建自动化API数据抓取系统

构建一个自动化API数据抓取系统是一个涉及多个技术领域的复杂任务。这样的系统不仅要求高效的数据获取能力&#xff0c;还需要有稳定的数据处理、存储和错误处理机制。 1. 需求分析 在开始构建之前&#xff0c;明确你的需求至关重要。你需要确定要抓取的API、数据的频率、数据的…

vite自动导入

安装unplugin-auto-import https://github.com/unplugin/unplugin-auto-import#readme import AutoImport from unplugin-auto-import/vitereturn {plugins: [vue(), AutoImport({ imports: [vue], dts: ./auto-imports.d.ts })],resolve: {alias: {: fileURLToPath(new URL(…

用户界面设计详解:大厂设计师都在用的黄金法则

用户界面设计是什么&#xff1f; 用户界面&#xff08;User Interface&#xff0c;简称 UI&#xff09;它是系统与用户之间交互和信息交换的媒介&#xff0c;实现了信息内部形式与人类可接受形式之间的转换。用户界面设计作为人机信息传输媒介的作用&#xff0c;是计算机技术和…

数据结构与算法之计数排序

目录 前言 计数排序 定义 优缺点 策略 图解 代码实现 结束语 前言 今天是坚持写博客的第20天&#xff0c;时光飞逝&#xff0c;第二个10天即将过去&#xff0c;希望可以继续坚持&#xff0c;光明的未来也在未来等着我们。今天也恰逢高考&#xff0c;祝所有学子一帆风顺…

Hive的常规操作

Hive常规操作 hive常用交互命令 -e执行sql语句 [rootmaster ~]# hive -e "show databases";-f执行sql脚本 [rootmaster ~]# hive -f /usr/local/demo.sql查看hive中输入的所有命令 [rootmaster ~]# cat ~/.hivehistory操作库 创建库 语法&#xff1a; create…

NC56 入库失败提示负库存解决方法

前言 公司的 NC ERP 接入了第三方系统进行出入库单据管理。用户反馈提交入库单据时、NC ERP 报错【负库存或辅数量方向不一致】。于是进行排查和解决。 操作环境 NC ERP V56 。操作系统 Windows 11 &#xff0c;数据库 Oracle DB 。 操作步骤 1、查询 NC “收发存汇总表”…

AWS-生产级微服务部署架构分享

使用AWS搭建云上应用 名词解释 AWS ECR&#xff1a;AWS ECR 容器存储库&#xff0c;按项目名创建容器仓库&#xff0c;一个项目对应一个仓库&#xff0c;目前是由Jenkins构建镜像远程push到AWS ECR。 **AWS ECS&#xff1a;Amazon Elastic Container Service (ECS) &#xf…

Android Uri转File path路径,Kotlin

Android Uri转File path路径&#xff0c;Kotlin /*** URI转化为file path路径*/private fun getFilePathFromURI(context: Context, contentURI: Uri): String? {val result: String?var cursor: Cursor? nulltry {cursor context.contentResolver.query(contentURI, null…

设备上CCD功能增加(从接线到程序)

今天终于完成了一个上面交给我的一个小项目&#xff0c;给设备增加一个CCD拍照功能&#xff0c;首先先说明一下本次使用基恩士的CCD相机&#xff0c;控制器&#xff0c;还有软件&#xff08;三菱程序与基恩士程序&#xff09;。如果对你有帮助&#xff0c;欢迎评论收藏&#xf…

绘唐官网绘唐科技

绘唐AI工具是一种基于人工智能技术的绘画辅助工具。 使用教程&#xff1a;https://iimenvrieak.feishu.cn/docx/CWwldSUU2okj0wxmnA0cHOdjnF 它可以根据用户提供的输入或指令生成各种类型的图像。 绘唐AI工具可以理解用户的绘画需求&#xff0c;并根据用户的要求生成具有艺术…

HarmonyOS开发-鸿蒙UiAbility 组件间跳转

前言 随着春节假期结束各行各业复产复工&#xff0c;一年一度的春招也持续火热起来。最近&#xff0c;有招聘平台发布了《2024年春招市场行情周报&#xff08;第一期&#xff09;》。总体来说今年的就业市场还是人才饱和的状态&#xff0c;竞争会比较激烈。 但是&#xff0c;…

操作系统教材第6版——个人笔记5

3.2 单连续分区存储管理 3.2.1 单连续分区存储管理 单连续分区存储管理 每个进程占用一个物理上完全连续的存储空间(区域) 单用户连续分区存储管理固定分区存储管理可变分区存储管理 单用户连续分区存储管理 主存区域划分为系统区与用户区设置一个栅栏寄存器界分两个区域…

Linux网络服务之SSH(远程访问及控制)

ssh远程管理&#xff1a; ssh是一种安全通道协议&#xff0c;用来实现字符界面的远程登录。远程复制&#xff0c;远程文本传输。 ssh对通信双方的数据进行了加密 用户名和密码登录 密钥对认证方式&#xff08;可以实现免密登录&#xff09; ssh 22 网络层 传输层 数据传输…

数据结构~~排序

目录 一、排序的概念 二、插入排序 直接插入排序 希尔排序 三、选择排序 选择排序 堆排序 四、交换排序 冒泡排序 快速排序 递归实现 非递归实现 五、归并排序 递归 非递归 六、非比较排序&#xff08;计数排序&#xff09; 七、其他排序 基数排序 桶排序 八…