从ChatGPT到ChatCAD:基于大型语言模型的医学图像交互式计算机辅助诊断

基本信息

1. 标题:ChatCAD: Interactive Computer-Aided Diagnosis on Medical Image using Large Language Models.

2. 期刊:arXiv

3. IF/JCR/分区:

4. DOI:arXiv:2302.07257

5. 作者:沈定刚教授团队


1. 导读

2023年年初最火热的话题之一就是OpenAI的ChatGPT1,给人类带来了巨大的冲击。1月底,美国《财富》杂志2/3月合刊的封面文章《全球爆红的ChatGPT是如何诞生的?》引爆了创投圈。在这巨大的浪潮冲击下,如何让其在医疗领域发挥其强大的作用呢?沈定刚教授团队给出了初步的答案。在本文中,作者提出了一种将大型语言模型(LLMs)集成到医学影像计算机辅助诊断网络中的初步方法。


2. 背景动机

2.1 计算机辅助诊断(CAD)

传统的计算机辅助诊断网络模型是基于各种计算机视觉的先进算法在大量数据上进行训练,使他们能够学习识别特定于医学领域的视觉信息中的复杂模式和关系,在医学领域的各个任务中已取得了显著性地效果。


2.2 大型语言模型(LLMs)

大型语言模型(如ChatGPT)是经过大量文本数据训练的高级人工智能系统,在自然语言处理方面取得了显著成果,并有可能彻底改变各个行业。ChatGPT已经成功通过了部分美国医疗执照考试,展示了其在增加医疗专业人员提供护理方面的潜力。然而LLMs目前难以从医学影像中解释和提取信息,从而限制了他们全面支持临床决策过程的能力。但医学影像在临床决策中发挥着巨大的作用,如何整合 LLM 以理解计算机视觉任务中的视觉信息是一个有趣的问题。


2.3 视觉语言模型

一种流行的将视觉信息转换为语言的方法是通过图像描述。通过训练大量的数据,基于深度学习的图像描述模型可以生成连贯的描述。

在医学图像分析中,研究人员使用异质图、知识图谱和自监督算法等方法对图像进行描述来生成影像报告。

近年来,随着模型规模的增大,该领域的进展已转向视觉语言预训练和利用预训练模型,如:CLIP2、Frozen3和Flamingo4等。


3. 研究目的

本文目标是将 LLM 的医学领域知识和逻辑推理的优势与现有医学图像 CAD 模型的视觉理解能力相结合,为患者创建一个比传统 CAD 系统更加用户友好和易于理解的系统。这样患者就可以更好地理解病情,减少患者的咨询开销,增强在线医疗服务的可行性。

图2:使用LLMS的交互式CAD。本例使用ChatGPT作为LLM。例如,基于图像和生成的报告,患者可以询问适当的治疗方案(第二个面板)或定义医学术语,如"空域整合" (第三个面板)。或者以患者的主诉(第四小组),LLMs可以解释为什么会出现这样的症状。


4. 模型构建

图1:模型策略总览。


4.1 图像和文本的连接

为了将医学影像转为文本内容输入到LLM中,作者采用了以下策略:

1. 将影像输入到训练好的CAD模型中产生输出。

2. 将该输出转为自然语言。

3. 使用语言模型总结结果并作出最总的总结。

4. 基于以上结果和语言模型(基于医学知识预训练),参与关于症状、诊断和治疗的谈话。

以图3为例:

图3:提示张量和文本之间的桥梁。我们展示了三种不同的提示设计。

1. CAD模型的分类输出为一个含有5个概率值的向量。(即判别为五种类别的可能性)。

2. 将上述结果转为一个用以用于LLM的提示性语句。一种自然的提示方式是显示所有五种病理及其相应的分数。

① 为了避免一些误解,规定“疾病得分越高,患病的可能性就越大”作为基本规则。② 将每种疾病的分数表示为“{疾病}分数:{分数}”(Prompt#1)。但这种表示不符合临床报告需求。③ 为了和临床报告形式一致,作者又将概率分数转为定性描述疾病的严重程度。“没有迹象”[0.0-0.2],“可能性很小”[0.2-0.5],“可能”[0.5-0.9],“肯定”[0.9 及以上)。(Prompt#2)④ 为了使报告更简洁,报告诊断分数高于 0.5 的疾病。(Prompt#3)如果没有预测在这五种类别中,则显示“未发现”。


4.2 数据集和实验设定

模型:

● CvT2DistilGPT25

● R2GenCMN6

● 本文提出的模型(基于GPT-3)

● 本文提出的模型(基于ChatGPT)

数据:

● 用于报告生成的数据:MIMIC-CXR7

● 用于疾病分类器训练的数据:CheXpert8


5. 实验结果

5.1 报告生成

5.1.1 改进后的报告的质量

表1:模型诊断正确率对比。

图5:四种模型在五次观测上的F1分数。

5.1.2 LLMs是如何影响报告质量

语言模型的诊断能力与其大小成正比,这突显了LLMS的逻辑推理能力的关键作用。

表2:比较不同大小的GPT-3模型的性能。参数大的模型更好些。

越有效的模型会产生更长的报告。

图6:不同模型生成报告的长度。


5.2 交互的、可理解的CAD

ChatCAD能够利用LLM广泛而可靠的医学知识来提供交互式的解释和建议。通过这种方法,患者可以更清楚地了解自己的症状、诊断和治疗方案,从而更高效、更具成本效益地咨询医疗专家。

随着语言模型的不断进步,随着对更可信的医疗培训数据的访问,ChatCAD变得更加准确,ChatCAD有潜力显著提高在线医疗服务的质量。

图7:两个ChatCAD案例。一个讨论胸腔积液,另一篇讨论水肿及其与肿胀的关系。

图8:基于ChatGPT的模型生成的报告。


6. 局限不足

目前这个方向是个比较新的领域,还是有很多工作需要去完善:

● LLM生成的报告在某种程度上不像人类。ChatCAD 提高了诊断准确性,但降低了 BLEU 分数9。

● ChatCAD只给出了三种prompts,还需要继续完善。

● ChatCAD中不包含患者的主诉信息,因为没有相应的数据库。需要更好的数据集和基准。

● 视觉分类器的作用尚未得到探索,需要进行额外的研究以确定具有更大参数的ViT或 SwinTransformer等模型是否可以提供改进的结果。

● LLMs也可以用来帮助视觉模型的训练,比如利用在LLMs中学到的相关医学知识来修正视觉模型的输出。

● 对prompt设计只是进行定性分析,应该进行更准确的定量评估。

● ChatCAD的内容没有和临床医生进行专业的讨论,需要进一步完善。


7. 一些想法

● 虽然本文不那么完善(毕竟只是preprint,说不定作者已经在改进的路上了),但作者团队相当于挖了一个坑给大家,大家快冲!。(大佬们的动作真的快啊!)

● 基于现有的通用人工智能ChatGPT,给其输入医学知识学习构建ChatMedicine是一个很有意思的研究。(毕竟人工智能和人最大的区别是:你给他知识他是真的学啊!)

▎脚注列表

[1] 关于ChatGPT的解读互联网很多,推荐两个:通向AGI之路:大型语言模型(LLM)技术精要 - 知乎;https://mp.weixin.qq.com/s/IF43iCk4v3qwIBjMdljtJA

[2] Alec Radford, Jong Wook Kim, Chris Hallacy, Aditya Ramesh, Gabriel Goh, Sandhini Agarwal, Girish Sastry, Amanda Askell, Pamela Mishkin, Jack Clark, et al. Learning transferable visual models from natural language supervision. In International Conference on Machine Learning, pages 8748–8763. PMLR, 2021.

[3] Maria Tsimpoukelli, Jacob L Menick, Serkan Cabi, SM Eslami, Oriol Vinyals, and Felix Hill. Multimodal few-shot learning with frozen language models. Advances in Neural Information Processing Systems, 34:200–212, 2021.

[4] Jean-Baptiste Alayrac, Jeff Donahue, Pauline Luc, Antoine Miech, Iain Barr, Yana Hasson, Karel Lenc, Arthur Mensch, Katie Millican, Malcolm Reynolds, et al. Flamingo: a visual language model for few-shot learning. arXiv preprint arXiv:2204.14198, 2022.

[5] Aaron Nicolson, Jason Dowling, and Bevan Koopman. Improving chest x-ray report generation by leveraging warmstarting. arXiv preprint arXiv:2201.09405, 2022.

[6] Zhihong Chen, Yaling Shen, Yan Song, and Xiang Wan. Generating radiology reports via memory-driven transformer. In Proceedings of the Joint Conference of the 59th Annual Meeting of the Association for Computational Linguistics and the 11th International Joint Conference on Natural Language Processing, Aug. 2021.

[7] Alistair EW Johnson, Tom J Pollard, Seth J Berkowitz, Nathaniel R Greenbaum, Matthew P Lungren, Chih-ying Deng, Roger G Mark, and Steven Horng. Mimic-cxr, a deidentified publicly available database of chest radiographs with free-text reports. Scientific data, 6(1):317, 2019.

[8] Jeremy Irvin, Pranav Rajpurkar, Michael Ko, Yifan Yu, Silviana Ciurea-Ilcus, Chris Chute, Henrik Marklund, Behzad Haghgoo, Robyn Ball, Katie Shpanskaya, et al. Chexpert: A large chest radiograph dataset with uncertainty labels and expert comparison. In Proceedings of the AAAI conference on artificial intelligence, volume 33, pages 590–597, 2019.

[9] Kishore Papineni, Salim Roukos, Todd Ward, and Wei-Jing Zhu. Bleu: a method for automatic evaluation of machine translation. In Proceedings of the 40th annual meeting of the Association for Computational Linguistics, pages 311–318, 2002.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/3705.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

如何使用微信邮箱注册?个人邮件邮箱注册

微信是我们每天必不可少的社交软件,邮箱是重要的办公工具,在微信中使用邮箱为我们的办公提供了便利。出门在外一部手机就能轻松完成办公,那么今天就用TOM VIP邮箱的随心邮和大家介绍下如何使用微信邮箱。 网页注册VIP邮箱 首先在VIP邮箱官网…

邮箱怎么注册申请?怎么注册个好用的呢

在使用邮箱过程中,时长会有很多小问题被忽视,比如容量不够的困扰,一番清理后才能有新的邮箱进来,或者想找一封重要邮件迟迟未收到等。申请一个真正好用的邮箱真的能节省大量的时间成本 PC端注册 第一步:百度搜索163.…

ChatGPT使用Java编写猜数游戏

目录 使用ChatGPT编写的代码如下 存在的问题 改进的Java代码 猜数游戏相信很多学编程的同学都听说过,在学习循环的那一节的课后作业相信就有这个题目,正好现在ChatGPT正火的时候,我也尝试了让它写一下这个代码,很遗憾&#xff0…

ChatGpt的使用感悟和使用局限

GPT3未出现以前的生活 当我写博客和论文时 心想:啊~~~~ 怎么办,马萨卡,我真的永远都无法敲出结果来了! 写完内容后的我 终于可以睡了!!! 天啊,这是我一个本科生该有的生活吗…

ChatGPT 进阶使用技巧(文末有彩蛋)

虽然ChatGPT是一个强大的工具,但要充分发挥其效力,需要掌握一定的技巧和学习。 ChatGPT 能做什么 ChatGPT是一款强大的文字处理工具,它能够胜任绝大部分与文本相关的工作,包括但不限于续写文章、提取关键词、编写代码、写诗、写小…

ChatGPT介绍与使用场景

ChatGPT是OpenAI开发的一款基于GPT-3和GPT-4的人工智能聊天机器人。“GPT"代表的是"Generative Pre-trained Transformer”,这是一种深度学习技术,使用人工神经网络来生成类似人类的文本。 ChatGPT能够处理各种对话任务,包括回答问…

ChatGPT-3使用

一、 什么是ChatGPT ChatGPT,全称聊天生成预训练转换器,是OpenAI开发的人工智能聊天机器人程序,于2022年11月推出。该程序使用基于GPT-3.5架构的大型语言模型并以强化学习训练。 官网:https://openai.com/blog/chatgpt 当前免费…

gmai邮箱怎么注册啊

Gmail账号获取地址: www.getgmail.cn gmaile-mail是一个非常好的邮箱,也相当于google帐户。接下来,单击主界面中的右上方按钮并选择要进入设置页面的设置。接下来,单击现有页面以选择gmail电子邮件,然后输入gmail电子邮件注册表。…

如何批量注册邮箱?TOM VIP邮箱注册(简单实用)

如何批量注册邮箱?怎么批量注册邮箱账号啊?这是最近好多朋友遇到的问题,今天就来为大家分享一下,如何去做。 方法一:TOM VIP邮箱官网注册 1、登陆官网,点击立即注册按钮,即可进入注册界面&…

最新注册gmail邮箱收不到验证码解决方法

最新注册gmail邮箱收不到验证码解决方法 最近因为要注册ChatGPT所以需要准备一个邮箱,我个人是非常喜欢使用gmail邮箱的,非常方便,注册一个gmail邮箱就相当于是注册了一整个谷歌生态,一个账号可以在所有谷歌的应用上使用。 在注册…

如何申请注册在国内可以登录使用国外邮箱?

2022年冬奥会的开始、冰墩墩的爆火,这些让在国外无法回国的华人,十分羡慕,也让很多之前不怎么联系的朋友使用邮件交流了起来,那么是不是所有邮箱都可以向国外发信呢?其实并不是,我之前使用过,很…

公司邮箱怎么申请注册?电子邮箱注册教程来了

现在社交网络越来越发达,对于学生和工作人士来说拥有一个邮箱是非常重要的。邮箱注册对于一些公司企业来说比较熟悉,但对于刚刚成立不久的小型公司就比较陌生。接下来讲一下邮箱怎么申请注册~ 注册单次群发500封的Tom VIP邮箱可以让你在无论何时无论何地…

安全邮箱怎么注册?邮箱地址是什么?怎么写?快速了解tomvip邮箱

大家都想要一款安全邮箱,但是邮箱的种类较多如何选择?安全邮箱怎么注册?邮箱地址如何填写?下面了解下邮箱的相关信息! 一:安全邮箱是什么?邮箱地址是什么? 收发邮件的速度、垃圾邮…

注册 Google 邮箱(最新:保姆级教程)

文章目录 1、我们使用浏览器打开谷歌邮箱官网(gmail.google.com),进入谷歌邮箱的登录主页,我们点击左下方的创建账号按钮,选择个人用途 2、在进入的界面我们不要着急填写资料,我们先修改语言,点…

gmail邮箱注册成功流程

gmail邮箱注册成功流程 邮箱注册地址: https://accounts.google.com 全程使用电脑注册。访问注册地址,按照流程走就行,部分有坑的地方看一下本文的注意事项。注册成功后可以使用qq邮箱关联gmail邮箱来进行邮件的接收。 Chrome用邮箱账号登…

超详细步骤,教你一次就成功注册Gmail邮箱(同时可以用于申请谷歌广告账户)

注册一个Gmail邮箱很简单,只需6步,注册方法如下: 1. 浏览器打开链接 https://accounts.google.com/signup/v2/webcreateaccount?hlzh-CN&flowNameGlifWebSignIn&flowEntrySignUp 2. 填写手机号,尽量是真人手机号&#…

protonmail邮箱注册

文章目录 一、ProtonMail是什么?二、注册步骤 一、ProtonMail是什么? ProtonMail是一种安全、隐私保护的电子邮件服务,它采用了端到端加密技术,确保您的电子邮件只能被您和收件人阅读。ProtonMail的加密方式是基于开放源代码的PG…

基辛格等分享: ChatGPT 预示着一场智能革命,而人类还没有准备好

我们迫切需要开发一种复杂的辩证法,使人们能够挑战生成人工智能的交互性,不仅要证明或解释人工智能的答案,还要审问它们。带着一致的怀疑态度,我们应该学会有条不紊地探索人工智能,并评估它的答案是否值得信任以及在多…

ChatGPT模型被证实具有人类心智!这一天终于来了!

丰色 萧箫 发自 凹非寺来源 | 量子位 QbitAI ChatGPT原来是拥有心智的?! “原本认为是人类独有的心智理论(Theory of Mind,ToM),已经出现在ChatGPT背后的AI模型上。” 这是来自斯坦福大学的最新研究结论&am…

与chatGPT的几次对话,关于人,人性,历史和科技

最近chatGPT确实很热,我也试着和它做了几次对话,感觉确实比过去那些智障级别的小X,小Y,小Z……强太多了,至于人工智障级别的行走,在我的视频号里面也有对应的转发点评,实在是看不下去眼。 最早&…