《XrayGLM:基于VisualGLM-6B微调训练对X光胸片进行医学诊断》学习分享与本地项目微调部署实践

XrayGLM据说是首个会看胸部X光片的中文多模态医学大模型,我最近也是因为关注这个所以就找时间学习了一下,顺便把学习资料对应记录分享一下。

官方提供了开源的项目,地址在这里,如下所示:

 最近,通用领域的大语言模型 (LLM),例如 ChatGPT,在遵循指令和产生类似人类响应方面取得了显著的成功,这种成功间接促进了多模态大模型的研究和发展,如通用领域的多模态大模型MiniGPT-4、mPLUG-Owl、Multimodal-GPT和LLaVA ,然而,此类多模态大模型却很少出现在医学领域的研究中,阻碍了相关研究发展。visual-med-alpaca虽然在医学多模态大模型方面做出了一些很有成效的工作,然而其数据为英文诊断报告,不利于促进中文领域医学多模态大模型的研究发展。为此,我们开发了XrayGLM以解决上述问题。XrayGLM在医学影像诊断和多轮交互对话上显示出了非凡的潜力。

为了帮助大家上手学习掌握,官方也提供了对应的视频讲解,地址在这里,如下所示:

 项目主要完成了两个贡献:

  • 借助ChatGPT以及公开的数据集,我们构造了一个X光影像-诊断报告对的医学多模态数据集;
  • 我们将构建的中文胸部X光片诊断数据集在VisualGLM-6B进行微调训练,并开放了部分训练权重用于学术研究;

下面是报告内容详情:

 官方项目使用的数据集是开源的数据如下:

  • MIMIC-CXR是一个公开可用的胸部X光片数据集,包括377,110张图像和227,827个相关报告。
  • OpenI是一个来自印第安纳大学医院的胸部X光片数据集,包括6,459张图像和3,955个报告。

在上述工作中,报告信息都为非结构化的,不利于科学研究。为了生成合理的医学报告,我们对两个数据集进行了预处理,并最终得到了可以用于训练的英文报告。除此之外,为了更好的支持中文社区发展,借助ChatGPT的能力,我们将英文报告进行了中文翻译,并最终形成了可用于训练的数据集。

 环境安装部署如下:

安装环境
# 安装依赖
pip install -r requirements.txt
# 国内换源安装依赖
pip install -i https://mirrors.aliyun.com/pypi/simple/ -r requirements.txt
此时默认会安装deepspeed库(支持sat库训练),此库对于模型推理并非必要,同时部分Windows环境安装此库时会遇到问题。 如果想绕过deepspeed安装,我们可以将命令改为:# 安装依赖
pip install -i https://mirrors.aliyun.com/pypi/simple/ -r requirements_wo_ds.txt
# 安装SwissArmyTransformer
pip install -i https://mirrors.aliyun.com/pypi/simple/ --no-deps "SwissArmyTransformer>=0.3.6"

checkpoints-XrayGLM-300模型权重地址在这里,如下所示:

 checkpoints-XrayGLM-3000模型权重地址在这里,如下所示:

 可以看到:模型体积将近16GB。

运行启动只需要终端执行下面的命令即可:

python web_demo.py --from_pretrained checkpoints/checkpoints-XrayGLM-3000

实例影像诊断效果如下所示:

 多轮对话实例:

 感兴趣的话都是可以自己训练实验体验一下的:

硬件资源
* 实验在A100 (4X, 80GB)上进行(1)准备诊疗报告(中文)和X光影像在data/Xray文件夹下;
(2)开始训练:
# 设置CUDA变量,主要是为了解决有时候直接训练而出现无法正确加载到显卡问题
export CUDA_VISIBLE_DEVICES=0,1,2,3# 开始训练
bash finetune_XrayGLM.sh
这里的复现过程非常简单,主要是很多过程我们都为大家准备好了,大家可以随时复现一个自己的XrayGLM。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/71074.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【心理咨询师考试笔记】基础理论(一)——心理学概论

心理学概论 文章目录 心理学概论一、绪论1.基础心理学的研究对象及研究内容是什么?2.心理包括什么?3.心理现象发生发展的过程4.心理学发展简史 二、心理活动的生理基础1.神经元2.神经系统(1)神经系统结构(2&#xff09…

【心理咨询师考试笔记】基础理论(六)——心理咨询概论

心理咨询概论 文章目录 心理咨询概论一、概述简史基本概念心理咨询师应有的思维方式与态度心理咨询师应具备的条件 二、精神分析理论观点分区观点结构观点心理动力观点发展观点适应观点 三、行为主义理论观点行为主义心理学的先驱操作性条件反射和应答性条件反射的区别内隐与外…

【心理咨询师考试笔记】操作技能(二)——心理评估

心理评估 文章目录 心理评估一、概述二、心理评估在心理咨询中的作用三、心理评估的方法四、个案概念化五、心理诊断技能一:初诊接待与资料的搜集、整理二:初步诊断 六、心理测验技能人格测验类问卷明尼苏达多相人格测验(MMPI)卡特…

为本教育柳春丽心理咨询师擅长哪些方面领域

柳春丽老师-为本教育心理咨询师-国家二级心理咨询师擅长领域如下: 1、情绪问题咨询: (如自卑、内疚、焦虑、恐惧、愤怒、悲伤等)的调节。 2、个人成长咨询: 内向孤僻、缺乏自信、敏感多疑、性格缺陷、人际关系紧张…

【Claude2体验】继ChatGPT,文心一言,Bing等大模型后,初次对话Claude2的体验

文章目录 🌺注意事项🤖什么是Claude2⭐与之前版本的进步🛸官网的讲解🍔功能介绍🎄使用体验🎆查看不知道如何才能打开的文档 的内容🎆日常需求✨Claude✨ChatGPT3.5 🤖总结 &#x1f…

Docker网络

文章目录 一、引言二、网络原理2.1 Linux veth pair2.2 虚拟网卡Docker0 三、容器互联–Link四、网络模式五、container模式六、自定义网络4.1 创建网络4.2 Docker网络驱动程序和网络模式区别 七、网络连通八、常见使用命令九、总结十、参考资料 一、引言 一直拖着Docker网络这…

微软AI太会了,示爱威胁PUA!

微软在以ChatGPT为基础的最新搜索引擎New Bing在公测仅一周后就引发了人们的担忧和恐惧。用户反馈,New Bing不仅会表现出类似示爱、PUA和威胁人类等人类特有的行为,还可能超越人类意志和价值观,并违反“阿西莫夫的机器人三定律”。这引起了人…

ubuntu16.04没有声音解决方案

上网搜了一堆资料也没解决,自己瞎捣鼓给弄好了,记录下 输入下面命令安装pavucontrol: #sudo apt install pavucontrol #pavucontrol 运行h之后就是下图这个样子 点击Playback选项,将下面的Built-in Audio Analog Stereo修改为Lo…

解决腾讯会议没有声音的问题

文章目录 问题背景解决方案 问题背景 最近,在连接蓝牙耳机听腾讯会议时,发现没有声音,音量合成器里也没有腾讯会议。切换成外放时,发现音量控制键也失效了。 解决方案 这种情况除了软件内部的声音设置问题,很有可能…

借军工经验开拓消费市场,三星显示收购eMagin浅析

前不久三星显示(Samsung Display)宣布,拟支付2.18亿美元收购微显示方案商eMagin全部普通股,收购完成后eMagin将并入三星显示,以加速XR显示业务发展。 据青亭网了解,eMagin成立于1996年,该公司多…

挑战杯、互联网+大学生创新创业大赛项目计划书《多功能智能化无人机》

“挑战杯、互联网+”大学生创新创业大赛项目计划书 项目名称:多功能智能化无人机 目录 一、执行总结 1 (一)项目背景: 1 (二)项目概述: 2 (三)市场与竞争分析: 3 (四)运营分析: 3 (五)风险分析: 3 二、项目简介 4 (一)项目概述 4 (二)项目简介 4 1.项目创…

第十四届中国大学生创新创业大赛

文章目录 比赛官网比赛题目含金量非常高建议参加的学生推荐几个我感兴趣的题目联系 比赛官网 官网地址:http://www.fwwb.org.cn/ 实际叫做:中国大学生创新创业大赛 比赛题目 题目公布查看地址:http://www.fwwb.org.cn/topic/index 题目…

“创享杯”第一届电子数据取证线上大比武答案(自做)

1、通过对检材的分析,获取嫌疑人张某通过计算机远程桌面连接过的主机IP地址。(答案格式如:192.168.1.233) 2、通过对检材的分析,请获取嫌疑人计算机连接“Cai-wifi”的无线WiFi密码。(答案格式如&#xf…

揭秘第二届“移动云杯”大赛法律科技创新赛题参赛指南!

第二届“移动云杯”算力网络应用创新大赛已经启动 你是否对赛题还有很多问号? 那么,下面跟着我们一起来看下今日剧透之 高校赛道-法律科技创新子赛道 赛道介绍: 本赛道面向全国高校大学生,共分为”软件杯“直推子赛道、法律科技创…

比赛——第十四届全国大学生软件创新大赛 “基于端云结合的人工智能软件创新”

示 范 性 软 件 学 院 联 盟 关于举办第十四届全国大学生软件创新大赛 “基于端云结合的人工智能软件创新” 参赛通知 为了进一步提升大学生创新思维,全面推动软件行业发展,促进软件专业技术人才培养,为国家软件产业输出有创新能力和实践能力…

三城演义!第二届中国移动“梧桐杯”大数据应用创新大赛复赛完美收官

8月19日至26日,第二届中国移动“梧桐杯”大数据应用创新大赛暨大数据创客马拉松大赛的三场复赛路演暨颁奖典礼在杭州、武汉、广州三地成功举办。35支队伍在数智乡村、数智城市、数智交通三个赛道轮番展开了激烈角逐,最终9支队伍凭借优秀的创意方案和出色…

三创赛1:沙龙会

目录 1.大赛简介: 2.校赛 3. 网站建设方面 第十二届全国大学生电子商务“创新、创意及创业”挑战赛 (3chuang.net)http://www.3chuang.net/ 1.大赛简介 全国大学生电子商务“创新、创意及创业”挑战赛(以下简称三创赛)是在2009年由教育…