[AI医学] 医学领域几个微调预训练大模型的项目

关键词:AI医学,医学大模型,指令微调,PubMed

文章目录

  • 医学微调大模型
    • 1. MedicalGPT-zh
    • 2. DoctorGLM
    • 3. Huatuo-Llama-Med-Chinese & ChatGLM-Med
  • 医学预训练语言模型
    • 1. BioMedLM (2.7B)
    • 2. PMC-LLaMA (7B)
    • 3. BioMedGPT (1.6B)
  • 总结与思考

领域指令微调样本生成框架OpenGPT与医疗健康大模型NHS-LLM
ChatDoctor:借助医学知识库生成微调样本构建医疗领域大模型

前面整理了两篇具有代表性的AI医学领域大模型,主要讲了领域大模型在微调数据生成及在通用大模型基础上微调训练上的工作。本文继续该方向的调研,就当前主要的AI医疗大模型微调及预训练进行项目信息梳理。

医学微调大模型

1. MedicalGPT-zh

基于ChatGLM-6B LoRA 16-bit指令微调的中文医疗通用模型。基于共计28科室的中文医疗共识与临床指南文本,生成覆盖面更全的医疗知识,回答内容更精准的高质量指令数据集。

项目地址:https://github.com/MediaBrain-SJTU/MedicalGPT-zh

  • 根据医疗指南生成知识文档样例数据格式如下:
{
"指南": "患者获益;相反减少热卡摄入会导致营养不良,尤其是晚期CKD患者。因此,减轻体重干预措施的利弊需进一步研究,并未作为临床推荐。CKD合并糖尿病患者的降糖治疗一些新型降糖药物已获准应用于临床,包括钠葡萄糖共转运蛋白2抑制剂(SGLT2i),胰高血糖素样肽-1受体激动剂(GLP-1RA)和二肽基肽酶4抑制剂(DPP4i)。多项大型临床试验证实新型降糖药物能有效改善2型糖尿病患者心血管和肾脏临床预后(图4)。这些试验为治疗提供了证据。在对已发表的研究成果进行严格的系统回顾后,工作组经过综合考量,为CKD患者合并2型糖尿病推荐了首选的治疗方案。1型糖尿病合并CKD患者,仍以胰岛素降糖主为,缺乏新型降糖药物疗效的对照研究,故在本指南未涉及。指南推荐CKD患者合并2型糖尿病患者在生活方式干预的基础上,以二甲双胍联合SGLT2i作为一线降糖治疗方案,必要时再联合其他降糖药物(图5)。对于大多数eGFR≥30ml/(min·1.73m2)的CKD合并糖尿病患者可以从二甲双胍和SGLT2i治疗中获益。二甲双胍是一种价格低廉且耐受性良好的药物,可以有效降低血糖;SGLT2i有益于降低CKD及CVD患者心血管","qa_pairs": [{"question": "CKD患者减轻体重的干预措施可能会导致什么后果?有哪些风险需要注意?","answer": "CKD患者减轻体重的干预措施可能会导致以下风险和后果:\n\n1. 营养不良:如果减重不当,可能会导致营养不良和不良的健康后果。\n\n2. 肌肉损伤:不适当的减重可能会导致肌肉损伤,尤其是在白天饮食受限的情况下。\n\n3. 血糖水平变化:CKD患者减重可能会影响血糖水平的稳定性。\n\n4. 肾脏功能恶化:不适当的减重可能会影响肾脏功能的稳定性。\n\n5. 药物副作用增加:减重可能会影响药物的代谢和吸收,从而增加药物副作用的风险。\n\n6. 微量元素缺失:减重可能会导致某些微量元素的摄入不足,例如钙、铁和维生素D等。\n\n因此,CKD患者在减轻体重时需要注意上述风险,并在医生或营养师的指导下制定合理的减肥计划。"},{"question": "新型降糖药物对于CKD并发糖尿病的患者能够产生怎样的治疗效果?这些效果有哪些证据支持?","answer": "一些新型降糖药物针对CKD并发糖尿病的患者具有良好的治疗效果,包括以下:\n\n1. 糖皮质激素受体拮抗剂(SGLT2抑制剂):这类药物可以通过促进糖尿病患者的尿液排泄,从而降低血糖水平。目前已有多项研究证实,这类药物可以在CKD患者中降低血糖水平,并且有助于减少肾脏疾病的进展。\n\n2. 胰岛素类药物:这类药物可以增强糖尿病患者的胰岛素功能,从而促进血糖的吸收和利用。尽管胰岛素类药物在CKD患者中使用可能存在一些风险,但已有研究表明,一些胰岛素类药物在CKD并发糖尿病的患者中可以有效控制血糖水平。\n\n3. 胰岛素样增效因子-1受体激动剂(GLP-1RA):这类药物可以增强患者的胰岛素分泌和对胰岛素的敏感度,从而降低血糖水平。现有的研究证据表明,GLP-1RA对于CKD患者并发糖尿病的治疗具有潜在的益处。\n\n需要注意的是,不同类型的药物可能具有不同的治疗效果和副作用,应根据患者的具体情况进行选择和调整治疗方案。此外,任何药物的使用都应在医生的监护下进行。"},{"question": "在CKD合并糖尿病的治疗中,二甲双胍和SGLT的联合使用能够带来哪些益处?这些药物适用于哪些CKD患者?","answer": "二甲双胍是一种口服药物,通常用于治疗2型糖尿病,能够降低血糖和减少体重。SGLT(Sodium glucose co-transporter 2)抑制剂是一种新型口服降糖药物,能够通过抑制肾脏中的SGLT2,促使糖尿病患者在尿液中排出更多的葡萄糖,从而降低血糖。\n\n对于合并糖尿病的CKD患者,二甲双胍和SGLT抑制剂的联合使用可能会带来以下益处:\n\n1. 降低血糖:二甲双胍和SGLT抑制剂的联合使用可以更加有效地降低血糖,相比于单一药物的治疗,联合使用可能会更加有效。\n\n2. 保护肾脏:SGLT抑制剂具有减轻肾小管负担的作用,可以减少肾脏的损伤和疾病进展的风险。此外,二甲双胍的使用也可以降低糖尿病患者肾脏疾病的风险。\n\n3. 减轻体重:二甲双胍和SGLT抑制剂的联合使用可以通过减少摄入的糖分和促进葡萄糖的代谢而减少体重。\n\n适用于哪些CKD患者?\n\n二甲双胍和SGLT抑制剂的联合使用适用于合并糖尿病的CKD患者。然而,这些药物并不适用于所有CKD患者,因此应该根据患者的具体情况,在专业医生的建议下使用这些药物。此外,需要注意二甲双胍和SGLT抑制剂的副作用和药物相互作用,以避免不良反应。"}]
}
  • 医疗共识与临床指南中文本段涵盖28个科室共计32k个文本段。各科室及其分布如下:
    在这里插入图片描述

2. DoctorGLM

基于ChatGLM-6B模型,分别采用Lora和p-tuningv2方法,引入中文医疗对话数据集对ChatGLM-6B进行微调,样本量问答对近800k。

项目地址: https://github.com/xionghonglin/DoctorGLM

- 中文医疗对话数据集包含6个文件夹及对应的问答对如下

总计6个文件夹,792099个问答对:
<Andriatria_男科> 94596个问答对 
<IM_内科> 220606个问答对 
<OAGD_妇产科> 183751个问答对 
<Oncology_肿瘤科> 75553个问答对 
<Pediatric_儿科> 101602个问答对 
<Surgical_外科> 115991个问答对 

- 数据为CSV格式,示例如下:

DepartmentTitleAskAnswer
心血管科高血压患者能吃党参吗?我有高血压这两天女婿来的时候给我拿了些党参泡水喝,您好高血压可以吃党参吗?高血压病人可以口服党参的。党参有降血脂,降血压的作用,可以彻底消除血液中的垃圾,从而对冠心病以及心血管疾病的患者都有一定的稳定预防工作作用,因此平时口服党参能远离三高的危害。另外党参除了益气养血,降低中枢神经作用,调整消化系统功能,健脾补肺的功能。感谢您的进行咨询,期望我的解释对你有所帮助。
消化科哪家医院能治胃反流烧心,打隔,咳嗽低烧,以有4年多建议你用奥美拉唑同时,加用吗丁啉或莫沙必利或援生力维,另外还可以加用达喜片

3. Huatuo-Llama-Med-Chinese & ChatGLM-Med

基于中文医学知识在LLaMA-7B上进行指令微调。中文医学知识为对中文知识图谱CMeKG经过chatGPT后生成的指令微调样本,在ChatGLM-6B上也进行了微调训练,得到新模型ChatGLM-Med(6B)。微调训练样本总计近8k。

项目地址:https://github.com/SCIR-HI/Huatuo-Llama-Med-Chinese

样本的生成方式prompt没有具体给出,借助chatGPT从结构化知识图谱到微调样本的生成,可以借鉴ChatDoctor和DoctorGLM项目。

医学预训练语言模型

1. BioMedLM (2.7B)

stanford crfm基于GPT-2模型架构,使用PubMed生物医学论文的摘要和正文数据继续预训练,预训练数据有300B Tokens,在MedQA任务上达到了50.3的分数。

项目地址:https://github.com/stanford-crfm/BioMedLM

2. PMC-LLaMA (7B)

在LLaMA模型的基础上,加入4.9M PubmedCentral医学知识相关的学术论文数据,超过75B tokens,对LLaMA继续进行预训练。对比于BioMedLM,二者均是在PubMed上进行预训练,不同在于该项目基于LLaMA模型,同时在医学相关论文筛选有自己的一套逻辑。

论文题目:PMC-LLaMA: Further Finetuning LLaMA on Medical Papers
论文地址:https://arxiv.org/abs/2304.14454
项目地址:https://github.com/chaoyi-wu/PMC-LLaMA
在这里插入图片描述

论文对LLaMA-7B分别进行全量参数微调和PEFT微调,相比于原模型,在评测集性能表现提升,表明引入领域数据的预训练是对模型领域能力是有效的,但对比chatGPT仍显不足。

在这里插入图片描述

3. BioMedGPT (1.6B)

OpenBioMed: 用于AI驱动生物医学研究的多模态表示学习开源工具包。本项目聚焦于多模态信息,例如药物、蛋白质和单细胞的知识图谱和生物医学文本,以及一系列广泛的应用,包括药物靶标相互作用预测、分子性质预测、细胞类型预测、分子-文本检索、分子-文本生成和药物反应预测等。研究人员可以使用包括BioMedGPT-1.6B和CellLM在内的许多深度学习模型来促进下游任务的开展。本项目提供了易于使用的API和命令,以加速生命科学研究。OpenBioMed: OpenBioMed: 用于AI驱动生物医学研究的多模态表示学习开源工具包。本项目聚焦于多模态信息,例如药物、蛋白质和单细胞的知识图谱和生物医学文本,以及一系列广泛的应用,包括药物靶标相互作用预测、分子性质预测、细胞类型预测、分子-文本检索、分子-文本生成和药物反应预测等。研究人员可以使用包括BioMedGPT-1.6B和CellLM在内的许多深度学习模型来促进下游任务的开展。本项目提供了易于使用的API和命令,以加速生命科学研究。本项目聚焦等本项目了

项目地址: https://github.com/BioFM/OpenBioMed

总结与思考

通过对以上医疗领域大模型的梳理,可以看到领域大模型上的工作主要表现在两个方面:
一是对海量领域数据继续进行生成式语言模型预训练(continue pretrain);
二是在通用大模型的基础上引入领域数据进行指令微调训练(通用大模型底座+领域数据指令微调);

生成式语言模型继续预训练对数据量和计算资源的要求较高,目前大部分项目的工作多是集中在对通用模型进行领域数据指令微调训练。在指令微调训练方面,差异性的工作主要表现在「领域样本数据的生成」(如各种self-instruct生成样本)和「低资源训练」上(如各种PEFT方法进行部分参数的微调)。

医学领域大模型建设是有其必要性的,由于医疗数据较为敏感,多数情况下难以使用外部的云端服务,建设私有医疗大模型并本地化部署有其应用场景。虽然当前类chatGPT平台在医疗问答上已具备相当的能力,但由于使用场景的特殊性,比如院内电子病历的自动化处理、患者诊疗时间线的构建等,医疗行业各家依需要进一步打造完善自己的可本地化部署的领域模型

当前中文医疗领域的公开数据还比较少,依赖chatGPT作为teacher生成的数据存在有偏和不确定性,高质量数据对于模型性能的提升至关重要,有必要在更高层面集聚医疗数据资源,推进规范数据质量的提升。同时能够评估大模型能力的医疗领域的评估集也是必要的,当前多数开源项目的评估还都是在感性层面对生成结果的人工评价,建立统一的评价方式和自动化的评估工具对后续领域大模型的发展亦是很重要的

感谢开源社区对大模型&AI医学的贡献!

参考:
https://mp.weixin.qq.com/s/5q6If6hhMGGWD7mZeRfNLg

同步更新到:AI加油站

----------END----------

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/21583.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

程序员专属对联

请欣赏“程序猿春节对联集锦”&#xff1a; 对联一 上联&#xff1a;上拜图灵只佑服务可用 下联&#xff1a; 下跪关公但求永不宕机 横批&#xff1a;风调码顺 风调雨顺 上拜图灵只佑服务可用 下跪关公但求永不宕机 对联二 上联&#xff1a;屏中创造繁华世 下联&#xff1a;指尖…

Node接入ChatGPT 的最强对手Claude

由于个人的chatGPT免费版本即将到期, Claude 很火&#xff0c;在网上被说成是 ChatGPT 的最强对手&#xff0c;是 ChatGPT 的替代品。本文我将介绍下 Claude 是什么&#xff0c;以及如何免费使用 Claude. 什么是Claude 看一下它是如何自我介绍的 Slack Slack 是一款流行的团…

读《EMOQ-TTS: EMOTION INTENSITY QUANTIZATION FOR FINE-GRAINED CONTROLLABLE EMOTIONAL TEXT-TO-SPEECH》

0 Abstract 虽然近年来文本到语音(TTS)的研究取得了显著进展&#xff0c;但仍局限于情感语音合成。为了产生情感话语&#xff0c;大多数作品都利用了从情感标签或参考音频中提取的情感信息。然而&#xff0c;由于话语层面的情绪条件&#xff0c;它们导致了单调的情绪表达。在本…

专家担心 ChatGPT 很快会被用于毁灭性的网络攻击

听到这个新闻&#xff0c;我是挺震惊的&#xff0c;​ChatGPT 近几个月来风靡全球&#xff0c;但就在它以其技术能力让人们惊叹的同时&#xff0c;也有人对其潜在的滥用提出了担忧。 现在&#xff0c;似乎一些 IT 领导者担心它将很快被用于重大网络攻击&#xff0c;并有可能在未…

英文润色网站-英文质量改写改进软件

英文改写软件 英文改写软件是一种全新的工具&#xff0c;它可以方便快捷地对不同语种的图文内容进行批量改写和转换&#xff0c;包括但不限于英语、法语、德语、中文等。无论用户需要将哪种语言的文章进行改写和转换&#xff0c;都可以轻松实现。该软件支持任何文档格式和文本…

OpenAI Translator Bob Plugin Bob上一款翻译、润色、语法修改插件

OpenAI Translator Bob Plugin 一款可以在Bob进行即时翻译的插件。它基于 OpenAI 的 GPT 系列模型&#xff0c;能够提供高质量、准确的翻译服务。该插件支持多种语言的翻译&#xff0c;包括中文、英文、法语、德语、日语等。用户只需在页面中选中需要翻译的文本&#xff0c;然…

pg数据库数据导出

首先得在postgresql的安装包下找到bin目录&#xff0c;找到路径。其次在cmd下面&#xff0c;输入导出路径&#xff1a; 导出数据库的命令&#xff1a; > pg_dump -U postgres -h ip地址 数据库名> f:\data\数据库名.dump >口令&#xff1a;密码

如何进行数据的导出?

如何进行数据的导出&#xff1f; 以前有进行过填写资料并且把资料导出Excel表格&#xff0c;当时就觉得好神奇&#xff0c;又想知道这样的功能是怎么实现的&#xff0c;可是那时的头脑简单&#xff0c;没有知道答案&#xff0c;可是现在我终于知道为什么可以直接导出数据了&am…

图像搜索:以图搜图

以图搜图 随着数字时代的到来&#xff0c;单单的文字搜素已经无法满足人们的搜索了&#xff0c;图像搜索&#xff0c;甚至是视频搜索都已经比较成熟。本文大致讲解下图像搜索&#xff1a; 发展历程 原理 搜索项目&#xff1a;主要分为三个部分——图像特征抽取&#xff0c;构…

图片搜索引擎网站大全,以图搜图网站

当我们需要搜索一些图片的时候使用图片搜索引擎网站可以帮我们更快地找到自己需要的图片&#xff0c;那么有哪些图片搜索引擎网站可以搜索图片呢&#xff1f;下面小编就来和大家分享几个以图搜图的网站。 1.百度图片搜索引擎网站 百度是最大的中文搜索引擎&#xff0c;百度的图…

查找照片的来源

想要知道照片的来源&#xff0c;可以使用百度识图或其他识图工具&#xff0c;但得到的信息可能不多&#xff0c;不过还可以通过多种手段获取更多信息。 以以下照片为例&#xff0c;查找是哪家麦当劳。 &#xff08;1&#xff09;.进入电脑pc端&#xff0c;右键单击照片&#xf…

如何使用谷歌“以图找图”图片搜索功能

谷歌不愧为搜索界的大佬&#xff0c;谷歌在前几个月开放了一个新功能&#xff0c;叫做“图像搜索”&#xff0c;也就是说&#xff0c;可以用图片搜索到图片&#xff0c;图片可以是网络链接的&#xff0c;也可以是上传的。有了这个功能后&#xff0c;人肉搜索 又上了一个新的层次…

BERT模型解析

1. 概述 Bidirectional Encoder Representation from Transformers&#xff08;BERT&#xff09;[1]&#xff0c;即双向Transformer的Encoder表示&#xff0c;是2018年提出的一种基于上下文的预训练模型&#xff0c;通过大量语料学习到每个词的一般性embedding形式&#xff0c…

接入 GPT-4 的 AI 虚拟女友,一周狂挣 50 万!

公众号关注 “GitHubDaily” 设为 “星标”&#xff0c;每天带你逛 GitHub&#xff01; 随着 ChatGPT 的爆火&#xff0c;互联网上也衍生出不少令人直呼脑洞大开的 AI 应用。 最近&#xff0c;国外一位名为 Caryn Marjorie 的小姐姐搞了个骚操作&#xff0c;基于 GPT-4 调教出来…

AI读心重磅突破登Nature!大脑信号1秒被看穿,还能预测未来画面

最近&#xff0c;来自洛桑联邦理工学院的研究团队提出了一种全新的方法&#xff0c;可以用AI从大脑信号中提取视频画面。论文已登Nature&#xff0c;却遭网友疯狂「打假」。 现在&#xff0c;AI不仅会读脑&#xff0c;还会预测下一个画面了&#xff01; 利用AI&#xff0c;一个…

快看!这只猫两次登上 Github Trending !!!

前几天我在逛 Github Trending&#xff0c;无意间发现这个 Postcat 登上榜单 ! 好奇心驱使我去了解这个 Postcat。 近期它上新了几个有意思的插件&#xff0c;其中 ChatGPT 插件&#xff0c;用户可以直接省去复杂的流程&#xff0c;直接体验 ChatGPT&#xff0c;懂的都懂&#…

baichuan-7B模型介绍及微调

文章目录 baichuan-7B介绍baichuan-7B 推理baichuan-7B 微调使用微调后的模型推理 baichuan-7B介绍 2023年6月15日&#xff0c;搜狗创始人王小川创立的百川智能公司&#xff0c;发布了70 亿参数量的中英文预训练大模型——baichuan-7B。 baichuan-7B 基于 Transformer 结构&a…

与老范对谈:ChatGPT等AIGC技术对内容产业的影响和趋势判断

昨日&#xff0c;我和老范线下面基&#xff0c;用一下午的时间深入探讨了AIGC对内容产业影响的话题&#xff0c;这次聊天收获满满&#xff0c;我迫不及待将这次讨论的内容整理成了文章。但在这之前&#xff0c;请让我先介绍一下老范。 老范曾就职于盛大创新院、猎豹移动&#x…

安卓星座查询app

一款简单的星座查询app 运行截图&#xff1a; 代码部分&#xff1a; 采用listview&#xff0c;和intent跳转和intent传值实现该功能。 界面代码1&#xff1a; <?xml version"1.0" encoding"utf-8"?> <LinearLayout xmlns:android"h…

我开发的“小灵”,自认为比微软“小冰”好多了

不管是微软的刻意炒作&#xff0c;还是腾讯的出于安全的考虑&#xff0c;总之&#xff0c;东嫂捧出来的“小冰”就这么没了。这件事无论最后结果如何&#xff0c;微软肯定是达到目的了。这一搞&#xff0c;被微信封杀&#xff0c;卖卖萌&#xff0c;恶心一下微信&#xff0c;博…