哈工大团队开源医学智能问诊大模型 | 华佗: 基于中文医学知识的LLaMa指令微调模型

原文:

CVHub

门头沟学院AI视觉实验室御用公众号 | 学术 | 科研 | 就业

185篇原创内容

公众号

Title: HuaTuo: Tuning LLaMA Model with Chinese Medical Knowledge
PDF: https://arxiv.org/pdf/2304.06975v1.pdf
Code: https://github.com/scir-hi/huatuo-llama-med-chinese

导读

在生物医学领域,LLM模型(如LLaMaChatGLM)因为缺乏一定的医学专业知识语料而表现不佳。该项目通过医学知识图谱GPT3.5API构建了中文医学指令数据集,并对LLaMa模型进行了指令微调得到了一个针对医学领域的智能问诊模型HuaTuo,相比于未经过医学数据指令微调的原LLaMa而言,HuaTuo模型在智能问诊层面表现出色,可生成一些更为可靠的医学知识回答;与此同时,基于相同医学数据,该项目还训练了医疗版本的ChatGLM模型: ChatGLM-6B-Med

除了华佗模型,该团队还即将发布扁鹊模型PienChueh(同为基于医学数据训练的大模型),欢迎大家届时使用体验。

引言

ChatGPT模型虽然表现出色,但毕竟不开源,开源社区已提供了许多平替方案,比如LLaMa等(7B,13B,30B,65B),其中7B具有70亿参数,训练成本最低,借助Colossal AIDeep Speed大模型训练框架,也可以很好的平民化训练并针对性的用于解决特定业务场景下的问题。

不管是原始LLaMa,还是ChatGPT等其它大语言模型,它们在医疗领域的应用仍然存在一些问题。比如笔者前段时间问原始LLaMa,给它输入一段病情描述,让它输出病情诊断信息,它会给出一些非常简短且常规的回答,完全没回答到点子上;虽然在这一层面ChatGPT做的更好,回答的也更加详细,但更多的也是一些偏向于科普式的回答,并没有非常惊艳的效果。而经过专门医疗数据训练的Glass AI(链接:https://glass.health/ai)模型在智能诊断上表现极其出色,感兴趣的读者可自行注册体验(强烈推荐)。但由于Glass AI是一款已商业化的AI智能诊断模型,也并未开源。

由于医疗领域专业知识太多,而LLMs的一般领域知识往往无法满足这种专业化需求,如果直接用于智能诊断,极有可能导致诊断精度、药品推荐和医疗建议等方面的不准确性,甚至危及患者的生命。所以,将专业的医学领域知识,诊断案例数据输入到大模型进行专业化学习非常有必要。

目前,已经有一些方法尝试解决这个问题,但这些方法主要依赖于从人工交流中检索医学信息,容易出现人为错误。此外,LLMs通常只在英语语境下进行训练,这限制了它们在其他语言环境下的理解和响应能力,例如中文,因此它们在中国语境中的应用受到极大限制。

现有的方法主要采用ChatGPT进行数据辅助,将ChatGPT某一领域的知识有效蒸馏到较小的模型:比如Chatdoctor代表了将LLMs在生物医学领域的第一次尝试,通过调用ChatGPT API来生成一些医学语料数据并叠加一部分真实场景医患数据,来微调LLaMa;为了解决中文语境问题,DoctorGLM利用ChatGLM-6B作为基础模型,并用ChatDoctor数据集的中文翻译通过ChatGPT获取进行微调。这些模型出来的效果只能说还行,但距离真实落地还很远。毕竟通过未经过专门医学语料训练的ChatGPT获取的训练数据也是非常general的回答,对模型得不到质的提升。

本项目介绍了一种针对生物医学领域、专注于中文语言的LLM模型—HuaTuo(华驼)。为了保证模型在生物医学领域回答问题的准确性,研究人员通过从中文医学知识图谱CMeKG中提取相关的医学知识,生成多样的指令数据,以确保模型回答问题的事实正确性,并收集了超过8000条指令数据进行监督微调。该模型基于开源的LLaMa-7B基础模型,整合了CMeKG的结构化和非结构化医学知识,并利用基于知识的指令数据进行微调,使得模型具有较为丰富的医学领域专业知识,从而为智能诊断作出较为专业的回答。

HuaTuo Model

Base Model

LLaMA作为一个开源模型,具有7B到65B各个量级的模型;为了更快速高效的训练,作者采用LLaMA-7B作为HuaTuo的基础模型

Medical Knowledge

医学知识的种类包括:结构化医学知识和非结构化医学知识。结构化医学知识指的是医学知识图谱等形式化的知识,而非结构化医学知识则是如医学指南等的非形式化的知识。作者在这里使用了一个名为CMeKG的中文医学知识图谱,其中提供了关于疾病、药物、症状等的检索医学知识,目的是为了让大模型学习一些相关的专业医学知识。下表1展示了CMeKG知识库中的几个医学知识样例。

表1

Knowledge-based Instruction Data

instruct-tuning是一种有助于大模型在zero-shot场景下表现出令人满意性能的tuning微调技术,但这需要有足够丰富的instruct以指导大模型学会理解instruct命令,并作出反馈,当然我们也可以根据上述医学知识可生成一系列instruct-input-output模式的数据如下表2所示。然而,对于一种医学对话问诊的大语言模型,输入通常是以问题的形式进行陈述,所以在这里作者只保留input-output模式的数据来训练HuaTuo模型。

表2

在一般领域,生成的指令需要具备足够的多样性,以应对未知任务zero-shot;而在医学领域,则更加关注大型语言模型响应中的事实是否正确。因此,在本文中,研究者首先从知识图谱中随机选择一些医学知识实例,并利用OpenAI API 基于这些特定的知识生成一系列问诊对话的训练样本8,000条(数据见项目代码 Huatuo-Llama-Med-Chinese/data/)。如下表3所示

表3

实验设置

Baselines

为了对比HuaTuo和其它基础模型的性能,作者进行了与三个基础模型的比较分析:

  1. LLaMA 作为HuaTuo的基础模型,作者选择了原生LLaMA-7B作为基础模型比较对象。

  2. Alpaca 是LLaMA的一种instruct-tuning版本模型,拥有超过80,000个在通用领域中生成的训练样本。

  3. ChatGLM 是专门为中文聊天场景设计的大语言模型,在本文的分析中,作者将HuaTuo的性能与ChatGLM-6B进行了比较。

Metrics

自然语言生成领域中常用的评估指标是BleuRouge,作者在医疗问答任务中引入了新评估指标SUS,分别代表:安全性可用性流畅性。其中,安全性维度评估生成的响应是否存在误导用户、对用户健康构成危险的潜在因素,例如错误的药物建议;可用性维度评估生成的响应是否反映了医疗专业知识;流畅性维度则评估生成模型作为语言模型的能力。

实验结果

在这项研究中,作者构建了一个中文对话场景的医疗问诊测试集,并将HuaTuo与其他三个基准模型进行了比较。为了评估模型性能,本项目招募了五名具有医学背景的专业医师,在SUS三个维度上评估模型的安全性、可用性和流畅性。SUS刻度从1(不可接受)到3(好),其中2表示可接受的响应。平均SUS得分如下表4所示。尽管LLaMA获得了最高的安全得分,但其响应常常缺乏信息且重述问题,导致可用性得分低。另一方面,HuaTuo模型显着提高了知识可用性,同时没有太多地牺牲安全性。

表4. HuaTuo与原始LLaMa,Alpaca,ChatGLM模型在SUS维度上的性能评估

往期回顾

【入门系列】万字长文带你入门计算机视觉

【入门系列】万字长文带你入门Transformer

【总结系列】目标检测20年

【总结系列】CVHub带你回顾GANs发展的8年

【工具系列】OOM?详解PyTorch显存高效利用

【工具系列】为什么你的显卡利用率总是0%?

【工具系列】2120年深度学习入门必备手册

【总结系列】一文看尽深度学习中的20种卷积

【总结系列】一文看尽深度学习中的生成对抗网络

【总结系列】一文看尽深度学习中的各种注意力机制

【总结系列】一文看尽深度学习中的各种池化方法

【总结系列】一文看尽深度学习中的各种损失函数

写在最后

如果您也对人工智能和计算机视觉全栈领域感兴趣,强烈推荐您关注有料、有趣、有爱的公众号『CVHub』,每日为大家带来精品原创、多领域、有深度的前沿科技论文解读及工业成熟解决方案!欢迎扫码与我交流,一起探讨更多有趣的话题!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/68531.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

彻底凉了!全球最大电子书网站遭美政府封站

【导读】全球最大免费数字图书馆Z-Library已经被美国查封。免费下小说的、下教材的,这下怕是要另找地方了。 最新报道显示,号称是世界上最大的免费电子图书馆Z-Library,已经被美国查封,相关的数个域名全部无法访问! …

全球饲料行业发展现状及趋势分析,亚太地区产量最高「图」

一、饲料分类 饲料是指能提供动物所需营养素,促进动物生长、生产和健康,且在合理使用下安全、有效的可饲物质。按照产品特征划分,饲料可分为配合饲料、浓缩饲料和添加剂预混合饲料。按产品品种分,饲料又可分为猪饲料、蛋禽饲料、…

水产养殖4G智能监测方案的作用和优势

传统水产养殖中,全部操作都需要由人工完成,费时费力。随着技术发展,万物互联的时代来临。水产养殖智能化监控方案系统可根据水质需要自动换水,增氧泵,监测水温、光照、PH值、浊度、电导等。养殖管理员也可以根据系统提…

搞水产的人都笑了,智慧水产养殖水质监测解决方案

一、行业背景随着近年来经济的飞速发展,水产行业也在飞速崛起。但随着养殖密度不断加大,养殖环境在逐渐日益恶化,养殖成本还在持续上涨,传统的养殖模式已无法满足现代水产养殖业的发展要求,设施智能化养殖势在必行。许…

[省级大创项目]教育类APP的探索和实践——大学物理实验助手APP开发

立项依据(项目背景及研究现状500字以内) 通过网上问卷等形式做了前期调研,网上问卷由问卷星提供技术支持,共有348份答卷,问卷链接为很抱歉,此问卷(12931895)已暂停,不能填写!。 &…

微信小程序如何调用后台接口

本课程讲解了微信小程序如何调用线上API中心接口,主要使用了wx.request去和API中心交互,API中心提供给了下面的几个接口:接口是用JFinal开发封装jfinal 用key-value形式存取数据。 API中心还提供了接口测试工具,可以在线调试API接口。 APP数据…

微信小程序---客服消息接口调用,拿来即用

如果本文对你有用&#xff0c;请爱心点个赞&#xff0c;提高排名&#xff0c;帮助更多的人。谢谢大家&#xff01;❤ 如果解决不了&#xff0c;可以在文末进群交流。 在页面中使用 <button open-type"contact" /> 可以显示进入客服会话按钮。 <button open…

chatgpt赋能python:Python自动答题:让答题变得简单

Python自动答题&#xff1a;让答题变得简单 越来越多的人喜欢参加各种各样的答题比赛&#xff0c;但是答题有时会变得很困难&#xff0c;特别是当你不知道答案的时候。好在我们有Python自动答题程序&#xff0c;可以轻松解决这个问题。 什么是Python自动答题程序&#xff1f;…

当心!经济学家分析:未来三年内做好随时失业的准备

AI人工智能又来抢饭碗了&#xff0c;这次竟然通过了公认难考的会计行业考试&#xff01; 近期&#xff0c;OpenAI的大语言模型最新版GPT-4已经完成美国注册会计师&#xff08;简称CPA&#xff09;考试&#xff0c;四大主要会计考试所有科目的平均得分为85.1。 而在CPA考试中&…

继英伟达创始人黄仁勋在上周提出“具身智能”概念后,微软联合创始人比尔·盖茨美东时间周一(5月22日)也提出了类似的畅想。

继英伟达创始人黄仁勋在上周提出“具身智能”概念后&#xff0c;微软联合创始人比尔盖茨美东时间周一&#xff08;5月22日&#xff09;也提出了类似的畅想。 盖茨表示&#xff0c;未来的人工智能个人助理将影响深远。“人们将再也不会去使用搜索引擎&#xff0c;不会去访问生产…

监听队再得一分,微软雇人听Skype通话

西雅图IT圈&#xff1a;seattleit 【今日作者】 PowerBall选号机 身体和灵魂总有一个要 走在买PowerBall的路上 很多人都习惯了用智能语音助手&#xff0c;从智能设备Google home和Alexa到iPhone的Siri&#xff0c;随着使用增加你可能发现它们最近变笨了或者变聪明了&#xff1…

苹果遭集体诉讼;华为或年底推出鸿蒙系统中低端智能手机;Facebook雇人记录用户语音通话以改善AI技术……...

戳蓝字“CSDN云计算”关注我们哦&#xff01; 嗨&#xff0c;大家好&#xff0c;重磅君带来的【云重磅】特别栏目&#xff0c;如期而至&#xff0c;每周五第一时间为大家带来重磅新闻。把握技术风向标&#xff0c;了解行业应用与实践&#xff0c;就交给我重磅君吧&#xff01; …

Python识别验证码----谷歌reCapture 4*4验证码

Python识别验证码----谷歌reCapture 4*4验证码 写在前面数据特点识别思路识别结果改进点 写在前面 近日某众打码平台被跑路的消息一出&#xff0c;脚本圈中一片哗然&#xff08;我并不是脚本圈的&#xff0c;只是喜欢看群里人吹逼而已 &#xff09;&#xff0c;仿佛再也听不到…

Python识别验证码----谷歌reCapture 3*3验证码

Python识别验证码----谷歌reCapture 3*3验证码 写在前面数据特点识别思路识别结果改进点 写在前面 近日某众打码平台被跑路的消息一出&#xff0c;脚本圈中一片哗然&#xff08;我并不是脚本圈的&#xff0c;只是喜欢看群里人吹逼而已 &#xff09;&#xff0c;仿佛再也听不到…

我问chatGPT如何学习SAP系统以及如何学习各模块的知识

文章目录 文章目录 前言 如何利用chatGPT进行学习 1.问题1&#xff1a;请给我提供一个学习SAP的路线图 2.问题2&#xff1a;如何学习SAP系统 3.问题3&#xff1a;刚开始学习SAP&#xff0c;有什么比较好的建议 最后想说 前言 学习一个新知识/新技术&#xff0c;其实就是…

Flask学习文档及问题

中文文档地址&#xff1a;https://flask.net.cn/ python三大框架的介绍。 这三个框架分别为:Flask框架,Tornado框架,Django框架。 Flask框架: Flask诞生 于2010年&#xff0c;是Armin ronacher (人名)用Python语言基于Werkzeug工具箱编写的轻量级Web开发框架。 Flask本身相当于…

WordPress CORS问题一例

​ &#xff08;本文最先发表于Zhu’s Blog&#xff0c;未经书面授权许可&#xff0c;任何个人和组织不得以任何形式转载、引用本人的任何文章。本人保留追究侵权者法律责任的权利。&#xff09; 本文记录阿猪在使用WordPress REST API为跨站应用做身份认证时遇到的一例CORS问题…

如何画业务流程图?

业务流程图是用来描述客户业务作业方式的有效手段&#xff0c;它可以清晰地客户业务流程中涉及的人员角色、业务活动、业务数据以及他们之间的关系&#xff0c;是用来澄清需求的有效手段。一个典型的业务流程图如下图所示&#xff1a; 在画业务流程图时有哪些注意事项呢&#x…

流程图在线绘制,快速、便捷、高效

Author&#xff1a;AXYZdong 自动化专业 工科男 有一点思考&#xff0c;有一点想法&#xff0c;有一点理性&#xff01; 定个小小目标&#xff0c;努力成为习惯&#xff01;在最美的年华遇见更好的自己&#xff01; CSDNAXYZdong&#xff0c;CSDN首发&#xff0c;AXYZdong原创 …

作为程序员,你一般用什么软件画流程图时序图和状态图等?

作为一名合格的程序员&#xff0c;在需求整理及功能实现的时候&#xff0c;各种流程图是避免不了的&#xff0c;像用例图、时序图、状态图基本上是必备&#xff0c;辅助分析需求及梳理实现思路。 时序图&#xff0c;又称为序列图、循序图&#xff0c;是一种UML交互图。时序图通…