[AI医学] ChatDoctor:借助医学知识库生成微调样本构建医疗领域大模型

关键词:AI医疗,医疗大模型,chatdoctor,大模型finetuning,基于疾病知识库的数据生成

ChatDoctor

在LLaMA模型的基础上进行fine tuning训练,样本数据采用100k在线真实医患对话,同时加入自主知识检索能力,比如从wikipedia或者疾病数据库,通过微调训练,模型在理解患者需求和提供建议上显著提升,自主知识检索能力能够实时访问权威信息,提示模型回答的准确性。这对错误低容忍度的医疗领域来说是很重要的。
在这里插入图片描述
论文题目:ChatDoctor: A Medical Chat Model Fine-tuned on LLaMA Model using Medical Domain Knowledge
论文地址:https://arxiv.org/pdf/2303.14070.pdf
项目地址:https://github.com/Kent0n-Li/ChatDoctor

样本数据

  • HealthCareMagic-100k:网站HealthCareMagic.com上的患者真实对话100k
  • icliniq-10k:网站icliniq.com上的患者真实对话10k
  • GenMedGPT-5k:使用chatGPT生成的医患对话5k
  • alpaca-52k:同时使用了standford-alpaca模型中的样本数据52k

样本生成方式

在这里插入图片描述

  • 使用700类疾病的知识库信息,包括「疾病名称、症状、检验、药物」,借助ChatGPT生成指令训练数据

疾病知识库数据:

idx,disease,Symptom,reason,TestsAndProcedures,commonMedications
0,Panic disorder,"['Anxiety and nervousness', 'Depression', 'Shortness of breath', 'Depressive or psychotic symptoms', 'Sharp chest pain', 'Dizziness', 'Insomnia', 'Abnormal involuntary movements', 'Chest tightness', 'Palpitations', 'Irregular heartbeat', 'Breathing fast']","Panic disorder is an anxiety disorder characterized by recurring severe panic attacks. It may also include significant behavioral changes lasting at least a month and of ongoing worry about the implications or concern about having other attacks. The latter are called anticipatory attacks (DSM-IVR). Panic disorder is not the same as agoraphobia (fear of public places), although many afflicted with panic disorder also suffer from agoraphobia. Panic attacks cannot be predicted, therefore an individual may become stressed, anxious or worried wondering when the next panic attack will occur. Panic disorder may be differentiated as a medical condition, or chemical imbalance. The DSM-IV-TR describes panic disorder and anxiety differently. Whereas anxiety is preceded by chronic stressors which build to reactions of moderate intensity that can last for days, weeks or months, panic attacks are acute events triggered by a sudden, out-of-the-blue cause: duration is short and symptoms are more intense. Panic attacks can occur in children, as well as adults. Panic in young people may be particularly distressing because children tend to have less insight about what is happening, and parents are also likely to experience distress when attacks occur. ","['Psychotherapy', 'Mental health counseling', 'Electrocardiogram', 'Depression screen (Depression screening)', 'Toxicology screen', 'Psychological and psychiatric evaluation and therapy']","['Lorazepam', 'Alprazolam (Xanax)', 'Clonazepam', 'Paroxetine (Paxil)', 'Venlafaxine (Effexor)', 'Mirtazapine', 'Buspirone (Buspar)', 'Fluvoxamine (Luvox)', 'Imipramine', 'Desvenlafaxine (Pristiq)', 'Clomipramine', 'Acamprosate (Campral)']"
1

借助知识库和chatGPT生成数据如下:

{"instruction": "If you are a doctor, please answer the medical questions based on the patient's description.","input": "Doctor, I have been experiencing sudden and frequent panic attacks. I don't know what to do.","output": "Well, based on what you're telling me, it sounds like you may be suffering from panic disorder. The best course of action is to start with psychotherapy and mental health counseling. Additionally, we should conduct an electrocardiogram to make sure that there are no physical issues causing your panic attacks. We will also need to perform a depression screen and a toxicology screen to rule out any other underlying causes. Finally, I would recommend a comprehensive psychological and psychiatric evaluation and therapy to help manage your symptoms."
},
  • 生成样本数据的prompt论文中没有给出,但从最终的数据推断,及在ChatGPT上尝试,可能的prompt为:知识词条 + 格式化指令结果,例如prompt格式:
{context}
---------
基于上面的知识信息,构造医生与患者的对话,输出结果格式为:
指令:xxx, 输入:xxx, 输出:xxx

提交chatGPT的prompt:

{疾病: 过敏, 症状: "皮疹,过敏反应,皮肤瘙痒,外围水肿,皮肤异常", 医学检测:"完整物理皮肤检查完成,雾化器治疗", 药物: "苯海拉明(苯那地尔),泼尼松"}
---------
基于上面的知识信息,构造医生与患者的对话,输出结果格式为:
指令:xxx, 输入:xxx, 输出:xxx

chatGPT生成结果:

指令:描述症状
输入:我出现了皮疹、过敏反应、皮肤瘙痒、外围水肿和皮肤异常。
输出:这些症状可能表明你患有过敏。你做了什么尝试缓解症状吗?指令:建议治疗方案
输入:检查后医生告诉我确诊了过敏,要进行哪些治疗?
输出:针对过敏症状,我们可以采用苯海拉明(苯那地尔)和泼尼松等药物治疗,并采用雾化器治疗辅助缓解症状。

同步更新到:AI加油站

---------END--------

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/41887.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

LLM/ChatGPT与多模态必读论文150篇(已更至第100篇)

目录 前言 第一部分 OpenAI/Google的基础语言大模型(11篇,总11篇) 第二部分 LLM的关键技术:ICL/CoT/RLHF/词嵌入/位置编码/加速/与KG结合等(34篇,总45篇) 第三部分 Meta等公司发布的类ChatGPT开源模型和各种微调(7篇,总52篇) …

讲课大师 把微信消息同步转发到企业微信中

讲课大师现在可以把微信中的语音、文字、图片等消息,转播到企业微信中了。开发这个功能,花了快三周的时间,主要是各种事情把我弄得太苦逼,让我无法集中精力,感谢上海杜总红包的鼓励,现在终于可以发布第一个…

好文转载 【ChatGPT】ChatGPT+MindShow三分钟生成PPT

Yan-英杰的主页 悟已往之不谏 知来者之可追 C程序员,2024届电子信息研究生 目录 第一步:获取PPT内容大概: 1.打开ChatGPT镜像 2.向他提问,提问格式如下,主题替换成你想获得的信息。比如某本书的拆解,自媒…

全面上新!阿里 2023 版(Java 岗)面试突击手册,Github 已标星 37K

程序员面试背八股,几乎已经是互联网不可逆的一个形式了。自从面试**八股文火了之后,网上出现了不少 Java 相关的面试题,很多朋友盲目收集背诵,**但网上大部分的面试题,大多存在这几个问题:第一,…

来阿里一年后我迎来了第一次工作变动....

你怎么不更新啦?怎么最近动态也变少啦?都去干吗了?工作很忙么? 算起来我也阶段性停更一年半了,这一年半不仅是在不断尝试自媒体不同的内容和方向,工作上的巨大转变也推着我去学习尝试了很多全新的东西。 …

阿里P8新年自爆内部使用的十万字面试手册

这份面试手册本来是我们部门面试时自用的【大厂的员工很辛苦的,不仅要敲代码还要去帮忙内推和面试】,可后来越来越多的朋友找到我,让我帮他们给一些面试的资料和面试上的指引,而且这些关系也不太好拒绝,我本就不是那种…

946页神仙文档, 四面阿里斩获offer,直接定级P7级

前言 最近气温逐渐回暖,几个朋友聚在一起聊天的时候统一发现,新的一波招聘旺季,马上要到来,毕竟年一过就金三银四了,这次的招聘依旧竞争压力山大,作为一个开发人员,你是否面上了自己理想的公司…

阿里高效沟通的秘密:向上沟通,跨部门沟通,PREP汇报...这5招绝了!

点击“技术领导力”关注∆ 每天早上8:30推送 来源:淘系技术 作者:鲁佳(鹿迦) 世界上有两件最难的事:把别人的钱装进自己的口袋;把自己的思想装进别人的脑袋。 为什么沟通那么重要 谁都知道在工作中沟通是非常重要的&#xff0…

阿里巴巴6大行业报告免费分享啦!

云栖君导读:飞天战略营将全方位研究人工智能、大数据与关键行业的合作、联动!更有前沿案例深度解读成功企业的发展突破点,帮你抢占科技红利!全球前沿科技领域的热门新闻评论为你带来前瞻性、专业性的阅读体验! 飞天战略…

聊聊我在阿里第一年375晋升的心得

前言 思来想去,觉得这个事情除了领导赏识大佬抬爱之外,还是挺不容易的,主观认为有一定的参考价值,然后也是复盘一下,继续完善自己。 绩效 首先晋升的条件就是要有个好绩效,那么我们就先基于绩效这个维度…

在阿里晋升3次,4年拿下P8岗位,这份pdf或许对你有帮助

前言: 每一个互联网工作者都拥有一个阿里梦,而这个阿里梦的实现,除了幸运,还要靠努力。 初入阿里,是P5的位置进去的,当时校招顺利,很快就接到阿里的意向书,最后成功入职阿里。这个职…

在阿里晋升3次,5年拿下P8岗位,这份pdf记录了我的整个成长过程

前言: 每一个互联网工作者都拥有一个阿里梦,而这个阿里梦的实现,除了幸运,还要靠努力。 初入阿里,是P5的位置进去的,当时校招顺利,很快就接到阿里的意向书,最后成功入职阿里。这个职…

公司新来的阿里p8,看了我做的APP和接口测试,甩给了我这份文档

移动应用App已经渗透到每个人的生活、娱乐、学习、工作当中,令人激动、兴奋且具有创造性的各种App犹如雨后春笋般交付到用户手中。各类智能终端也在快速发布,而开发者对于全球移动设备的质量和性能却掌握甚少,App与设备的兼容性问题常常导致用…

苦卷28天,阿里P8给我的Alibaba面试手册,终于成功踹开字节大门

怎么说呢,今年真的是寒气逼人啊!在这个大环境下,裁员已经不算是特别的事情,粗暴裁员也许是未来一种趋势…在职的卷的起飞,离职的找不到好工作。 做点能做的:跑跑步骑骑车多锻炼;当当上面正版书…

我在阿里做测试,入职5个月的回顾与总结

初来阿里实习的时候,我对测试人员的职责知之甚少,在校时更是从未接触过测试工作。一头雾水之际,主管说:“做项目吧,在实战中快速成长”。从学生到校招生,我在思维和心态完成了一次真正意义上的转变&#xf…

赶上ChatGPT的车,百度文心一言和阿里通义千问上线

百度“文心一言”,地址:https://yiyan.baidu.com 阿里“通义千问”,地址:https://tongyi.aliyun.com 以下介绍来自官方: 一、“文心一言”介绍: 你好,我是文心一言 ERNIE Bot 作为一个人工…

阿里入局,通义千问备受期待

目录 官宣内测体验内容鸟鸟分鸟后言 继百度文心一言发布三周之后,4月7日阿里通义大模型终于推出通义千问,阿里正式加入ChatGPT战局。下午市场一片大热,对于深耕NLP多年的阿里,大家有足够的期待。 官宣内测 “你好,我叫…

全网最详细中英文ChatGPT-GPT-4示例文档-从0到1快速入门翻译编程语言应用——官网推荐的48种最佳应用场景(附python/node.js/curl命令源代码,小白也能学)

从0到1快速入门翻译编程语言应用场景 Introduce 简介setting 设置Prompt 提示Sample response 回复样本API request 接口请求python接口请求示例node.js接口请求示例curl命令示例json格式示例 其它资料下载 ChatGPT是目前最先进的AI聊天机器人,它能够理解图片和文字…

语音助手开发教程

注:本教程属于功能验证性质 思维导图: 1、搭建MQTT服务器(腾讯云为例) 购买云服务器,镜像选择为ubuntu系统,服务器的概要页面的网络信息栏中点击管理规则,自行添加8083、1883、18083端口&…

我和程序员打了13年交道后,为什么做了缘创派?

可能很多朋友还不认识我,我叫闫辉,曾经在CSDN工作了十三年。做过《程序员》杂志记者,CTO俱乐部的产品和运营等等。 最初加入CSDN的时候,公司也就是10来个人,办公地点就在现在的鸟巢下面,那个地方当时叫利康…