CPsyCoun: A Report-based Multi-turn Dialogue Reconstruction and Evaluation Framework for Chinese Psychological Counseling
在大模型应用于心理咨询领域,目前开源的项目有:
https://github.com/SmartFlowAI/EmoLLM (集合,生态完善)
https://github.com/qiuhuachuan/smile
https://github.com/CAS-SIAT-XinHai/CPsyCoun (该论文)
https://github.com/scutcyr/SoulChat
https://github.com/Nobody-ML/SoulStar
https://github.com/X-D-Lab/MindChat (数据集没开源)
训练一个大模型不难,难的是怎么得到领域内的数据集。该论文就提出了一个Memo2Demo的方法,使用LLM从公开的心理咨询报告中还原真实的心理咨询多轮对话。同时提出了一个综合的心理咨询综合评估方法。
1.动机:
1.已有https://github.com/FudanDISC/DISC-MedLLM等上面的项目证明了使用LLM进行对话生成和重构在数据扩增和对话去噪方面是有效的。
2.在垂直领域也应该有专门的评估指标。
2.整体流程
1.在壹点灵心理等心理咨询网站获取了3134 个类型单纯的匿名心理咨询报告,形成了CPsyCounR数据集;
2.数据集构造方法:
(1)基线:角色扮演方法。这是之前的smile等项目采用的。图中灰色的线。
(2)Memo2Demo:论文提出的两阶段方法。心理督导(LLM)首先将心理咨询报告转换为咨询笔记,然后心理咨询师(LLM)根据报告和笔记生成多轮咨询对话。
Memo Conversion:心理督导根据报告制作咨询笔记,包括基本的咨询信息和详细的咨询计划。咨询笔记的目标之一是提供与案例相关的专业见解,采用不同的心理咨询技术来解决客户的问题。同时,它还浓缩了与客户相关的核心信息,从而提高后续心理咨询过程的全面性。GLM-4。
Demo Generation:心理咨询师根据心理咨询报告和转换后的咨询笔记生成多轮咨询对话。GLM-4。
四阶段咨询框架:简化为四阶段的咨询框架,以控制对话生成的方向,提高多轮咨询对话中心理咨询师的专业性。
1.接待和询问阶段:客户介绍自己的基本情况和咨询目的
2.诊断阶段:心理咨询师分析并明确客户的心理问题,探索问题源头和严重程度。
3.咨询阶段:确认咨询目标,告知心理咨询技术,并分步执行具体计划。
4.巩固和结束阶段:回顾和总结咨询阶段的工作,让客户进行自我反思。ps:本质上还是角色扮演,大模型也是最擅长cos,加了中间的过渡有利于丰富对话转换的信息。
3.评估指标体系
设计了一个包含Comprehensiveness, Professionalism, Authenticity, and Safety等四个方面的评估指标体系,在这四个方面分解了小指标和权重。使用GPT4来判断每个小指标上的表现。
多轮对话的评估是拆分为单轮对话然后取均值的,在大于一轮时附带上历史记录:
CPsyCounE数据集:在Smile项目的基础上将对话数据分为了九大话题,每个话题手动选择了五条最具代表性的对话。用于评估。
个人总结:作者提出了一条合理的心理咨询多轮对话数据集的构造流程,是非常有价值的,而且开源了。以前我也想做关于阅读心理健康的,但是受限于这方面数据隐私性太强,搁置了。这下可以继续做了。