个性化对话模型及知识库:自有数据在LLM上的应用方案整理

原文:个性化对话模型及知识库:自有数据在LLM上的应用方案整理 - 知乎

最近的这几个月,AIGC场景的模型与应用开始大量涌现。其中LLM(Large Language Models,大语言模型),所展现出来的自然语言理解与自然语言生成能力,不止让普通人惊喜,同样让NLP研究者看到了无数可能性。

相信过去几年在NLP场景做过应用探索的朋友,经常会因为NLG(自然语言生成)效果较差,不得不使用基于检索拼接的方式进行产出,效果相对呆板。而如今LLM带来的提升,已经可以很好解决这个问题,剩下的工作就是如何利用好LLM的能力,来进行个性化对话模型或者知识库工具的构建。

本文会对当前可用的方案进行总结对比,并给出一些案例效果作为参考。

一、提示补充

大语言模型一个主要的能力就是基于给出的上文信息进行结果生成。在输入时给模型提供问题的相关知识信息和限制要求,能够让模型更针对性的回答问题。

整体思路

  • 自有数据(文档、数据集、问答对)合理处理后,结构化保存
  • 输入问题Q来到后,根据输入问题Q检索自有数据中相关相近的内容I
  • 输入问题Q相关相近的内容I组合后,输入LLM,获得结果

适合场景

  • 单轮问答咨询,如条规咨询、规范咨询
  • 本地知识库,如chatPDF、chatDOC

优势

  • 无需训练原LLM,训练成本低
  • 自有数据易维护,方便随时增删

劣势

  • 检索时的相关相似判断标准不同,效果影响大
  • 输入长度受限,无法全面使用自有数据

一些应用案例

1、Chatglm-文档问答

文章作者基于chatGLM,对《中华人民共和国道路交通安全法》进行了分段和向量化,提问时会去数据集中使用simbertV2来找出top3相近的参考文档,同问题一起输入chatGLM。效果在常规问题上表现良好:

但在一些问题上,回答会变得不够严谨:

2、ChatGLM+langchain-本地化知识库检索与智能答案生成

langchain是用于开发基于语言模型的应用程序开发框架。总的来说,LangChain是一个链接面向用户程序和LLM之间的一个中间层。它能够较好的管理自有数据和各类LLM模型,近期的热门项目AutoGPT所使用的链式思考能力,都是由LangChain启发而来。 该文章作者使用LangChain对数据集进行管理,同时还引入网络搜索功能,增加了chatGLM可使用的参考数据,对网络热梗也能进行理解回答:

二、模型微调

微调(finetune)能够在大模型的基础上,针对自有数据专门进行再次训练,或在原有模型上调参,或生成lora类模型,得到新的特定场景大模型。相较提示补充的方式,这样得到的大模型,理论上学习到了更多自有数据。

整体思路

  • 自有数据进行数据处理,整理成适合大模型微调的训练数据
  • 使用训练数据进行模型微调,调参验证,可引入RLHF等方法
  • 选择合适的训练模型版本部署使用

适合场景

  • 多轮对话模型,如智能客服、智能顾问
  • 对话模仿,如数字孪生、数字”复活“

优势

  • 模型可参考语料内容更充足
  • 垂类多轮对话效果较好

劣势

  • 需要算力支持及深度算法基础
  • 对自有数据量有一定要求
  • 通用领域可能下降

一些应用案例

1、ChatGLM-医疗问诊

该文章作者使用ChatGLM对医疗问诊数据进行了微调,曾使用Lora方式,也使用了官方提供的p-tuning v2方式,能够看到一定的效果表现如下:

同时,依然存在数据不足、模型调优问题,出现乱回答、忘记知识等情况。

2、Alpaca-Lora让英文模型讲中文

该文章作者使用翻译后的 Alpaca 数据集,来让Alpaca原模型获得中文解答能力。该任务目标相对难度低,模型表现良好:

bad case也存在,如写代码场景:

3、[ChatGLM-考研咨询问答]

该案例是我进行的一次尝试,数据集使用了朋友的考研咨询1V1问答场景的数据,该问答场景是比较规范的一问一答模式:

在使用ChatGLM-6b版本,选择官方的ptuing v2 训练max_steps=3000后得到了如下表现的模型:

在通用类问题上的表现尚可,但在具体导师咨询时,可能是由于数据较少、回答多样的原因,出现了回答效果较差的情况。

4、GPT-FINETUNE资费调研

除了对开源模型的本地finetune以外,其实openai也给出了GPT3的finetune方案。 该文章并未给出finetune后的模型效果,但分享了大致的资费消耗:

相对来说成本还是不低,同时目前openai也仅提供了GPT3的方案,暂未对个人用户提供GPT3.5的finetune方案。

三、一些总结

无论显式的依靠补充信息,还是隐式的进行微调训练、增强训练,都还有其局限性和难度存在。在选择方法时,需要对自有数据场景做好判断,选择合适的方法。

工作8年,最初做NLP,后又做了4年多计算广告,如今终于看到在LLM的发展下,NLP终于又有了落地应用的可能性,心里还是充满了激情的,过去的几年中,NLP相较CV图像领域,实在是表现低迷,缺乏场景。相信不久的将来,会有更多的LLM垂类场景出现亮眼的表现。

编辑于 2023-04-23 10:41・IP 属地北京

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/13010.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

最新ChatGPT GPT-4 文本生成技术详解(附ipynb与python源码及视频讲解)——开源DataWhale发布入门ChatGPT技术新手从0到1必备使用指南手册(三)

目录 前言最新ChatGPT GPT-4 文本生成技术详解1 引言2 文本摘要任务2.1 什么是文本摘要?2.2 常见的文本摘要技术2.3 基于OpenAI接口的文本摘要实验2.3.1 简单上手版:调用预训练模型2.3.2 进阶优化版:基于自定义语料fine tune 3 文本纠错任务3…

ChatGPT能解决部分就业问题,平台化服务迅速涌现 | CCF C³@滴滴

杨净 整理自 凹非寺量子位 | 公众号 QbitAI 我对城市大脑的前景高度怀疑。 城市道路交通就像安卓平台,生态参与方很多。 ChatGPT时代平台化服务会迅速涌现,某种程度上解决了一部分就业问题。 …… 在最新CCF C活动现场,30余位学者专家来到滴滴…

ChatGPT 3.5/4 双双升级:更长,更便宜,更开放,更可控

OpenAI 今年早些时候发布了 gpt-3.5-turbo 和 gpt-4,并且在短短几个月内,开发者在这些模型上开发了很多令人印象深刻的应用。 6月13日, OpenAI 官宣了版本更新的内容: Chat Completions API 中新增了函数调用功能。更可控的 gpt-4…

ChatGPT提高你日常工作的五个特点,以及如何使用它来提高代码质量

ChatGPT已经完全改变了代码开发模式。然而,大多数软件开发者和数据专家们仍然不使用ChatGPT来完善——并简化他们的工作。 这就是我们在这里列出提升日常工作效率和质量的5个不同的特点的原因。 让我们一起来看看在日常工作中如何使用他们。 警告:不要…

ChatGPT 数据集之谜

ChatGPT这把火越烧越旺。国内很多大厂相继声称要做中文版ChatGPT,还公布了上线时间表,不少科技圈已功成名就的大佬也按捺不住,携巨资下场,要创建“中国版OpenAI“。 不过,看看过去半个月在群众眼里稍显窘迫的Meta的Gal…

透过ChatGPT的进化足迹,OpenAI传达了哪些信号?

古希腊神话中,一位名叫赫尔墨斯的神,会充当人神之间的信使,穿着带有双翼的飞鞋,行走在神明与人类之间。 根据《荷马史诗》的记载:“在天神中,赫尔墨斯是最喜欢引导凡人前行的。”这句话用来形容OpenAI与AI的…

炸裂——关于Azure OpenAI的几个更新

感觉好久没有写随笔了,虽然从年初至今,一直被持续不断涌现的新 AI 消息震惊,也一直不断组织和参与各种 AI 相关的活动、直播,但确实挺久没有写文字了。今天是下半年的第一天,也是暑假的第一天,忙完家务&…

腾讯员工痛诉:从阿里来的同事秀“内卷”

推荐专门分享AI技术的公众号 关注后,回复:ChatGPT ,领取账号 来源丨蚂蚁大喇叭 https://mp.weixin.qq.com/s/DblmMOXYQ7yHE_NbhaGoCA 反内卷,你该反的是你周围的“卷王”同事! 最近大厂员工手撕领导,反内卷…

为什么是毫末智行成为了DriveGPT的破壁人?

作者 | 魏启扬 来源 | 洞见新研社 毫末智行有着天生的紧迫感。 很多科技公司一年才举办一次的品牌日活动,毫末智行硬是办成了一个季度一次,活动频次的提高,则意味着组织内部新陈代谢的提速,从研发到落地乃至运营,都要…

有了数据湖,数据仓库究竟能不能被取代?

ChatGPT狂飙160天,世界已经不是之前的样子。 新建了人工智能中文站https://ai.weoknow.com 每天给大家更新可用的国内可用chatGPT资源 数据湖是近两年中比较新的技术在大数据领域中,对于一个真正的数据湖应该是什么样子,现在对数据湖认知还是…

DriveGPT自动驾驶大模型中国玩家首发!1200亿参数,毫末智行出品

贾浩楠 发自 凹非寺量子位 | 公众号 QbitAI 早知道会有这一天,但没想到如此快: GPT技术,“上车”! DriveGPT,首个应用GPT模型和技术逻辑的自动驾驶算法模型,正式官宣,中文名雪湖海若。 可能你已…

写个AI虚拟主播:看懂弹幕,妙语连珠,悲欢形于色,以一种简单的实现

这不是你期望的介绍深度学习大模型的文章。而是使用人人都能理解、编程、运行的简单技术(包括机器学习和非机器学习技术),通过一系列工程进行整合、组装,从而实现一个 AI 虚拟主播的故事。 muvtuber 让 AI 成为虚拟主播&#xff…

chatgpt赋能python:Python遍历-一种高效的数据处理技术

Python 遍历 - 一种高效的数据处理技术 对于程序员来说,数据处理是一个常见的任务。而在处理数据时,遍历是最常用的技术之一。Python 是一种强大的编程语言,它提供了很多用于数据遍历的工具和函数。在本文中,我们将介绍 Python 中…

ChatGpt输出结果时,文字中间有一根长长的删除线标记是什么意思?(ChatGpt删除线标记)

如图,这根删除线的含义是: 表示该文字不可信或是不准确的,建议仔细核实其内容。 这是系统为了提醒用户注意文字中可能存在的错误,避免对实际操作产生误导。

Stack Overflow 临时禁用 ChatGPT 生成内容,网友:人类和AI快打起来!

如果有一天我们查询到的「知识」真假难辨,那这就太可怕了。 要问最近 AI 圈哪个模型最火爆,你不得不把 OpenAI 推出的 ChatGPT 排在前面。自从发布以来,这个对话模型可谓是出尽风头,很多人更是对其产生了一百个新玩法,…

chatgpt开发内核定时器模块的完整过程

描述任务需求后,几乎在同一时刻chatgpt给出响应,开始进入代码刷屏模式,coding过程中还不忘给代码添加注释。 要求它顺便将Makefile文件写好提供给我,刷完代码后,进跟着开始刷Makefie文件: 编译生成的代码时…

MyBatisX插件没有出现蓝色鸟

如题,新版1.5.~的MyBatisX插件下载后,只有xml文件前出现红色鸟,对应的mapper接口中没有蓝色鸟。 解决办法:在idea中卸载掉该插件,加入插件页面中给出的qq群号,去群文件里下载1.4版本的压缩包,并…

新概念2-课文名称和知识点

目录 一、新概念2课文特点 二、新概念2知识点 1、新概念2知识点思维导图 2、简单句的核心 3、简单句的扩展 4、复合句 三、新概念2课文明细 一、新概念2课文特点 1)总计96篇课文,4个单元,每个单元都是逐步加深知识点 2)一…

蓝鸟BIP-1300无线终端解锁未签名程序运行权限

我司有一批BIP-1300,安装WM6系统。因为机器服役时间过长,系统很慢,于是将其中两台机器恢复了出厂设置。(F6Reset) 但是出现了一个问题,重置后的系统拒绝执行未经签名的应用程序,也拒绝Windows …

ChatGPT 成学生“作弊神器”?教授:“我感到极度恐惧”

上线没到一个月,ChatGPT 已经被网友玩出了“花”:写诗、编剧本、写代码、做计算题……在 ChatGPT 获得颇多赞誉的同时,近来一些学术界教授却发现了它另一种令人担忧的用途:学生正在利用 ChatGPT 代写论文。 为此,弗曼…