Chat GPT回答特定领域的问题?

点击↑上方↑蓝色“编了个程”关注我~

1a2800678d459e9d33c3485846305ce4.png

这是Yasin的第 1 篇原创文章

651cf768ff5392f0ea6210d36bd5388f.png

Chat GPT的优势

Chat GPT基本上是最近科技圈最火的话题了,甚至给圈外的人也造成了不小的震动。Chat GPT的成功带火了其它领域的AI产品,如:AI绘画、AI语音、AI生成视频等。

Chat GPT主要有以下几个优势:

  1. 大规模训练:ChatGPT基于GPT-4架构,通过大规模的训练数据集进行训练,使其能够理解和生成各种主题和领域的文本内容。

  2. 强大的语言理解和生成能力:ChatGPT能够理解复杂的语言结构和上下文,以生成流畅、连贯、准确的回答。

  3. 多语言支持:ChatGPT支持多种语言,可以与来自不同国家和地区的用户进行交流。

  4. 高度适应性:ChatGPT可以根据用户的输入进行适应,生成有针对性的回答,应对各种情景和应用。

  5. 跨领域知识:由于其训练数据的广泛性,ChatGPT可以回答涉及多个领域的问题,如科学、技术、艺术、历史、文化等。

  6. 创意文本生成:ChatGPT具有一定的创意能力,可以用于编写故事、文章、歌词等创意性文本。

  7. 可定制性:ChatGPT可以通过进一步的微调和训练,满足特定场景、行业或领域的需求。

Chat GPT为什么能如此智能?因为它的参数多、训练数据大、训练时间长,或许还有内部的一些其他“黑科技”,毕竟目前Chat GPT版本3以上就是闭源的了。

目前国内的大厂也纷纷开始跟进大预言模型的训练,但还有很长的路要走,或许需要一年多的时间甚至更长的时间才能追赶上3.5的水平。

最近圈子内的每天都有关于AI的新闻,但作为技术人员,我们不能只停留在惊叹和使用层面,而是应该考虑「如何利用好这种AI基建」,为我们所用,来提升我们的产品和业务。

Chat GPT的局限性

尽管Chat GPT很智能,但它还是有一些局限性。

  1. 信息准确性:ChatGPT可能会提供错误或过时的信息。尽管它的训练数据非常丰富,但知识截止日期为2021年9月,因此对于最新的信息和事件可能无法提供准确答案。

  2. 逻辑一致性:在一次对话中,ChatGPT可能会给出不一致的回答。它可能在不同回答中展示出相互矛盾的观点。

  3. 缺乏深入理解:虽然ChatGPT可以回答很多问题,但它可能缺乏对某些问题的深入理解。它主要依赖模式匹配和语言模型来生成回答,而不是真正理解问题的本质。

  4. 过于冗长或过于简化的回答:有时ChatGPT可能会生成过于冗长或过于简化的回答,可能不完全满足用户的需求。

  5. 不恰当的内容:ChatGPT有时可能生成不恰当或具有偏见的内容。虽然已经采取了一定的措施来减少这种情况的发生,但仍然需要用户注意并进行筛选。

  6. 无法进行实时互动:ChatGPT无法进行实时语音或视频互动,仅限于文本交流。

  7. 容易受输入的影响:ChatGPT的回答容易受用户输入的影响,可能导致输出的质量波动。

  8. 泛化能力受限:对于某些特定领域或行业,ChatGPT可能缺乏足够的专业知识,需要进一步定制和训练以满足特定需求。

总结下来,如果我们需要在某些专业领域或者场景需要让Chat GPT为我们所用,我们主要需要解决「两个问题」

  1. 我有一些「私有的或者专业的知识库」,没有进过Chat GPT的训练池。如何让Chat GPT学习到这些知识库,并返回这个知识库的内容?比如客服场景、医疗场景。

  2. 我有一些自动化的程序要跟Chat GPT打通,消费Chat GPT返回的数据。如何让Chat GPT返回我「需要的格式」?例如某种json?比如智能购物、智能家居等场景。

->

PS:GPT 3.5 的单词对话上下文token限制是4k,4.0也只有8k和32k的选项,对于庞大的专业知识库来说可能远远不够。而且token真的很贵!

<-

最近对这方面有一些研究,这篇文章主要总结这方面的思路和实践。

几种思路

要让AI回答特定领域的问题,我总结了几种实现思路。思维导图如下:

6a544c529a7b62d474ae134a70428801.png

方案一这里就不详细介绍了,是业内已经比较成熟的思路。但由于底层没有Chat GPT 3.5或者4这么强大的模型加持,可能训练出来了的智能程度也不太够,效果不好。但在一些场景其实是已经有所应用了的,比如搜索、推荐等。

Fine-tuning

Fine-tuning(微调)是深度学习中一种常用的技术,它在预训练模型的基础上进行二次训练,以适应特定任务或领域。对于ChatGPT这类大型预训练语言模型,fine-tuning有以下作用:

  1. 适应特定任务:通过在特定任务的数据集上进行fine-tuning,可以使模型更好地适应这些任务,如情感分析、文本分类、问答系统等。

  2. 提高模型性能:由于预训练模型已经学习到了大量的通用知识,因此在进行fine-tuning时,模型可以更快地收敛并达到较高的性能。

  3. 节省计算资源:与从零开始训练模型相比,fine-tuning需要较少的数据和计算资源。这是因为预训练模型已经学习到了很多有用的特征和知识,只需在此基础上进行调整。

  4. 专业领域知识:通过在特定领域的数据集上进行fine-tuning,可以使模型学习到领域相关的知识和术语,提高在该领域的应用性能。

  5. 减少过拟合:在某些情况下,fine-tuning可以帮助减少过拟合,因为模型在预训练阶段已经学习到了很多通用特征,使得模型在二次训练时不容易过度依赖训练数据的特征。

  6. 定制化输出:通过fine-tuning,可以使模型生成更符合特定场景、行业或领域的文本,例如生成更符合公司风格的文案或回答特定行业问题。

简单来说,使用Fine-tuning相当于在Chat GPT模型的基础上进行微调,可以做到:「提高领域的专业性,定制化回答风格」这两件事情。

官网也有非常详细的说明和使用教程:

2954a3d62086e6d9f72eb912184a708d.png

翻译一下这几点优势就是:

  • 比Prompt引导返回的质量更高

  • 能够用更多的训练数据去训练(prompt有4k等限制)

  • 可以节约token(prompt每次都会携带token)

  • 更少的请求次数(prompt可能需要携带上下文多次请求才能得出想要的结果)

用大白话说,Fine-tuning比Prompt更省钱,功能也更强大。

但是,Fine-tuning也有劣势:

  1. 底层是基于Chat GPT3的,不如3.5和4智能(未来可能会改善);

  2. 需要自己训练模型、调用模型,开发工作量会大一点;

  3. 相比于Chat GPT的API来说,「贵了很多」,成本很高。

da240dbe1fbc06f1b5e70173bc87efca.png

Fine-tuning适合的场景:对生成的内容有风格要求、领域要求、格式要求,且prompt不能实现的场景(如prompt很有可能会超限制、不好描述全集等)。

比如微软的「Copilot代码生成工具就是用Chat GPT fine-tuning得来的」,成为了“编程”这个垂直领域的高评分神器。这种训练方式同样适用于其它垂直领域。

Prompt

Prompt是通过一小段引导词对Chat GPT设置规则,Chat GPT能够通过上下文来理解我们的规则。

我们在没有使用Prompt时,Chat GPT的返回更像是在聊天,类似于自然语言。比如我们想让Chat GPT帮我建表,Chat GPT并不能理解我想要的“建表”指的是什么,它会返回给我如下的示例:

640e49803c28a0b61b44404378fe893e.png

然而,但我们设置了Prompt后,比如我最喜欢用的一个建表Prompt:

8f188d295c41454414ace184b2fa6fd2.png

一些小技巧

  1. system和user、assistent的区别:很多网上的prompt教程都会把prompt作为user的输入使用。这种使用方式也可以达到效果,但不能达到最佳的效果。最佳的效果是system设置规则,user和assistent设置“示例对话”

  2. temperature设置为0,防止Chat GPT乱飙。

Tips:「示例对话非常重要」!同样一段prompt,有示例对话和没有示例对话差距很明显:

无示例对话:

3c6447a94b1904cf64ced5a912c5496a.png

有示例对话:

66d70ff6c051757cbb9171b70312dbf8.png 7241e99bfe0576c73481c9720722a7a1.png

Embedding

Chat GPT是基于GPT模型的大型语言模型,它的Embedding是一个从原始文本中学习到的向量表示,也称为词向量或嵌入向量。Embedding的目的是将原始的文本数据转换为机器可以处理的数值形式,并且将具有相似语义的单词映射到相似的向量空间位置,从而为模型提供更好的语义信息。

Chat GPT使用了基于Transformer架构的模型,在这种模型中,Embedding层是由一个固定大小的词向量矩阵组成的,其中每一行代表一个单词的嵌入向量。这些嵌入向量在训练过程中被学习到,使得在相似的上下文中出现的单词被映射到相似的向量空间位置。这种方式可以帮助模型理解语言的含义和语义,从而更好地处理自然语言处理任务。

简单来说,embedding特别适合于「私域知识的问答场景」。它相当于可以在本地对私域知识进行切割,通过embedding获取到的向量,到本地的向量数据库找到相近的几条向量(对应几条文本)。

如果想要从这几条文本中进一步选择最优的,还可以组成prompt给Chat GPT选择,但这就大大降低了Prompt的大小,节省了很多token,还不会超出最大token限制。

embedding的工程步骤:

  1. 【embedding open api】特定领域数据集转化为固定长度的连续向量,本地存库

  2. 【embedding open api】用户输入的问题转换为固定长度的连续向量

  3. 【本地】根据向量来查询匹配相关性高的前n条记录

  4. 把2和3对应的文本组合成prompt,调用chat open api,让chat gpt选择最优的一条

核心作用:对prompt进行拆分,降低prompt的长度,尤其适合问答类场景。

aca74d97ff8bf0bf85b9d8ee46021fca.png

关于作者

我是Yasin,一个爱写博客的技术人

微信公众号:编了个程(blgcheng)

个人网站:https://yasinshaw.com

不用魔法和GPT账号的AI聊天机器人

chat.yasinshaw.com

欢迎关注这个公众号37fe8a9935435b815bbb491315af095a.png

4c892531b266387871475240e8976b79.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/61524.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

gpt 自己实现搭建

如果觉得官方免费的gpt&#xff08;3.5&#xff09;体验比较差&#xff0c;总是断开&#xff0c;或者不会fanqiang&#xff0c;那你可以自己搭建一个。但前提是你得有gpt apikey。年初注册的还有18美金的额度&#xff0c;4.1号后注册的就没有额度了。不过也可以自己充值。 有了…

大模型时代,程序员的技能演进——盘点那些更重要的、和不再重要的能力

点击上方蓝字关注获取更多资讯 Part.1 “程序员”的工作&#xff0c;还是不是“写程序”&#xff1f; 曾经&#xff0c;“程序员”的职责是非常明确的&#xff1a;编写和调试代码&#xff0c;让应用程序正常工作。在这个意义上&#xff0c;胜任“程序员”的工作其实并不是太难&…

独家对话黄仁勋:关于生成式AI、算力能耗的一些追问

来源&#xff1a;与非网eefocus 作者&#xff1a;张慧娟 随着ChatGPT的爆火&#xff0c;黄仁勋最近频频强调&#xff1a;“我们正处于AI的iPhone时刻”。GTC上&#xff0c;他对媒体详解了这一观点的由来&#xff0c;在他看来——一个新的计算平台已经开发出来了。 过去大约每15…

被“误解”的游戏开发者

如果让我站在自己的角度用一句话概括这个游戏开发这个专业&#xff0c;我必须要说&#xff1a;游戏开发是个“坑”&#xff0c;而且是个“天坑”。 作者 | 开发游戏的老王 责编 | 梦依丹 出品 | CSDN&#xff08;ID&#xff1a;CSDNnews&#xff09; 各位游戏开发者大家好…

情系儿童,暖席番禺——绿日同学公益组织青少年开展同辈关怀活动

“谢谢你&#xff08;们&#xff09;来了&#xff01;” 近日&#xff0c;训练营学员来到了洛浦街南浦西一村小s&#xff08;化名&#xff09;家&#xff0c;并将“东风快递”送到了小s手上。小s迫不及待的打开礼物并与“妈妈”分享着收到礼物后的快乐。 小s开心地与当“妈妈”…

第一次参加幼儿园家长开放日活动

今天&#xff0c;第一次参加孩子在幼儿园的家长开放日活动&#xff0c;能有这样一个机会近距离感受孩子在幼儿园生活情况&#xff0c;观看孩子在幼儿园生活的点点滴滴。 作为家长的我心情无比激动&#xff0c;昨晚竟然激动到睡不到觉&#xff0c;然后今天一大早就起床准备。 在…

白下高新区妇联、科协举办亲子活动,小朋友们走进云创大数据

为了让白下高新区员工及子女感受到高新区妇联的关怀&#xff0c;从而进一步增强对企业的认同感和归属感&#xff0c;营造和谐幸福的企业文化氛围&#xff0c;也为孩子们的茁长成长撑起一片天&#xff0c;7月31日&#xff0c;高新区妇联、科协联合钟晓敏爱心工作室举办了亲子活动…

GP官网上的TEE学习课程和费用介绍

★★★ 个人博客导读首页—点击此处 ★★★ 在optee的官网上&#xff0c;我们可以看到有TEE/SE等相关的培训课程&#xff0c;竟然要好几十万… 我们交不起学费&#xff0c;但我们可以参照其课程目录进行学习&#xff01;&#xff01;&#xff01; TEE Technical Specification…

送给孩子的趣味通信课

谨以此文&#xff0c;送给天下所有的孩子 也送给我的女儿&#xff08;她今天过生日&#xff09; 也希望这篇PPT&#xff0c;能够帮到所有当父母的通信人 祝你们永远快乐&#xff01; 作者&#xff1a;小枣君、姚士鸵 注&#xff1a;图片全部来自网络&#xff0c;侵权请联系删除…

Campus Talking 小记(6)

Let us to make our app 在前一段时间中&#xff0c;我有几场面试&#xff0c;所以耽误了一段时间&#xff0c;所以现在与个各位见面&#xff0c;今天本来是去进行底部导航栏第二部分的一个编写&#xff0c;也就是一个视频模块的编写&#xff0c;但是由于一些问题没有解决&…

情系儿童 暖席广州

导语&#xff1a;新修订的《中华人民共和国未成年人保护法》于2021年6月1日正式实施&#xff0c;为全面贯彻新未成年人保护法&#xff08;简称&#xff1a;未保法&#xff09;的宣传工作&#xff0c;广泛凝聚保护未成年人合法权益的社会共识&#xff0c;推动未保工作的深入开展…

c语言幼儿园积木游戏,干货来袭!超详细幼儿园游戏活动教案

原标题&#xff1a;干货来袭&#xff01;超详细幼儿园游戏活动教案 育儿 干货 幼儿园游戏详细教案 运乒乓球 1 游戏目的 练习推爬、持物走&#xff0c;提高身体的协调性和平衡能力。 游戏准备 1、自制车轮箱&#xff0c;奶箱&#xff0c;易拉罐梅花桩&#xff0c;乒乓球&#x…

定向寻宝亲子活动设计思路和实操(附2019最新教程)

亲子定向为什么一直深受家长和孩子的喜爱&#xff1f;总结有以下3点 1.寓教于乐&#xff0c;锻炼幼儿能力 作为而儿童运动的一种&#xff0c;定向寻宝具有智力和体力并重的特点。孩子可以在与大自然的接触中&#xff0c;分享活动乐趣、体会亲子温情&#xff0c;同时提升运动和…

Campus Talking 小记(2)

Let us to make our app 根据昨天的进度&#xff0c;我们已经制作了我们的启动页面&#xff0c;有一个启动页面是不是很有正规app的那个味儿&#xff0c;哈哈哈哈&#xff0c;反正我是这么想的。在做了一个启动页面之后&#xff0c;我们来到了登陆页面。&#xff08;我的项目编…

真人CS、趣味拓展、空中断桥、越野车、露营 2天亲子活动方案

真人CS、趣味拓展、空中断桥、越野车、露营 2天亲子活动方案 时间安排 项目安排 第一天 08:00-09:30 集合&#xff0c;清点人数&#xff0c;乘车前往指定拓展基地 09:30-12:00 团队熔炼&#xff1a;破冰分组、团队建设、团队展示 挑战项目&#xff1a;亲子CS 12:00-13…

面对疫情 你可以这样面对—番禺区青少年儿童综合能力训练营开营

近段时间&#xff0c;新冠疫情在全国多点出现&#xff0c;部分青少年因此出现情绪困扰&#xff0c;日前&#xff0c;由区民政局指导、区慈善会主办、区社联会承办的区第七届公益慈善创投资助项目——“牵手成长”番禺区青少年儿童综合能力提升训练营&#xff08;下文简称“训练…

关注流动儿童心理健康,这场亲子营游学活动很“有爱”

近日&#xff0c;由广州市组织管理局、中共广州市社会组织委员会、广州市社会组织联合会指导&#xff0c;广州市福彩公益金资助&#xff0c;广州市为本社会心理慈善服务中心承办&#xff0c;第八届广州市社会组织公益创投“爱无限心关爱”助力健康中国共筑成长路——流动儿童心…

2019美团点评笔试编程题(A~Z美团骑手)

晚了17分钟。17&#xff1a;17分做出来了。。。。但是我由于迟到了五十分钟才开始的&#xff0c;美团竟然不像腾讯一样&#xff0c;迟到时间不计算。唉无缘了。前面的选择题真的好几道不看就狂选&#xff0c;节约时间。还有那个伪代码论述题是关于 “六度空间理论”&#xff0c…

“我培训完JAVA,进了美团,美团氛围特别好,就是送餐特别累”

周末不想做饭&#xff0c;外面又下了点小雨&#xff0c;于是点了个外卖&#xff0c;没过多久外卖小哥就到了&#xff0c;门敞着&#xff0c;我斜躺在沙发上刷《神盾局》第七季&#xff0c;示意小哥放在桌子上就可以了。 小哥把餐盒放在桌子上&#xff0c;瞥见我桌上的一本《JAV…

学python能赚什么外卖-用python模拟美团外卖骑手推送请求

项目中接入了美团外卖配送接口&#xff0c;当骑手进行接单、取货等操作时&#xff0c;会将这些操作推送到第三方系统中&#xff0c;在测试环境下&#xff0c;并没有真正的骑手会接单&#xff0c;我们需要模拟正式环境推送的信息&#xff0c;此时就可以用python模拟请求来进行这…