数据安全分类分级与GPT的应用
文章目录
- 数据安全分类分级与GPT的应用
- 前言
- 一、ChatGPT模型
- 二、上下文关联
- 三、中文能力并不太好
- 四、如何去训练一个符合心意的模型呢?
- 总结
前言
经过两三个月的chatGPT的熟悉后,我对chatGPT的使用有了部分浅薄的经验,那么我们先来达成一个共识吧
- ChatGPT是可以训练模型的,并且它能够创建多个模型
- ChatGPT在对话的过程中,是基于数据集以及对话上下文内容关联的
- ChatGPT的中文能力并不太好,原因可见下文
- ChatGPT的模型训练,最好是基于某个特定的细节点去围绕,如果围绕大框架,那么它提供的内容也将会模棱两可
一、ChatGPT模型
我们先来说第一点,相信使用过的人都知道,ChatGPT是可以建立多个模型去专项训练的,这没什么好说的
二、上下文关联
他会基于你对话的上下文,去进行训练,初次回答时,基于数据集中相关内容进行整合,在多次对话后,逐渐训练成独有的模型。(当然,OpenAI也不是吃白饭的,他们不断的去优化一些鸡肋的选项,使其很多情况下,chatGPT依然坚持自己的数据,想改变他的某种固定的想法,你需要想尽办法命令他)
三、中文能力并不太好
当然,它本就是一款国外打造的语言模块,对一些中文的使用自然而然就产生了分歧,很多时候,它会在你不经意间写错一个字,因此全部依靠它来进行中文工作,并不是完美的事
四、如何去训练一个符合心意的模型呢?
第一段话是非常重要的,它是奠定你选择数据集的基础,当你去询问它python的某项知识时,它就会在数据集中找到这部分相关的知识。若你以此继续往细节询问,那么它就会变成python的专家。但如果你在询问后,转而问它,你了解蔡徐坤吗?它的数据集就会加大,从而使得在某些时候,你询问的内容即便是非常仔细的,它也会有明显的错误。
比如我如果想要证券的一些业务详细时,我会先让它列出 与证券相关的业务数据,当它首次运行完毕时,我会在让它根据业务数据去进行其他操作,比如对上述的每一条业务数据进行说明使用用途。
当我将我需要的框架搭建好后,比如我需要它列出 证券的业务数据、数据类型、使用用途,中文拼音,英文翻译后,我在命令它去产生更多相关的业务数据,因此,它便会将我提出的需求,继而逐渐展现。
需要记住的是,ChatGPT是回复字数似乎有限制,当它回答一半时,你可以这么说:从某处开始,继续回答。它便会与上文连贯并继续以此回答内容了。
总结
这只是我的个人经验,但他的确帮助我在工作中获得不少的便利,至少我能够训练一些我得心应手的模型,当我有未知的同一领域的问题时,我便会对同一领域的ChatGPT模型进行询问,从而解答我的部分问题。