技术动态 | 如何将ChatGPT和企业专有知识结合起来?

转载公众号 | 知识管理就在夏博


836ddbd18d07091f7644d70c5e3a2c84.png

    不需要再重复 ChatGPT 的流行程度以及有多少精彩的用例,因为到处都有大量关于此的文章,本文主要分享如何解决当前 ChatGPT 版本的一些关键限制并将企业专有知识嵌入 ChatGPT 的想法。

    在各种限制中,有三个关键限制会影响其在业务中的应用。

    (1)幻觉:虽然看起来 Large Language Models (LLMs) 可以嵌入故事轨迹并做出类似人类的陈述,但最终它仍然是统计和数学计算(尽管非常复杂)。它可以以令人信服的语气产生虚假的、误导性的或不相关的信息。

    (2)过时信息:它主要使用 2021 年之前生成的数据进行训练,因此没有或只有有限的最新世界和事件信息。虽然可以使用新数据重新训练模型,但考虑到准备新数据的努力和训练所需的硬件资源,不太可能经常这样做。

    (3)不了解专有信息: ChatGPT 无法访问任何专有信息,除非已公开发布,这是可以理解的。

    对于想要将 ChatGPT 用于其业务用例的企业,不可避免地需要克服上述限制。那么,我们有哪些选择?

    一是微调:使用企业专有数据(如技术文档、政策、客户支持数据)对 ChatGPT 进行微调是一个显而易见的解决方案。但是,以可以输入 ChatGPT 的结构化格式收集和准备所有数据并非易事,可能需要针对不同用例使用不同类型的训练数据才能获得最佳结果。此外,虽然可以对微调模型继续进行微调,但几乎不可能使模型与整个企业内不断更新的所有信息保持同步。最后但同样重要的是,微调模型的使用成本明显高于标准模型。

    二是事实检查器:在最近的一篇论文中,微软和哥伦比亚大学的研究人员提出了一个 LLM-AUGMENTER 系统,该系统论证了一个带有一组即插即用模块的黑盒 LLM 模型。它通过使用效用函数生成的事实/效用分数迭代修改 LLM 提示以改进模型响应。效用分数衡量 LLM 响应与知识整合者通过搜索各种外部知识源(包括专有数据)所提供证据之间的差距。如果效用分数低于某个阈值,它会将此反馈给 LLM 并提示它重新生成响应。一个限制是迭代反馈是耗时且耗费成本的过程,因为它可能需要 LLM 频繁地为单个问题生成多个响应。

    三是扎根提示:为什么不可以首先提供上下文或知识,而不是事后再检查答案?我们可以使用Elasticsearch等构建的企业搜索引擎索引整个企业的各种信息,从 Wiki 页面、文档库、共享服务器到产品目录、客户数据库等,还可以使用基于向量嵌入的高级搜索方法,如 OpenAI Embedding API。对于 ChatGPT 的业务用例,将首先在整个企业中搜索用户问题,以检索和整合一组被认为与用户问题最相关的文本格式信息。然后我们将专有知识作为提示的一部分,并要求 ChatGPT 严格根据提供的知识生成响应答案。通过这种方式,ChatGPT 被用作知识吸收器而不是知晓一切的知识大师。这也对应于人类的学习行为——没有人能知道一切!然而,人类可以根据提供的信息对其进行分析、吸收,并做出理性的反应。

    对于扎根提示方法,存在的一个问题与 ChatGPT 令牌限制有关,如最新发布的 gpt-3.5-turbo 最多支持 4096 个令牌。显然,这样无法在提示中提供整个企业数据。当然通过一些精心设计的工程技巧,如分层引导搜索和提示,还是可以做到令人满意的程度。另一个问题是 OpenAI API 是根据使用代币数量定价的,在提示中摄取大量令牌会产生成本影响。然而,考虑到这种方法提供的灵活性和及时性,以及与微调模型相比每个代币的价格更便宜,这样算起来其整体收益可能超过成本。

    总体来说,作为一种 AI 语言模型,ChatGPT 可以为知识管理框架带来重大变革。以下是 ChatGPT 可以提供帮助的几种方式:

    1、高效的信息检索:ChatGPT 可以快速准确地处理海量数据。此功能使从大量数据中检索特定信息变得更加容易。因此,可以使用 ChatGPT 搜索知识管理系统,提取相关信息并将其提供给团队成员。

    2、知识创造和管理:ChatGPT 可以通过建议解决方案、策略和想法来协助创造新知识。通过提供基于数据的建议,ChatGPT 可以帮助产生新的见解,这些见解可用于优化知识管理框架。

    3、沟通与协作:ChatGPT 可以作为团队成员、部门甚至与客户之间的高效沟通工具。它可以回答查询、提供建议和分享知识。它还可以使团队成员协作、分享想法并创建学习和发展社区。

    4、个性化学习:ChatGPT 可以根据员工个人需求定制知识,从而提供个性化学习体验。它可以识别知识差距,建议相关内容并创建学习路径。这种学习方法可以帮助员工更快、更有效地获取知识,从而提高绩效和生产力。

    5、提高效率和生产力:通过提供快速准确的信息检索、个性化学习以及有效的沟通和协作,ChatGPT 可以帮助优化知识管理框架,从而提高业务效率和生产力。

    总之,ChatGPT 有可能通过提供高效的信息检索、知识创建和管理、沟通和协作、个性化学习以及提高效率和生产力来改变传统的知识管理框架,它可以带来更好的决策支撑、更高的生产力和改进的性能。


OpenKG

OpenKG(中文开放知识图谱)旨在推动以中文为核心的知识图谱数据的开放、互联及众包,并促进知识图谱算法、工具及平台的开源开放。

9a0a8e5c3cdaefe82ee34c39a00b7219.png

点击阅读原文,进入 OpenKG 网站。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/59405.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

微软震撼开源DeepSpeed Chat,一键实现ChatGPT的端到端RLHF训练

编|Aeneas 好困源|新智元 微软开源的DeepSpeed Chat,让开发者实现了人手一个ChatGPT的梦想! 人手一个ChatGPT的梦想,就要实现了? 刚刚,微软开源了一个可以在模型训练中加入完整RLHF流程的系统框…

“开源ChatGPT”:PaLM-rlhf-pytorch

就说程序员的手速有多快吧,首个开源ChatGPT项目已经出现了! 基于谷歌语言大模型PaLM架构,以及使用从人类反馈中强化学习的方法(RLHF),华人小哥Phillip Wang复刻了一个ChatGPT出来。 项目GitHub星已经超过1.7k了,而且还在一路飙升ing。 不过一反常态的是,网友们看到“开…

英语听力,这练习很简单

首先,跟大家推荐一个软件,亲测真的巨好用,听力,口语,词汇一把抓。 就是它,每日英语听力,你提高听力最需要的单句精听它有噢,建议每次听一遍,把句子写下来,重…

ChatGPT精通:使用ChatGPT-4的专家提示工程

大师ChatGPT,专家提示工程,提高生产力,探索开放人工智能GPT-4和生成人工智能技术,探索ChatGPT的激动人心的世界,并利用这一关于掌握OpenAI最新创新GPT-4的深入而全面的课程来驾驭人工智能驱动的对话技术的力量。本课程…

计算机中职生自我介绍500字,中专生自我介绍500字

中专生自我介绍500字 当我们在一个陌生场合中,我们难以避免地要作出自我介绍,用自我介绍往往可以来展示自己。那么我们该怎么去写自我介绍呢?以下是小编为大家收集的中专生自我介绍500字,欢迎阅读,希望大家能够喜欢。 …

面试自我介绍范文(30篇)

面试自我介绍范文(30篇) 当来到一个新环境时,我们总归要向他人介绍自己,自我介绍是让陌生人彼此认识的好方法。如何编写一段个性的自我介绍? 面试自我介绍范文1 各位面试官: 大家好! 我叫__,就读于__大学金…

超级计算机作文500字初中,自我介绍初中作文500字(精选9篇)

自我介绍初中作文500字(精选9篇) 当到达一个陌生的环境后,通常需要用到自我介绍,通过自我介绍可以让别人认识自己。如何写出一个与众不同的自我介绍?以下是小编帮大家整理的自我介绍初中作文500字(精选9篇),欢迎阅读与收藏。 自我…

ChatGPT-4开通方法和费用

**[文章来源](https://bk.suning.info):https://bk.suning.info** 哪里可以用gpt-4,gpt-4相较于gpt3.5又有了逻辑性和图片识别等方面的加强,今天跟大家分享gpt-4使用的方法。 想要使用GPT-4模型,我们需要订阅付费的ChatGPT(ChatGPT的高级版…

【力扣刷题1-10】

力扣刷题1-10 力扣刷题1-10 1、两数之和1.1 题目1.2 分析1.3 代码实现 2、两数相加2.1 题目2.2 分析2.3 代码实现 3、无重复字符的最长子串3.1 题目3.2 分析3.3 代码实现 4、寻找两个有序数组的中位数4.1 题目4.2 分析4.3 代码实现 5、最长回文子串5.1 题目5.2 分析5.3 代码实现…

力扣刷题汇总

力扣刷题汇总 C基础知识学习:一、数组例题 二、链表参考理论C/C的定义链表节点方式知识点例题 三、哈希表参考理论例题 四、字符串例题KMP算法 五、双指针法例题 六、栈与队列(栈和队列都是容器适配器)参考理论数据结构学习(queue…

力扣刷题记录-4

目录 No.226No.112No.700No.701No.98No.653No.235 No.226 复盘: 1、这道题的核心思路是递归 2、首先将叶子节点进行翻转,然后回到它的父节点,如果其左右结点都已翻转,则直接交换两个子树 这样一直递归至根节点,则算法完…

BAT程序员总结的力扣刷题指南,已经在Github了!!刷题顺序,优质题解一网打尽!

相信很多小伙伴刷题的时候面对力扣上近两千道题目,感觉无从下手! 我花费半年时间整理了Github学习项目「力扣刷题攻略」: https://github.com/youngyangyang04/leetcode-master 先上上图吧! 项目中整体顺序为:前序&a…

【力扣刷题 | 第六天】

目录 前言: 344. 反转字符串 - 力扣(LeetCode) 541. 反转字符串 II - 力扣(LeetCode) 今天我们进入字符串章节的刷题旅程,希望各位小伙伴可以和我一起坚持下去,一起征服力扣! 前言…

力扣题库刷题笔记682-棒球比赛

1、题目如下&#xff1a; 2、个人Python代码实现如下&#xff1a; 代码如下&#xff1a; class Solution: def calPoints(self, operations: List[str]) -> int: i 0 #用于遍历元素的下标 while i < len(operations): …

力扣刷题【第一期】

文章目录 1.爬楼梯2.求两数的和&#xff08;283&#xff09;3.移动零&#xff08;283&#xff09;3.1 题目描述3.2 算法描述3.3具体实现 4.合并有序连表&#xff08;21&#xff09;4.1 题目描述4.2 算法思想4.3 代码实现 5.删除连表中重复的值&#xff08;83&#xff09;5.1 题…

力扣刷题Day4

24. 两两交换链表中的节点 题目&#xff1a;力扣 难点在与如何模拟节点的交换&#xff0c;在编码实现的时候容易出现杂乱而导致循环节点的出现。 在自己实现的时候&#xff0c;出现的错误&#xff1a; 把head和head.next作为迭代的基准&#xff0c;但是存在的问题是&#x…

力扣刷题流程--记录用

目前已完成第一小节的做题任务&#xff0c;前路漫漫啊。 第一部分 数据结构基础&#xff08;155 题&#xff09; 数组和字符串&#xff08;22 题&#xff09; 数组类算法&#xff08;12 题&#xff09; 链表&#xff08;15 题&#xff09; 队列 & 栈&#xff08;2…

【力扣刷题 | 第五天】

目录 前言&#xff1a; 15. 三数之和 - 力扣&#xff08;LeetCode&#xff09; 18. 四数之和 - 力扣&#xff08;LeetCode&#xff09; 结束&#xff1a; 前言&#xff1a; 今天两道题类型相似&#xff0c;解法思路一致&#xff0c;都利用了双指针技术。 15. 三数之和 - 力…

力扣-刷题记录

189. 轮转数组 给定一个整数数组 nums&#xff0c;将数组中的元素向右轮转 k 个位置&#xff0c;其中 k 是非负数。 力扣https://leetcode.cn/problems/rotate-array/description/ void rotate(int* nums, int numsSize, int k){if(k > numsSize){k % numsSize;}if(k0){f…

出海周报|Temu在美状告shein、ChatGPT安卓版上线、小红书回应闪退

工程机械产业“出海”成绩喜人&#xff0c;山东相关企业全国最多Temu在美状告shein&#xff0c;跨境电商战事升级TikTok将在美国推出电子商务计划&#xff0c;售卖中国商品高德即将上线国际图服务&#xff0c;初期即可覆盖全球超200个国家和地区ChatGPT安卓版正式上线&#xff…