转载公众号 | 知识管理就在夏博
不需要再重复 ChatGPT 的流行程度以及有多少精彩的用例,因为到处都有大量关于此的文章,本文主要分享如何解决当前 ChatGPT 版本的一些关键限制并将企业专有知识嵌入 ChatGPT 的想法。
在各种限制中,有三个关键限制会影响其在业务中的应用。
(1)幻觉:虽然看起来 Large Language Models (LLMs) 可以嵌入故事轨迹并做出类似人类的陈述,但最终它仍然是统计和数学计算(尽管非常复杂)。它可以以令人信服的语气产生虚假的、误导性的或不相关的信息。
(2)过时信息:它主要使用 2021 年之前生成的数据进行训练,因此没有或只有有限的最新世界和事件信息。虽然可以使用新数据重新训练模型,但考虑到准备新数据的努力和训练所需的硬件资源,不太可能经常这样做。
(3)不了解专有信息: ChatGPT 无法访问任何专有信息,除非已公开发布,这是可以理解的。
对于想要将 ChatGPT 用于其业务用例的企业,不可避免地需要克服上述限制。那么,我们有哪些选择?
一是微调:使用企业专有数据(如技术文档、政策、客户支持数据)对 ChatGPT 进行微调是一个显而易见的解决方案。但是,以可以输入 ChatGPT 的结构化格式收集和准备所有数据并非易事,可能需要针对不同用例使用不同类型的训练数据才能获得最佳结果。此外,虽然可以对微调模型继续进行微调,但几乎不可能使模型与整个企业内不断更新的所有信息保持同步。最后但同样重要的是,微调模型的使用成本明显高于标准模型。
二是事实检查器:在最近的一篇论文中,微软和哥伦比亚大学的研究人员提出了一个 LLM-AUGMENTER 系统,该系统论证了一个带有一组即插即用模块的黑盒 LLM 模型。它通过使用效用函数生成的事实/效用分数迭代修改 LLM 提示以改进模型响应。效用分数衡量 LLM 响应与知识整合者通过搜索各种外部知识源(包括专有数据)所提供证据之间的差距。如果效用分数低于某个阈值,它会将此反馈给 LLM 并提示它重新生成响应。一个限制是迭代反馈是耗时且耗费成本的过程,因为它可能需要 LLM 频繁地为单个问题生成多个响应。
三是扎根提示:为什么不可以首先提供上下文或知识,而不是事后再检查答案?我们可以使用Elasticsearch等构建的企业搜索引擎索引整个企业的各种信息,从 Wiki 页面、文档库、共享服务器到产品目录、客户数据库等,还可以使用基于向量嵌入的高级搜索方法,如 OpenAI Embedding API。对于 ChatGPT 的业务用例,将首先在整个企业中搜索用户问题,以检索和整合一组被认为与用户问题最相关的文本格式信息。然后我们将专有知识作为提示的一部分,并要求 ChatGPT 严格根据提供的知识生成响应答案。通过这种方式,ChatGPT 被用作知识吸收器而不是知晓一切的知识大师。这也对应于人类的学习行为——没有人能知道一切!然而,人类可以根据提供的信息对其进行分析、吸收,并做出理性的反应。
对于扎根提示方法,存在的一个问题与 ChatGPT 令牌限制有关,如最新发布的 gpt-3.5-turbo 最多支持 4096 个令牌。显然,这样无法在提示中提供整个企业数据。当然通过一些精心设计的工程技巧,如分层引导搜索和提示,还是可以做到令人满意的程度。另一个问题是 OpenAI API 是根据使用代币数量定价的,在提示中摄取大量令牌会产生成本影响。然而,考虑到这种方法提供的灵活性和及时性,以及与微调模型相比每个代币的价格更便宜,这样算起来其整体收益可能超过成本。
总体来说,作为一种 AI 语言模型,ChatGPT 可以为知识管理框架带来重大变革。以下是 ChatGPT 可以提供帮助的几种方式:
1、高效的信息检索:ChatGPT 可以快速准确地处理海量数据。此功能使从大量数据中检索特定信息变得更加容易。因此,可以使用 ChatGPT 搜索知识管理系统,提取相关信息并将其提供给团队成员。
2、知识创造和管理:ChatGPT 可以通过建议解决方案、策略和想法来协助创造新知识。通过提供基于数据的建议,ChatGPT 可以帮助产生新的见解,这些见解可用于优化知识管理框架。
3、沟通与协作:ChatGPT 可以作为团队成员、部门甚至与客户之间的高效沟通工具。它可以回答查询、提供建议和分享知识。它还可以使团队成员协作、分享想法并创建学习和发展社区。
4、个性化学习:ChatGPT 可以根据员工个人需求定制知识,从而提供个性化学习体验。它可以识别知识差距,建议相关内容并创建学习路径。这种学习方法可以帮助员工更快、更有效地获取知识,从而提高绩效和生产力。
5、提高效率和生产力:通过提供快速准确的信息检索、个性化学习以及有效的沟通和协作,ChatGPT 可以帮助优化知识管理框架,从而提高业务效率和生产力。
总之,ChatGPT 有可能通过提供高效的信息检索、知识创建和管理、沟通和协作、个性化学习以及提高效率和生产力来改变传统的知识管理框架,它可以带来更好的决策支撑、更高的生产力和改进的性能。
OpenKG
OpenKG(中文开放知识图谱)旨在推动以中文为核心的知识图谱数据的开放、互联及众包,并促进知识图谱算法、工具及平台的开源开放。
点击阅读原文,进入 OpenKG 网站。