作为史上最快获1亿用户的ChatGPT以及大语言模型展现了令人惊叹的广博知识、语义理解能力与创造能力,在会话中能投人所好地承认自身错误并进行改正,并能进行一定程度的逻辑推理,还有多语种翻译与多语言编程等“超能力”,胜任诸多自然语言处理工作。现在,我们将ChatGPT对话能力和知识图谱结合起来,尝试进行突破,实现企业级认知搜索。
01 基于企业数据ChatGPT的局限
1. ChatGPT的知识是内置的
这意味着ChatGPT无法接触到人类所拥有的大量知识,可能无法回答训练数据之外的问题,无法理解生成单词的上下文语境或含义。只能根据给定的训练数据,根据某些单词或单词序列一起出现的概率生成文本。可能不会每次都回答得完全连贯或与对话的上下文相关联。
举个例子,当ChatGPT的训练数据中不包括新致新知的平台介绍,因此无法回答“新致新知”是什么。企业数据并没有参与ChatGPT的训练,因此也没有存储在ChatGPT内部。但是当设定一定的条件,ChatGPT有可能写出一个更出色的平台介绍,这个结果不是检索既有知识而是创造而得。
2. ChatGPT的知识更新是有周期的
作为一个大型语言模型,ChatGPT无法像人类那样有能力储存新的信息或经验,并利用它们来改变未来的反应。当ChatGPT在不断地学习和提高时,指的是OpenAI的工作人员在不断地通过新数据训练,微调算法来提高它的性能。随着时间的推移,让它产生更准确和相关度更高的反应。
在一段对话中,它无法从你使用的特定单词和短语中学习。只能根据它所接受的训练和所得到的算法来做出反应。它的回答不受实时对话的影响。
举个例子,ChatGPT的训练数据中包括各种食谱,但并不知道提问者的需求,因而面对笼统地要求“推荐一道名菜”,回复“北京烤鸭”,在同一会话中细化需求“我喜欢吃辣”,回复“夫妻肺片”,再说“我喜欢吃鱼”,回复“沸腾鱼香”,再说“我更喜欢酸甜口味”,回复“西湖醋鱼”。
但是,当你重新开启一段对话:推荐一道名菜,我们喜欢吃辣,喜欢吃鱼,回复:火锅涮鱼,另起一个会话,ChatGPT就“忘记了”。
3. ChatGPT的大语言模型没有内置行动能力,例如“访问外网”等
GPT是大语言模型,ChatGPT是基于GPT的对话服务。作为大语言模型,GPT没有也没有必要内置某些行动能力。ChatGPT,目前也不能访问给出的网页,但有可能在未来版本中集成行动能力 。
再举个例子,“https://www.yahoo.com/entertainment/michelle-yeoh-oscars-best-actress-acceptance-speech-043314365.html,请小结此文”,ChatGPT回复:
“这篇文章是关于演员杨紫琼在接受采访时谈到了她获得奥斯卡最佳女主角奖后的感想和演员生涯中的挑战......” 同样因为链接中包含了若干信息,ChatGPT据此推测是一篇奥斯卡最佳女主角的获奖感言,但无法推测出获奖电影是 2022年上映的《瞬息全宇宙》(Everything Everywhere All at Once)。
02 尝试突破现有局限
OpenAI的 ChatGPT 用了不到一周的时间就达到了 100 万用户,并在不到两个月的时间内突破了 1 亿用户大关。围绕这项技术的兴趣和兴奋是非同寻常的。世界各地的用户都看到了将这些大型语言模型应用于广泛场景的潜力。上述基于企业数据的ChatGPT的局限,在于将ChatGPT作为对话服务的全部,我们换个视角,将ChatGPT做为一种对话能力,就可以尝试突破现有局限。
在企业应用程序的上下文中,我们最常听到的问题是“我如何构建像 ChatGPT 这样的东西,它使用我自己的数据作为其响应的基础?”
新致新知平台将认知搜索和 OpenAI 服务的结合为这种情况提供了一个有效的解决方案: 它集成了平台在大型知识库中索引、理解和检索自己数据的片段的能力,以及ChatGPT 以自然语言交互回答问题或多语言轮流交流的令人印象深刻的对话能力,形成企业级认知搜索,使企业自己的数据可以作为响应基础。
接下来您将看到,我们即将上线版本,
基于 知识图谱平台-简历图谱 问答场景下的:
1. 查询意图识别多轮对话;
2. 知识解析与知识可读化;
3. 多语言对话的表达方式;
关于新致新知
新致新知平台是一个去中心化的安全可信知识图谱平台,通过构建超大知识图谱,助力 AI 开阔视野,致力于为企业提供一个可以快速接入、方便整合、易于扩展的平台,让技术可以更加灵活高效为业务赋能。平台提供知识图谱全生命周期管理,包括知识建模、知识获取、知识融合、知识存储、知识推理五大模块。同时通过“知识+区块链”的方式对数据资产确权,实现利用区块链数字资产确权技术,从数字资产的确权、交易、流通等环节使用智能合约将数字资源通过区块链发布到网络上,实现数字资产被确权。