科技云报道:ChatGPT的胜利,宣告知识图谱的消亡?

科技云报道原创。

过去10年,知识图谱可谓是最接近“人工智能”的概念。业内普遍认为,知识图谱的概念最先是由谷歌于2012年正式提出,主要用来支撑下一代搜索和在线广告业务。

此后,这项技术迅速火爆,被国内外多家搜索引擎公司所采用,如:美国的微软必应,中国的百度、搜狗等,都在短短的一年内纷纷宣布了各自的“知识图谱”产品,足以看出这项革新对整个搜索引擎界的整体影响。

但这项技术的应用并不仅拘泥于搜索引擎领域范围。由于让人工智能具备了认知能力和逻辑能力,知识图谱进而实现了智能分析、智能搜索、人机交互、个性化推荐等场景应用,成为互联网知识驱动的智能应用的基础设施。

可以说知识图谱与大数据和深度学习一起,成为推动互联网和人工智能发展的核心驱动力之一。

然而,ChatGPT的横空出世让整个AI界都沸腾了。

在这里插入图片描述

ChatGPT带来的震撼在于,它不用借助知识图谱就可以很好地解决用户对话知识问答相关的任务,具有非常强大的理解能力、流畅的对话能力和上下文的刻画能力。

更重要的是,它将原来基于特定任务的模型变成了一个统一的、基于提示的、任务无关的模型,可以去尝试解决非常复杂或困难的、人类参与很多的任务。

这也让AI界认知产生了分化,有观点认为有了ChatGPT这种大语言模型后,知识图谱完全没有存在的意义,甚至有的公司已经彻底抛弃了知识图谱路线。

那么,在大模型时代,知识图谱真的要消亡了吗?

知识图谱vs大语言模型

在讨论这个问题之前,先来了解一下知识图谱和大语言模型的异同。

知识图谱从字面上看,可以拆分为知识+图谱,这样就可以理解:将需要的知识数据(结构化或非结构化数据)以图谱的形式进行展示,这种简单的过程也是知识图谱的构建过程。

知识图谱通常包含实体、关系和属性三个要素,例如人名、国家、语言等实体,以及人口、首都、官方语言等关系和属性。它可以根据图谱中定义的关系提供精确且逻辑一致的答案,因此对于信息检索、问答和结构化数据推理等任务特别有用。

大语言模型是基于深度学习和神经网络,像GPT-4这样的大语言模型是在大量文本数据上进行训练,以学习模式、上下文以及单词和短语之间的关系。

它们可以生成类似人类的文本、回答问题、提供建议以及执行其他自然语言任务,还可以很好地处理模棱两可和不完整的信息,并且处理广泛的主题。

不难发现,两者在知识的学习、分析、推理方面有着类似的功能,但却各有优劣势。

知识图谱通常需要手动或半自动构建,是一种非常耗时耗人力的工作,随着知识的不断扩展和变化,知识图谱也需要不断更新;

同时,它的作用仅限于图谱编码中的知识范围,这使得它在处理模棱两可或不完整的信息时准确率较低。

但它的优势在于准确的知识库,对于事实性的、专业性的知识有着非常高的准确度。

相反,专业知识在大模型训练语料里占比非常少,这也使得ChatGPT等语言大模型生成的内容的可靠性和真实性备受质疑。

它无法将真实与想象、真实与虚构分开,这种现象甚至促使创造了一个新术语:人工智能幻觉,维基百科将其定义为“人工智能的自信反应,其训练数据似乎没有合理性”。

同时,语言大模型需要大量的计算能力和资源来进行训练和微调,其花费的时间和成本也不容小觑。

目前,语言大模型只在通用领域给出了较为惊艳的表现,至于在知识图谱广泛应用的垂直领域,语言大模型暂时未显示出领先的一面。

知识图谱退场为时尚早

正因为语言大模型暂时还无法解决事实准确性、可信度、可追溯等问题,知识图谱的存在就非常有意义。

知识图谱或者类似的知识库、知识引擎,能够为大模型提供准确的知识,它可以被用来通知、聚焦、过滤和控制生成式人工智能,增强大模型响应的智能和可靠性,使其更适合关键任务。

当大模型真正落地到工业应用时,也需要有知识图谱对专业领域知识的支撑,至少短期来看是非常需要的。

因此,我们也可以说,知识图谱的构建原来有各种各样的构建方式,现在又多了一种构建方式——用大模型去辅助整个知识图谱构建,通过大量语料和大数据的学习,通过Prompt去进行知识的激发。

同时知识图谱反过来也能够去推动大模型Prompt工程里的相关工作,融入到大模型的训练中,使得生成更可控,更准确。同时,知识图谱也可以提供很多额外的语义信息,帮助大模型的知识推理做得更好。

所以从本质上看,大语言模型出现后,并不是将知识图谱消灭了,而是可以发挥知识图谱和大模型这两种技术的优势:在需要可控知识或可控逻辑的时候,知识图谱会发挥更大作用;在需要更自由的交互任务理解和生成时,大模型发挥更好的作用。

结合这两种方法的优势,可以产生更强大和有效的自然语言处理系统。

知识图谱与大语言模型的结合

那么,知识图谱如何与大语言模型相结合呢?

有意思的是,ChatGPT给出了将知识图谱集成到大语言模型中的几种方法:

使用知识图谱数据进行预训练

将知识图谱中的知识注入到大语言模型的预训练阶段,可以帮助大模型学习实体与其属性之间的关系。可以通过将知识图谱三元组(主语、谓语、宾语)转换为自然语言句子并将它们添加到训练语料库中来完成。

使用基于图的目标进行微调

在预训练之后,使用基于图的目标对特定任务的模型进行微调,可以帮助大模型学习使用图中编码的知识进行推理和推理。这可能涉及将自然语言查询转换为基于图形的查询,以及开发将基于图形的推理与基于文本的推理相结合的方法。

例如,可以对模型进行微调,以预测图形中缺失的实体或关系,这可以提高其对底层结构的理解。

改进实体链接和消除歧义

增强模型识别文本中的实体并将其链接到知识图谱中相应节点的能力。这可以通过在训练或微调期间结合高级实体链接和消除歧义技术来实现。

集成图嵌入

图嵌入是一种用于将图中的节点、边或整个子图转换为连续向量或低维表示的技术,机器学习算法可以更轻松地处理这些向量或低维表示。

图嵌入在知识工程的上下文中特别有用,因为它可以帮助将知识图谱中的结构化信息转换为可以更容易地与机器学习算法(尤其是神经网络)集成的格式。

使用图神经网络或其他图表示学习方法学习,并可用于丰富模型对实体及其关系的理解。

推理时查询知识图谱

当模型遇到需要精确、结构化知识的问题或任务时,可以查询知识图谱获取相关信息。这可以通过将自然语言查询转换为基于图形的查询(例如,使用SPARQL),然后使用检索到的信息来回答问题或执行任务来完成。

知识图谱引导生成

将大语言模型的生成能力与知识图谱中的结构化信息相结合,可以生成更准确、更相关的文本。例如,在生成实体的摘要或描述时,模型可以对知识图谱中的信息进行优先级排序,以确保事实的正确性。

混合模型

开发包含基于图和基于神经网络的组件的混合模型,可以利用这两种方法的优势。例如,图神经网络(GNN)可用于学习图结构数据的潜在表示,然后可以将其与大语言模型集成以执行自然语言处理任务。

鼓励可解释性和可解释性

开发允许大语言模型基于知识图谱为其推理和预测生成解释的方法。这可以帮助用户了解模型如何利用知识图谱中的结构化信息,并有助于调试和优化模型。

结语

技术的浪潮总是汹涌而至,在新的技术革新来临之际,我们更应该客观看待新旧技术的优劣,而不是冲动地去拥抱新技术,抛弃现有成熟技术。

对于知识图谱来说,大模型的出现并不是一个冲击,恰恰是给了知识图谱一个新的生长空间。当我们将大模型与自身优势的行业应用去深度结合,形成数据和算法的持续迭代,必将看到更好的结果持续涌现。

【关于科技云报道】

专注于原创的企业级内容行家——科技云报道。成立于2015年,是前沿企业级IT领域Top10媒体。获工信部权威认可,可信云、全球云计算大会官方指定传播媒体之一。深入原创报道云计算、大数据、人工智能、区块链等领域。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/32034.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

考研数学易错知识点 2021-08-06

考研部分知识点总结 目录 考研部分知识点总结连续,极限函数极限导数的应用与证明积分积分2微分方程构建辅助函数微分方程法构建辅助函数多元微分二重积分 线性代数向量与秩特征值特征值 连续,极限 连续 绝对值函数的导数性质三 阶梯函数导数 多项式和对…

显卡的一些总结

0.显卡架构 1.浮点数在计算机内存中的存储方式(FP32, FP64) 2.FP32 & TF32 TF32 采用了与半精度( FP16 )数学相同的10 位尾数位精度,这样的精度水平远高于AI 工作负载的精度要求,有足够的余量。同时, TF32 采用了与…

AI生成留学文书 [研讨直播]

相信很多留过学的同学知道留学申请有一大堆事情需要处理,个人陈述是其中一部分。今年AI让很多行业发生了颠覆性变化,留学申请也不例外,以下是我们通过MiX Copilot实现的文书撰写(文书案例放在末尾)。 如果你正打算申请…

全网最详细中英文ChatGPT-GPT-4示例文档-语句情绪分类从0到1快速入门——官网推荐的48种最佳应用场景(附python/node.js/curl命令源代码,小白也能学)

从0到1快速入门语句情绪分类应用场景 Introduce 简介setting 设置Prompt 提示Sample response 回复样本API request 接口请求python接口请求示例node.js接口请求示例curl命令示例json格式示例 其它资料下载 ChatGPT是目前最先进的AI聊天机器人,它能够理解图片和文字…

chatgpt赋能python:Python的图标长啥样?

Python的图标长啥样? Python是当今世界上最热门的编程语言之一。它因其易学易用、可读性强、功能强大等优点,被广泛地应用于机器学习、数据分析、Web开发等领域。而Python的标志也成为了许多程序员们最为熟悉的图标之一。那么Python的图标长什么样呢&am…

论文阅读-自指导self instruct:将语言模型与自生成的指令相结合

SELF-INSTRUCT: Aligning Language Model with Self Generated Instructions GitHub - yizhongw/self-instruct: Aligning pretrained language models with instruction data generated by themselves. Stanford Alpaca-ChatGPT平替 Stanford CRFM 小虎AI珏爷:…

用chatGPT增强SAP FICO功能 【现金流量预测】

如开发基于SAP银行的回单进行企业现金流量表的预测功能 promot :查询SAP中基于银行回单的现金流量预测 ABAP代码 REPORT z_cash_flow_forecast.* 获取当前日期 DATA: date TYPE dats. date sy-datum.* 获取最近6个月的银行回单 SELECT febep~belnr, febep~budat, febep~xblnr…

走近人工智能|NLP的语言革命

前言: 自然语言处理(NLP)是指使用计算机处理和理解人类语言的技术。 文章目录 自然语言序言背景适用领域技术支持应用领域程序员如何学总结 自然语言 序言 自然语言处理(Natural Language Processing,NLP&#xff09…

MinGW与Cygwin的学习和理解

笔者来聊聊MinGW的学习和理解 1、MinGW认识 MinGW:Minimalist GNU for Windows,GNU项目的for windows的迷你版。 MinGW是针对windows,对GNU 编译器进行的原生的移植,为了构建windows可移植程序,导入了相关的库和头文…

写作社区平台汇总(自媒体运营的素材来源和推文发送地)

文章目录 引言I 技术社区II 其他写作社区see also引言 所谓平台,不是只有大众知道的大平台,还有行业中热门的网站或APP。 必须具备的平台有知乎、百家号 、今日头条、抖音、快手、 大鱼号、 网易号、 搜狐号、 新浪号、 企鹅媒体、 东方号、 趣头条、 搜狗媒体、 360自媒体平…

微头条自媒体常见领域,好创作,快速实现自媒体变现

有些人认为,不写狗血不吐槽就没有流量。事实上,这是偏见。头条用户基数很大,任何形式的创作,都有大量有兴趣的读者。所以我们应该创作自己擅长的内容,并坚守自己的立场,接下来我们一起了解一下比较常见的微…

自媒体一键多平台分发工具,自媒体人必备

在谈到怎么运营自己的自媒体账号时,很多自媒体人觉得比较困难,因为他们要花费大量的时间与精力去经营,在不止一家自媒体平台拥有自己的账号是一件麻烦的事情,光是每个平台发布就需要很长的时间。于是我像他们推荐了我正在使用的融…

自媒体适合多平台发布,30+自媒体平台都可以一键发布!

现在越来越多的自媒体人员,为了获得全网曝光,都会注册开通10多个新媒体平台,如果你只分发图文,10个平台发完怎么的也得30分钟。如果你只分发视频,20个平台保底3小时,同时还得是都群发成功了,在达…

最靠谱的6个自媒体平台,也可以快速上手

现在自媒体发展已是相对成熟的阶段,很多朋友还想做自媒体,很明确地告诉你还不晚,只要你有创意,有出色的审美,什么时候都还不算晚,那么要选什么平台比较好了,小编给大家介绍比较好上手的自媒体平…

如何快速有效地运营自己的社交媒体账号?

在众多的社交媒体平台中,您可以先选择一个平台开始运营,如Facebook、Twitter、领英、 Instagram等。不同的平台有不同的特点,所以最好在选择之前了解好不同社交媒体的特点,以便 更好地展示自己的特点。 例如,领英在商…

怎么注册自媒体账号?技巧分享

自媒体行业的快速发展,相信大家都有耳闻,至于自媒体应该如何有效地运营,相信大家就纷纷摸不着头脑了那么新手如何做自媒体呢?我归纳分为这几个步骤: 一、自媒体账号定位 在做自媒体之前,一定需要做好定位&…

自媒体账号如何注册申请

如何利用自媒体挣取到人生第一桶金,建议大家可以从以下几个方面入手。 一、申请自媒体账号 申请自媒体账号需要的材料:身份证,手机号,辅助材料:微信公众号或者博客写过文章的都可以。如果实在不会弄就去买一个账号先练…

【云原生】基本概念梳理:容器、镜像、仓库和集群

有条件的同学尽可能都开始使用 ChatGPT、new bing 和 GPT-4,这些是新的生产力工具。 它们或许不能替代某个岗位,但做个不恰当的比方,没有它们时的学习效率是坐马车,使用这些工具的学习效率是开汽车。 一、引言 1.1 先问问 ChatGP…

vsCode编辑器 快速国际化-以及一些国际化细节

i18n.code-snippets 配置 {"vue-i18n-mall": {"scope": "vue-html","prefix": "vt","body": "\\$t(passenger.$1)", //passenger-国际化文档名"description": "vue i18n mall"}…

消息队列之 RabbitMQ基本流程

介绍 关于消息队列,从前年开始断断续续看了些资料,想写很久了,但一直没腾出空,近来分别碰到几个朋友聊这块的技术选型,是时候把这块的知识整理记录一下了。 市面上的消息队列产品有很多,比如老牌的 Activ…