ChatGPT有用到知识图谱吗?它自己是这样回答...

从搜索引擎到个人助手,我们每天都在使用问答系统。问答系统必须能够访问相关的知识并进行推理。通常,知识可以隐式地编码在大型语言模型(LLMs)中,例如ChatGPT、T5 和LaMDA 等大型语言模型,这些模型在未结构化文本上进行预训练,或者显式地表示在知识图谱(KGs)中,例如OpenKG和ConceptNet,其中实体表示为节点,它们之间的关系表示为边。

最近,预训练的LLMs在许多问答任务中取得了显著的成功。该领域瞬息万变,算法的进步正在产生非常重大的影响。那不经产生疑问,目前备受关注的ChatGPT训练过程中有使用到知识图谱吗?ChatGPT在不同时间(2月份和3月份)给出了不同的答案:

咨询时间2023.02月:
图片
图2 询问时间2023.03:
在这里插入图片描述

那么,ChatGPT的成功是不是只是高概率语言模式的再现?为什么要使用知识图谱?简单来说仅靠数据驱动是不够的,但知识驱动的组织可以在充分的背景下做决定,并对他们的决策充满信心。
首先我们了解一下关于ChatGPT你应该知道的事。

文章目录

  • 一、大型语言模型
  • 二、Transformer有什么用?为什么这么受欢迎?
  • 三、Transformer取得成功的一个重要概念
  • 四、训练数据
  • 五、训练本地化ChatGPT需要哪些资源?
  • 六、如何写一个提示(promot)?
  • 七、书籍推荐
  • 参考文献:

一、大型语言模型

在过去几年中,大型语言模型 (LLM) 已经发展出惊人的生成人类语言的技能。如下图展示了流行的LLMs在人类认知能力方面的得分情况,
图片

LLMs在人类认知能力方面的得分情况(来源:自2021年以来对约40万个人工智能相关的在线文本进行语义分析)

语言模型使用文本生成解决问答任务。根据训练数据集,语言模型可以分为:

  • (i)通用模型,例如PaLM,OPT和GPT-NeoX-20B;
  • (ii)特定领域模型,例如Galactica,SciBERT和BioMegatron。更先进的对话型AI(Conversational AI)模型从最近的语言模型进展中受益,创造出能够在与用户对话中回答问题的聊天机器人。例如,基于OpenAI的聊天机器人ChatGPT 受到了大量的关注。GPT代表Generative Pretrained Transformer,是一种 AI 算法,可以基于摄取大量文本和数据并推导语言规则和关系来创建新内容。为响应输入而生成的文本可以非常微妙和富有创意,给人一种正在与人交谈的印象。与搜索引擎不同,它不是简单地检索信息,而是根据通过算法处理的大量数据导出的规则和关系生成信息。那ChatGPT的成功又得益于一系列技术和数据,下面展开介绍:

二、Transformer有什么用?为什么这么受欢迎?

Transformers被用于多种自然语言处理(NLP)任务,例如语言翻译、情感分析、文本摘要、问答等等。最初的Transformer模型是专门为语言翻译设计的,主要用于将英语翻译成德语。然而,已经发现该架构可以很好地适用于其他语言任务。这种趋势很快被研究社区所注意到。接下来的几年月里,几乎所有与语言相关的机器学习任务的排行榜都被Transformer架构的某个版本所主导。因此,Transformers非常受欢迎。Huggingface是一家初创公司,迄今已经筹集了超过6000万美元,几乎完全围绕商业化他们的开源Transformer库这一想法。

下面用三张图首先直观感受下Transformer家族模型的关系、时间线以及大小。第一张图旨在突出显示不同类型的Transformer及它们之间的关系。
在这里插入图片描述

第二张图时间线视图是一个有趣的角度,可以将目录中的Transformer按发布日期排序。在这个可视化中,Y轴仅用于聚类相关的家族Transformer。
在这里插入图片描述
在下一个可视化图中,Y轴表示模型大小,以百万参数为单位。
在这里插入图片描述
Transformers之所以能够迅速占领大多数自然语言处理排行榜的关键原因之一是它们具有快速适应其他任务的能力,也就是迁移学习。预训练的Transformer模型可以非常容易和快速地适应它们未被训练过的任务,这带来了巨大的优势。

三、Transformer取得成功的一个重要概念

Transformer取得成功的一方面是语言模型中的RLHF (Reinforcement Learning with Human Feedback,人类反馈强化学习)。RLHF已成为人工智能重要组成部分,这个概念早在2017年就已经在论文“Deep reinforcement learning from human preferences”中提出了。然而,最近它已经被应用于ChatGPT和类似的对话系统,如BlenderBot3或Sparrow。其思想非常简单:一旦一个语言模型被预训练,我们就可以生成不同的对话响应,并让人类对结果进行排名。

在ChatGPT训练过程中,OpenAI 从字面上让人类与自己进行角色扮演——通过称为人类反馈强化学习 (RLHF) 的过程既充当 AI 助手又充当其用户。然后,在构建了足够多的对话之后,它们被馈送到GPT-3.5。在充分接触对话之后,ChatGPT 应运而生。

图片

下面举例说明如何理解RLHF?

想象一下,您有一个名叫 Rufus 的机器人,它想学习如何像人一样说话。Rufus 有一个语言模型可以帮助他理解单词和句子。首先,Rufus 会使用他的语言模型说些什么。例如,他可能会说“I am a robot”。

然后,一个人会听 Rufus 说的话,并就这听起来是否像人类会说的自然句子给他反馈。人类可能会说,“这不太对,Rufus。人类通常不会说‘I am a robot’。他们可能会说‘I’m a robot’或‘I am a machine’。”

Rufus 将接受此反馈并使用它来更新他的语言模型。他将尝试使用他从人类那里收到的新信息再次说出这句话。人类会再次倾听并给 Rufus 更多反馈。这个过程将一直持续到 Rufus 可以说出人类听起来自然的句子为止。

随着时间的推移,Rufus 将学习如何像人一样说话,这要归功于他从人类那里收到的反馈。这就是使用 RL 和人类反馈来改进语言模型的方式。

图片

四、训练数据

下面通过对比OpenAI的ChatGPT和谷歌的Bard来说明训练数据。ChatGPT和Bard 都有独特的训练风格。具体来说,ChatGPT 在 GPT-3.5 模型上运行,而Bard在LaMDA2上运行。我们可以将GPT-3.5视为 ChatGPT 的“大脑”,而 LaMDA2 则是Bard的。它们之间的主要共同点是它们都建立在Transformer之上。但据目前所知,这就是共同点结束的地方。

现在差异来了,主要是他们阅读的内容不同。OpenAI一直对 GPT-3.5 训练的数据集保密。但我们确实知道 GPT-2 和 GPT-3 都至少部分地在 The Pile数据集上进行了训练——一个包含多本完整小说和非小说书籍、来自 Github 的文本、所有维基百科、StackExchange、PubMed等。这个数据集非常庞大,原始文本超过825 GB。

但这就是问题所在:对话语言与书面语言不同。一个作者可能文字非常有激情,但在一对一的谈话中却显得生硬。因此,OpenAI不能仅仅以别名“ChatGPT”发布 GPT-3.5 就此收工。相反,OpenAI 需要在对话文本上微调 GPT-3.5 以创建 ChatGPT,以语言服务模型 InstructGPT 为基础。

这就是有些人可能认为Bard有优势的地方。LaMDA 没有接受过 The Pile 的训练。相反,LaMDA 从一开始就专注于阅读对话。它不读书,它以谈话的节奏和方言为模式。结果,Bard捕捉到了将开放式对话与其他交流形式区分开来的细节。

换句话说,ChatGPT的大脑在学会如何进行类似人类的对话之前,首先学会了阅读小说、研究论文、代码和维基百科,而Bard只学会了对话。

Typical chatbot(Bert)GPT-3LaMDA
在特定主题的数据集上未标记的文本数据集未标记的文本数据集
只从训练数据中提供答案1750亿参数,基于维基百科、小说等数据1370亿参数,基于对话数据,无主题
有限的对话流有限的对话流开放式对话

五、训练本地化ChatGPT需要哪些资源?

  1. 训练硬件:使用拥有约 10,000 个 GPU 和约 285,000 个 CPU 内核的超级计算机。也可以像 OpenAI 对微软所做的那样,花费他们 10 亿美元 (USD) 来租用它。
  2. 人员配备:2016 年,OpenAI 每年向首席科学家 Ilya Sutskever支付 190 万美元 (USD),他们拥有一支 120 人的团队。第一年的人员配置预算可能超过 2 亿美元。
  3. 时间(数据收集):EleutherAI 花了整整 12-18 个月的时间来同意、收集、清理和准备 The Pile 的数据。

(4)时间(训练):预计一个模型需要 9-12 个月的训练,如果一切顺利的话。您可能需要多次运行它,并且可能需要并行训练多个模型。(参见 GPT-3 论文、中国的 GLM-130B 和 Meta AI 的 OPT-175B 日志)。

总结来说,需要相当强大的计算机和研发人力资源。

六、如何写一个提示(promot)?

在像ChatGPT 这样的大型语言模型 (LLM) 中,提示可以包含从简单的问题到带有各种数据的复杂问题 (请注意,您甚至可以将原始数据的 CSV 文件作为输入的一部分)。它也可以是一个模糊的陈述,比如“给我讲个笑话,我今天情绪低落。”

Promot可以由以下任一组成部分包括:Instructions、Question、Input data、Examples。基本的组合例子如下:

Instructions + Input data:我毕业于清华大学,职业是算法工程师,做过很多关于NLP的任务,可以帮忙写一个简历吗?

图片
Question + Examples:我喜欢看《傲慢与偏见》,你还可以推荐类似的书籍吗?

图片
Instructions + Question:ChatGPT可以在哪些方面进行改进?
图片

将大型语言模型与知识图谱结合也是目前一个新的改进方向。通过将知识图谱集成到对话型人工智能系统中,ChatGPT可以利用图谱中表示的结构化数据和关系来提供更准确和全面的响应。知识图谱可以作为领域特定知识的来源,这些知识可以用来丰富ChatGPT的响应,并使其能够处理需要深入领域专业知识的复杂用户查询。

七、书籍推荐

在这里插入图片描述

《知识图谱实战:构建方法与行业应用》 于俊 李雅洁 彭加琪 程知远 著

推荐语:科大讯飞专家撰写,国内多位专家联袂推荐,一书掌握知识图谱的构建方法与主流应用!详解知识图谱构建7个核心步骤,剖析CCKS近年问答评测任务方案,拆解8个行业综合案例的设计与实现

内容简介:

  • 这是一本综合介绍知识图谱构建与行业实践的著作,是作者多年从事知识图谱与认知智能应用落地经验的总结,得到了多位知识图谱资深专家的推荐。
  • 本书以通俗易懂的方式来讲解知识图谱相关的知识,尤其对从零开始构建知识图谱过程中需要经历的步骤,以及每个步骤需要考虑的问题都给予较为详细的解释。
  • 本书基于实际业务进行抽象,结合知识图谱的7个构建步骤,深入分析知识图谱技术应用以及8个行业综合案例的设计与实现。
  • 全书分为基础篇、构建篇、实践篇,共16章内容。
基础篇(第1章),介绍知识图谱的定义、分类、发展阶段,以及构建方式、逻辑/技术架构、现状与应用场景等。构建篇(第28章),详细介绍知识抽取、知识表示、知识融合、知识存储、知识建模、知识推理、知识评估与运维等知识图谱构建的核心步骤,并结合实例讲解应用方法。实践篇(第916章),详细讲解知识图谱的综合应用,涵盖知识问答评测、知识图谱平台、智能搜索、图书推荐系统、开放领域知识问答、交通领域知识问答、汽车领域知识问答、金融领域推理决策

参考文献:

1.《Transformer models: an introduction and catalog》;2.《ChatGPT versus Traditional Question Answering for Knowledge Graphs: Current Status and Future Directions Towards Knowledge Graph Chatbots》;3. https://blog.deepgram.com/chatgpt-vs-bard-what-can-we-expect/

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/19397.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

蚂蚁集团面试复盘 | 面试题复习

蚂蚁实习一面复盘总结4.13 算法题 1、设计一个算法,求第k个最大的数; 直接排序求第k个使用选择排序、冒泡排序、插入排序等排到第k个就返回更快的方法:快排的分治法、最小堆最大堆法,当场写出来还是很难的 2、写单例模式 面试…

重磅发布:2023产业互联网安全十大趋势

3月21日,中国产业互联网发展联盟、《中国信息安全》杂志、南方日报、中国网络空间新兴技术创新论坛、腾讯安全、腾讯研究院联合推出《2023产业互联网安全十大趋势》。 报告汇聚了中国产业互联网发展联盟常务副秘书长陈胜喜、《中国信息安全》杂志社执行董事温哲、南…

点击劫持:CSP frame-ancestors 缺失

点击劫持:CSP frame-ancestors 缺失 什么是Content Security Policy(CSP)启用CSP的两种方法CSP的实例CSP指令介绍限制选项default-src 点击劫持:CSP frame-ancestors 缺失参考 什么是Content Security Policy(CSP&…

chatgpt赋能python:Python如何进行DOS攻击

Python如何进行DOS攻击 随着互联网技术的快速发展,网络攻击也越来越普遍。其中,DOS攻击是一种常见的攻击方式,可以导致目标服务器无法正常工作。Python作为一种高效且易于使用的编程语言,可以用于编写DOS攻击脚本,造成…

账号和权限管理

用户帐号类型 计算机系统帐户的分类帐户共有三种类型 超级用户 指创建者用户 超级用户帐户通常称为root. 可以不受限制地管理系统,并且系统用户可以运行服务. 普通用户帐户由登录并使用系统的真实用户(人员)使用. 超级用户帐户通常称为root,您可以重新…

他们开源了GitHub上最火的双语对话模型,还说AI胡说八道不需要被纠正

衡宇 发自 凹非寺量子位 | 公众号 QbitAI 国产对话机器人ChatGLM,和GPT-4诞生于同一天。 由智谱AI和清华大学KEG实验室联合推出,开启alpha内测版。 这个巧合让智谱AI创始人兼CEO张鹏有一种说不清的复杂感觉。但看到技术被OpenAI做到这么牛,这…

2023爱分析 · 认知智能厂商全景报告 | 爱分析报告

报告编委 黄勇 爱分析合伙人&首席分析师 李进宝 爱分析高级分析师 陈元新 爱分析分析师 目录 1. 研究范围定义 2. 市场洞察 3. 厂商全景地图 4. 市场分析与厂商评估 5. 入选厂商列表 1. 研究范围定义 研究范围 人工智能的发展分为三个阶段——计算…

比尔·盖茨:AI时代已经开启,GPT是40年来最具革命性技术

Datawhale干货 选自:GatesNotes,来源:机器之能 比尔・盖茨表示:人工智能革命重要程度不亚于手机和互联网的诞生。 周二,微软公司创始人比尔・盖茨在他的博客 GatesNotes 中盛赞 OpenAI 的 GPT 模型,称其是…

ChatGPT就这样来了,你不接受它的话,时代就不接受你了

这一波来的太突然了,上个月还在聊ChatGPT会不会替代一部分人的工作,现在就已经发生了。这个周末两天没休息,周六见了在国内最大的ERP软件公司做了十几年的几个朋友,周日见了互联网的几个朋友,包括互联网大厂和游戏公司…

比尔盖茨最新全文:GPT是我一生中见到的两项最具革命性技术之一

ChatGPT狂飙160天,世界已经不是之前的样子。 我新建了人工智能中文站https://ai.weoknow.com 每天给大家更新可用的国内可用chatGPT资源 今天微软公司联合创始人比尔盖茨在他的个人博客中畅谈ChatGPT和生成式人工智能对教育、医疗、生产力提升、公平等等方面的影响。…

大厂当“海王”,独角兽专情,谁是AI医生的扛鼎者?

比尔盖茨可能是ChatGPT的“头号铁粉”。 他对ChatGPT的“表白”,简直如同情话一般热烈,“这是我一生中见到的两项最具革命性的技术之一”。 ChatGPT在医疗领域的落地,则是比尔盖茨最为看好的赛道,他期待全球都束手无策的看病难、看…

关于中国的医疗改革,看人工智能(chatGPT)怎么回答!

1.对于中国的医疗改革你们什么好的建议? 作为一个语言模型,我可以为您提供一些建议,但请注意这仅仅是一些普遍的建议。医疗改革是一个复杂的议题,需要综合考虑各种因素,包括政治、经济、文化和社会等方面。以下是一些…

【重磅】OpenAI最新解密,ChatGPT的本质是无损压缩器

作者 | 费斌杰 熵简科技CEO 自从去年12月ChatGPT问世以来,AI的发展正式进入快车道,整个行业开始“按日迭代”。从1957年以来,人类在经历了数轮AI浪潮后,这次通用人工智能(AGI)是真的要来了。 我们团队在2月…

chatgpt赋能python:Python考点填空:必备知识点

Python考点填空:必备知识点 作为一种流行的编程语言,Python已经广泛应用于人工智能、数据分析、Web应用等领域。在Python编程中,我们时常接触到填空题,这些考点不仅是Python编程中的基础知识点,也是我们必须掌握的必备…

备考公务员2019

参考:https://www.zhihu.com/people/xi-chuan-3-5/posts 找准目标 你想好为什么考公务员了吗?这是准备公考的第一步也是最重要的一步。如果目标坚定,则遇到时间的紧张、复习的痛苦、深夜的孤寂等一系列困难时都能迎刃而解;如果仅仅…

ChatGPT 将冲击数据库!中国数据库开发者报告正式发布

作者 | 屠敏 出品 | CSDN(ID:CSDNnews) 经过一批批先行者和企业的努力,国产数据库崭露峥嵘,逐渐走上国际舞台,譬如:三年前阿里自主研发的金融级分布式关系数据库 OceanBase 在 TPC-C 基准测试中…

这里有一份教你每天用领英获取20个询盘的免费课程,手慢无

于2023年3月22日,我们圆满完成了深圳宝安的外贸分享交流会,时隔两个月即将迎来我们的广州场。 在上次深圳会议,有幸邀请到江西省跨境电商协会会长莅临 给大家分享了: 如何帮助传统制造业从“0”开始做外贸、如何借助平台为企业…

文心一言 VS 讯飞星火 VS chatgpt (27)-- 算法导论5.1 2题

二、请描述 RANDOM(a,b)过程的一种实现,它只调用 RANDOM(0,1)。作为a和b的函数,你的过程的期望运行时间是多少? 文心一言: 假设我们有一个伪随机数生成器,可以生成在[0,1)范围内的随机数。那么我们可以使…

文心一言 VS 讯飞星火 VS chatgpt (31)-- 算法导论5.2 3题

三、利用指示器随机变量来计算掷n 个骰子之和的期望值。 文心一言: 为了计算掷n个骰子之和的期望值,我们需要先了解一个重要的概念:指示器随机变量。 指示器随机变量是一种特殊的随机变量,它只有两个取值:0和1。通常…

Prompt提示工程的艺术: 解码 ChatGPT

随着ChatGPT的横空出世,prompt提示工程突然就成了一个时髦的技能,prompt的核心是制定科学有效的提示,以便于我们可以从大语言模型中得到更精确的输出。简单说,就是如何从任何人工智能模型中获得更好的输出结果。 做到这一点需要两…