构建类ChatGPT产品的经典知识数据库的原理与路径

构建经典知识数据库是类ChatGPT产品发展不可或缺的关键阶段。这一阶段的重要性在于为类ChatGPT产品打下基础,为自然语言大模型提供坚实可靠的文献资源,成为其最终的依据。

经典文献知识数据库与人工智能的结合发挥独特的重要作用。实际上,它代表的是一种新型的知识获取模式,本质上是一种文化模型它充分利用了人工智能技术与经典人文知识之间的合作性,造成了以往学科边界的进一步模糊化,从而在跨学科研究教学活动中自然而然地发展起来。经典文献知识特别是人文知识与人工智能技术具有截然不同的特点前者充满了主观性、模糊性、情景性、情感性和偶然性,因此以质性研究为主导而后者则以标准化、结构化、规律性和消除不确定性为基础,擅长于进行量化处理这两者在当下的结合,使质性可以令人信服地被量化,从而推动各种层面上的融通,包括跨越学科界限的融通,跨越纯理论与应用以及理论与实践之间的融通等。这种融通实际上正成为一条全球性路径。

1、语义定义

类ChatGPT产品:指的是利用人工智能技术和思维方式,创建能够全面主动为人类提供自然语言和编程语言数据的产品。类ChatGPT产品具备以下几个特点:知识权威性,建立可信赖的知识标准;知识广泛性,生成以人类为尺度的知识群体;知识精准性,调用完全满足使用者即时需求的知识点阵。

知识点阵示意图

文献经典知识数据库(专门数据库):是指以明确定义的标准,收集符合标准的文献所组成的专门知识数据库。该数据库旨在提供经典文献知识,以满足特定标准的要求。与铺设铁轨需要统一的度量衡、铸造金属需要磅值系统以及电信技术发展初期需要统一的电报编码等需求一样,经典文献在知识体系中具有创立“标准”的重要地位。这是指:一方面,文献作为独特的标准,可以直接为我们的各类人生问题提供答案,因为经典文献就像路标一样,是先哲们的智慧总结,是经过时间检验的人生指南。另一方面,我们理解世界需要一个前理解结构,而经典文献不断帮助我们建立和修正这个前理解结构。前理解结构与答案路标自本自根,映射出我们大脑的知识系统的可靠性。

知识学文本宇宙原理

 2、知识库服务于人的四个阶段

类ChatGPT产品可以看作是一种泛知识库,这类产品隐藏了信息理解、匹配和寻找的过程,直接理解和整合用户的需求,给出回答。除了泛知识库,还有专门知识库,知识库总共有以下四个阶段服务于人:

第一阶段:泛知识库阶段

定义:在这个阶段,经典文献的知识以非系统化的方式为使用者提供模糊的参考信息。特征:语义生成的自我演化与迭代;可信赖的互联网知识中心的建立。功能:为部分重复性高的劳动建立范式与工作标准文件,替代部分人力工作。

第二阶段:专门知识库阶段

定义:在这个阶段,系统建构的经典文献知识群落有意识地为使用者提供系统的背景与专业知识支持。特征:专门知识库中的知识数据化;基于人工智能原理的库中数据自我迭代;专门知识库中的知识数据形成封闭与垄断。功能:专门知识库的建设基于社会需求的业务;为用户提供深度知识服务,包括摘要、问答式检索、讨论环境、排序、计算、倾向性分析、热点发现、聚类搜索、分类等。

第三阶段:专门知识库融入泛知识库阶段

定义:在这个阶段,专门知识主动有序覆盖泛知识库中的同类知识,提升泛知识库的专业性以获得普遍公信力。特征:专门知识库中数据全面有序迭代进入泛知识库;专门知识以公众所需的形态有序解析。功能:公众能够掌握专门知识中的架构、范式、标准等部分。

第四阶段:专门知识库在泛知识库中的融通阶段

定义:在这个阶段,泛知识库中的专门知识有序融通,实现深度知识共享,为解决更广泛而深刻的人类问题建立共同的原理、方法和路径。特征:专门知识库中的知识数据编码公开并互通。功能:在AI知识系统中处理“新”的更广泛而深刻的人类问题。

经典知识数据库可以被看作是一种专门知识库,它存储和提供经典文献的知识。在这个四阶段的描述中,经典知识库可以在第二阶段作为专门知识库的一部分,为用户提供系统的背景和专业知识支持。随着时间的推移,经典知识库可以在第三和第四阶段与泛知识库进行融合和融通,实现深度知识共享,为解决更广泛而深刻的人类问题提供共同的原理、方法和路径。因此,经典知识数据库在这个描述中扮演着促进知识库发展和知识共享的重要角色,更加专业的满足主动式信息获取的需求。

3、经典知识数据库的构建建议

筛选经典文献:市面上文献鱼龙混杂,需要建立一套评价标准进行评估,根据文献的权威性和影响力,筛选出其中的经典文献。

确立分类:重新确定学科分类体系,参考国内外顶尖大学的学科体系将学科进行划分归类。

提炼主题:需要总结经典文献涉及的主题,为文本赋予意义,主题要涵盖各个方向。

构建体系和标注:以分类和主题为基础构建体系(框架),并设置标签,对经典知识进行标注。

选择问题和解决方案:建立遴选问题的标准,因选择当前大众所关注且迫切需要解决的问题,并将其分类归入学科体系,作为最基础问题的解决方案,贴近用户需求。

解构经典知识:将内容进行拆解和整合,形成文本宇宙,并为自然语言轴进行编码。

构建数据库:将问答形式的卡片和原文献中的箴言整合起来,构建一个经典知识数据库,形成知识大厦或知识宇宙。

知识宇宙

 4、经典知识数据库对于类ChatGPT产品的帮助

经典知识数据库(专门数据库)为类ChatGPT产品提供了可靠、准确和专业的知识基础,帮助它在各个领域和话题上提供更深入和高质量的回答,更有价值的信息和见解。

在这个不断涌现政治和文化事件的世界中,数字平台上的快速交流不停“刷新”着人们的观点、观念和结论,而亟待借助既有知识形式与内容判断这些观点、观念和结论的人们却发现,传统的知识往往源自研讨室,与大众文化相脱节。经典知识数据库能使大型模型成为一个富有拓展性的知识体系,塑造出一个真正多元的宇宙。从而通过将经典知识数据库与人工智能技术结合来极大地扩大享用知识的人群范围,并最大程度与普通大众产生交集。即使在不断更新的专业知识领域,经典知识数据库可以利用最佳的众包技术来处理、分析和发布包含多样人类文化记录的材料。它为业余学者提供了一个平台,使人文研究成为一个全球范围内可参与和相关的新型多人在线游戏。通过手机和其他移动设备,经典知识以分散的形式渗入日常生活,对人类历史或文化遗产进行解释,并将丰富的可信赖人文知识引向大众。

5、总结

已有研究证明,专注于优化数据而不仅仅是模型本身往往能取得更好的效果。经典知识数据库可以显著提升类ChatGPT产品的权威性和影响力。OpenAI公司也曾与高校合作,通过师生整理各种类型问答知识来提升数据质量。这一次,人类文化极深邃宽广的内容全貌,也许第一次能以系统的方式被呈现出来。这是可以媲美历史上伟大文化转型的那类事件,总是使人不由自主联想起从卷轴书到翻页书的演进,或活字印刷术的发明。

作者:

赵雪波  万象界知识工作室  重庆文理学院教授

李兆兴  万象界知识工作室

邮箱:lizhaoxing.lzx@qq.com

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/23159.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

当以ChatGPT为代表的AI进入教育,会碰撞出怎样的火花?

ChatGPT是当前的社会热点,街头巷尾、各行各业都在讨论它,迅速引起了全世界的关注。目前,在国外,ChatGPT已经开始进入学校。当以ChatGPT为代表的AI进入教育,会碰撞出怎样的火花? INSA校友卢宇,这…

还在转发杨超越?参加这场图表大show,你就能成为锦鲤本鲤!

Biu~ 暑假快要过去了 马上就要开学了 惊不惊喜? 意不意外? 听到这个消息, 在校学生 啊,我的空调、WiFi、西瓜 高校教师 啊,我的大好河山!(世界那么大... 职场白领 我就静静地听着你们诉(哀&…

ChartGPT有点意思,还能这么玩

ChatGPT是OpenAl开发的一种语言生成系统,具有较高的自然语言理解和对话管理能力。 所以它常用于对话机器人,比如说某爱、某度等,同时也可用于自动回复、问答系统等,对搜索引擎的智能化都带来不少新的挑战和方向。 然而目前ChatGP…

快速生成一份ppt:ChatGPT+MindShow

一、ChatGPT 需要用到目前全宇宙最火的chatgpt,输入格式一定要markdown格式输出 帮我做一份《xxxx》的ppt,帮我写一份包含6个子标题的大纲,每个子标题下尽量写4-5条内容,内容尽量详实,如果有例子更好。最后用markdown…

大厂被裁,我也曾迷茫过

大家好,我是徐公,6 年大厂程序员经验。 最近收到好几位粉丝的私信。问我说,徐公,我去年年底被裁,到现在还没找到工作,挺焦虑的,你这边有没有什么机会,可以帮忙内推?或者…

高通面试01_2023.5.16

1. 64QAM与16QAM速率对比 64 2^6,6bit信息/符号; 16 2^4,4bit信息/符号; 6/4 1.5倍数 2. 人工智能热点关注(ChatGPT) GPT “生成性预先训练转换器”(generative pretrained transformer) 百科&…

某平台百万阅读博主,去面试阿里P7,遭面试官狂喷:根本不懂技术,闭关60天,吊打曾经面试官,史上最强

某平台百万阅读博主,去面试阿里P7,遭面试官狂喷:根本不懂技术 一气之下回家硬肝60天,再战阿里又遇到当初面试官!轻松拿下阿里P7后说出实情,竟只是凭借这个文档! 首先声明: 本书覆盖了近3年程序员面试笔试中超过98%Java高频知识点当你细细品读完本书后,各类企业的of…

Hadoop常见面试题

目录 什么是hdfs 原理 包含哪些部分 hdfs 的读取过程 hdfs 的写过程 NN 和 2NN 工作机制 (元数据持久化机制) (一)第一阶段: NameNode 启动 (二)第二阶段: Secondary NameNode 工作 datanode的工作机制 小文件处理方案 yarn 的运行原理 任务提交…

重磅消息!微软将把聊天机器人技术植入Office办公软件

微软(Microsoft)是一家美国跨国科技企业,1975年4月4日创立。2021财年微软营收为1681亿美元, 净利润为613亿美元,公司总部设立在华盛顿州雷德蒙德(Redmond,邻近西雅图),以…

刚刚,谷歌翻车了。。。

大家好,我是微笑。 最近微软出品的 ChatGPT 确实引起很大的关注,这不,谷歌就紧跟发布了谷歌版 ChatGPT - Bard,结果很。。。 源自:机器之心 原文:https://mp.weixin.qq.com/s/1mkAlJbtYCmQcz_mV9cdoA 如今的…

LangChain:基于ChatGPT对话私有数据

一、架构图: 二、思路: 通过embbeding获得文本的语义,通过向量数据库获得近似记录,通过chatGPT得到问答内容将文件拆分并embbeding后存入向量数据库将用户问题embbeding后从向量数据库中找近似的文档数据作为prompt上下文 三、核…

【ChatGPT】万字长文揭秘 GPT 背后:为何“大模型” 就一下子成为了引领人工智能 AI2.0时代热门技术?

GPT (Generative Pre-trained Transformer) ,生成式预训练Transformer: 是一种基于深度学习的自然语言处理模型,GPT 由 OpenAI 开发。 GPT 是一种基于 Transformer 模型的语言模型,可以通过大量的文本数据进行训练,从而学习到语言的规律和模式,进而生成自然流畅的语言文本…

网站接入QQ登录功能的实现

来源 | https://github.com/Dream4ever/Knowledge-Base/issues/76 说明 本文中所说的QQ登录功能,是采用官方的OAuth2.0来实现的,这样有更多的自主权。另一种较为简单的js-SDK开发方式,虽然非常简便,但自主性不够,所以没…

Android QQ 登录接入详细介绍

/ 今日科技快讯 / 近日,百度地图发布2022春节出行大数据。迁徙大数据显示,2022年春运迁徙规模较去年农历同期有明显上升。春节期间全国人口迁徙规模日均值为去年农历同期的近两倍。春节前的迁徙规模峰值出现在1月29日(腊月廿七&#xff0…

工具使用-QQ/TIM(1)QQ/TIM客户端聊天窗口输入/自动变成表情 - 解决方案

问题: 我们在使用QQ/TIM客户端(电脑端)时,输入英文字符/时,会自动变成表情,且无法取消,无法避免。如下图所示: 解决: 打开QQ/TIM客户端,并打开一个聊天窗口。在聊天窗口中点击表情图…

chatgpt赋能python:Python软件图标的SEO

Python软件图标的SEO 介绍 Python是一种高级编程语言,具有易读性、可维护性和可扩展性等优点,因此在许多应用程序中广泛使用。Python软件的图标是这些应用程序中一个非常重要的视觉元素。图标的质量和吸引力可以决定用户下载和使用该应用程序的意愿。因…

漫谈高数

漫谈高数 (一) 泰勒级数的物理意义 高等数学干吗要研究级数问题? 是为了把简单的问题弄复杂来表明自己的高深? No,是为了把各种简单的问题/复杂的问题,他们的求解过程用一种通用的方法来表示。 提一个问题,99*99等于多少? 相信我们不会傻到…

《高等数学A》课堂笔记——高分必过

《高等数学》上下学期的课堂笔记 ——郑州大学 文章目录 一、函数与极限1.1 映射与函数1.2 数列的极限1.3 函数的极限1.4 无穷小与无穷大1.5 极限运算法则1.6 极限存在准则及两个重要极限1.7 无穷小的比较1.8 函数的连续性与间断性问题…

高等数学【合集2】

文章目录 积分计算递推重点补充 积分计算 求导 ⇄ 积分 求导 \rightleftarrows 积分 求导⇄积分 求导积分 ( t ) ′ 1 \large (t)1 (t)′1 ∫ t d t 1 2 t 2 c \large\int tdt\frac{1}{2}t^2c ∫tdt21​t2c ( 1 x ) ′ − 1 x 2 \large(\frac{1}{x})-\frac{1}{x^2} (x1​)…

高等数学【合集】

文章目录 极限计算求导计算积分计算 极限计算 第一步 : 先看 x → v a l u e 确定类型 第一步:先看x \rightarrow value确定类型 第一步:先看x→value确定类型 7 种未定型 : ∞ ∞ , 0 0 , 1 ∞ , 0 ∞ , ∞ 0 , 0 0 , ∞ − ∞ 7种未定型: \frac{\infty}{\infty},\frac{0}{0}…