本期文章由数字罗塞塔计划出品,于2023年2月22日在“浙江档案杂志”公众号首先发布,原名《兰台讲堂丨和ChatGPT聊聊档案信息资源的开发利用》。
兰台讲堂中节选了笔者和ChatGPT的部分聊天记录,本号将完整版内容整理如下,以飨读者。
档案资源开发利用作为档案三大体系的重要组成部分,一直以来都是需要不断探索的重点主题,也是档案领域业务研究、学术探讨的永恒话题。今天的访谈对象请到了当下最火的ChatGPT,围绕着“档案资源开发利用”展开一系列的探讨。
Round 1
一些基础知识问答测试报告
问题复杂度:☆
在第一回合基础问答测试中,ChatGPT回答得体,逻辑清晰,信心满满。
Round 2
聊聊“十四五”规划中的档案资源开发
问题复杂度:☆☆
《“十四五”全国档案事业发展规划》提出应加大档案资源开发力度。“...深入挖掘红色档案资源,建立“四史”教育专题档案资料库,传承红色基因....”“红色档案”承载着党的重要历史和文化,开发红色档案资源,深入挖掘其背后故事,意义重大。针对“红色档案”这一具有中国特色、承载重要意义的概念,ChatGPT又了解多少呢?
《“十四五”全国档案事业发展规划》还强调应“积极探索知识管理、人工智能、数字人文等技术在档案信息深层加工和利用中的应用。”作为高段位人工智能,ChatGPT又是怎么看待AI和数字人文在档案资源管理中的应用呢?
在第二回合的访谈中,笔者第一次提出“红色档案”概念,ChatGPT便不知所云,但在加上限定词后,才得出较准确回答。由此可见,ChatGPT只能基于它接收到的数据来做出响应,如果它没有接收到相关的数据或无法识别某些信息,它可能无法提供准确的回答。而对于AI、数字人文这种技术概念,显然更是“信手拈来”、“知无不言、言无不尽”。
Round 3
深入问答环节
问题复杂度:☆☆☆
第三回合中,笔者加大难度,提出更加细节的问题,针对“在档案资源开发利用过程中如何保证档案的原始性”一题,ChatGPT仅回答了后半个问题“如何保证档案原始性”,忽略了背景条件。而对于“知识图谱在红色档案资源开发利用过程中的应用”,ChatGPT的回答则游刃有余。由于ChatGPT的最新数据仅截至2021年,还不“知道”最近的《流浪地球2》,所以附加题中对《流浪地球1》剧情的介绍是正确的。
经过上述“访谈”,笔者认为ChatGPT作为一个大型语言模型,非常强大,但仍然有一些局限性。虽然ChatGPT可以生成人类可理解的文本,但它对语言的深度理解仍然不及人类。且缺乏真正理解语言的能力,只是根据训练数据中的模式和规律来生成文本。
而对档案资源这一宝贵文化遗产的开发与利用,也是未来社会发展的重要基础和支撑。我们相信,在不断推进档案资源数字化、智能化的背景下,未来将会有更多的利用方式和场景涌现,为各行各业提供更加高效、精准、可信的支持。(本段由ChatGPT代写)
本次访谈到此结束,期待下次继续与ChatGPT聊聊档案领域的热点话题。