点击链接查看原文:ChatGPT实践问题分析与应用展望
来源:【零点有数科技】
【编者按】
ChatGPT是OpenAI最新的语言模型,与其他大型语言模型一样,能够以不同的样式和目的生成文本,并且在准确度、叙述细节和上下文连贯性方面表现更加优异。目前来看,ChatGPT在很多领域都有广泛的应用前景,但任何工具的应用都是有前提的,了解其背后的工作机制和局限之处,才能更好地利用这项技术。零点有数数据科学家团队基于业务经验,分享了对于ChatGPT在应用局限性方面的思考,并提出了关于ChatGPT算法需要进一步完善的几点构想。本文经IT之家、IT专家网、TechWeb百家号、腾讯云人工智能日报、中华网等权威媒体刊载。
一、ChatGPT概述
ChatGPT是OpenAI最新的语言模型,较其前身GPT-3有大幅提高。与其他大型语言模型一样,ChatGPT能够以不同的样式和目的生成文本,并且在准确度、叙述细节和上下文连贯性方面表现更加优异。作为OpenAI最新一代的大型语言模型,ChatGPT的设计非常注重交互性。为了调优ChatGPT,OpenAI使用了监督学习和强化学习的组合,其中强化学习的组件使其独一无二。OpenAI使用了“人类反馈强化学习”(RLHF)的训练方法,该方法在训练过程中利用人类反馈,以最小化无用、失真或有偏见的输出。
目前来看,ChatGPT在很多领域都有广泛的应用前景,并且它的操作简单,对用户非常友好。但任何工具的应用都是有前提的,了解其背后的工作机制和局限之处,才能更好地利用这项技术,零点有数数据科学家将基于此谈谈ChatGPT在应用时需要注意的几个方面。
二、ChatGPT的局限之处
-
多场景问题
一是标注数据。诸如回答内容存在事实性错误,对于确定的事实,其给出的答案无法达到高置信度,对于常识性的知识问题不能高效地给出符合日常认知的答案。大模型训练所需语料涉及面非常广,仅就人文学科而言,就存在非常庞杂的知识的语料,因此,在标注过程中,相关任务对标注人员的知识面、逻辑思考能力等都有极高的要求。在此基础上,还需要针对更多语料中提及的知识进行自动抽取,反复校验,才可一步步改进。如下图,关于古诗《登鹳雀楼》的提问,ChatGPT未能给出符合常识的回答,包括古诗的原文和作者信息。
二是数据理解。对于简单的数据说明可以顺利地进行比较分析,但面对略复杂的语义理解要求回答比较困难,对于中文丰富的词汇体系、语法和句法的特点,特别是涉及近义词之间的差别和近义程度的区分,还需要补充更多更广泛的训练数据、做进一步的训练和优化,才能修正相应问题。示例如下图。
三是数据分析能力。由于数据理解和分析能力暂未完善,ChatGPT目前无法正确有效地进行数理逻辑计算。如下图所示,针对四人四天喝四桶水,八人八天喝多少桶水的数据计算问题,并没有一次性形成合理的计算逻辑链路,给出正确的计算结果。
-
答复的生成内容不具备实时性
知识库信息未能实时更新。由于ChatGPT目前的版本仅支持2021年之前的语料信息提问,其回答的内容没有进行实时信息关联。训练一个模型的人力成本较大、时间周期较长,短期内难以有效地更新学习即时性的知识信息。
俄乌战争起始于2022年2月,而ChatGPT使用的最新训练数据只截止到2020年,因此对于最近发生的俄乌战争事件,无法给出具有时效性的情况分析。
-
模型能力覆盖广,但专业深度仍有提高空间
模型复杂度,丰富性和通用性足够高,但对于某个专业领域方向的资深知识信息结构认知仍有提高空间。
在上述的问答中,ChatGPT对于网络通信中的信息增益率公式只给出了概述性的描述,并未有效地展示公式的符合化表示及解释说明。
三、ChatGPT场景应用问题
尽管ChatGPT在不同场景中的应用性较强,但同时也凸显出一些值得关注的隐忧,从某种意义上而言,ChatGPT的出现,让诸多领域面临新的挑战。
-
教育教学
在教育教学方面,最为直接的影响是学生在学习过程中,缺乏足够的思考,直接询问ChatGPT,轻松地获取到相关的知识和解答,特别是在论文的写作过程中,直接查询或生成相关内容,不仅不利于学生有效掌握相关知识,无法锻炼问题研究能力,甚至会形成过度依赖,影响学生的创造力,不利于教育的发展。
-
公共安全
在公共安全领域,主要涉及社会治安和信息安全。就社会治安而言,利用ChatGPT可以模仿不同人员的对话习惯,再结合语音合成功能,进而实现高仿真的人类交流和互动,相关功能如果应用在诈骗等场合,助长违法犯罪,影响社会稳定。就信息安全而言,数据治理面临更大风险,特别是关涉国家安全、商业机密、个人隐私等多方面的敏感数据。ChatGPT模型训练所使用的数据一般为大量可公开的数据和知识,但基于现有的技术研发数据管理体制,不一定能保证直接相关的敏感数据或基于公开数据研究所得的敏感数据不被泄露。
-
伦理道德
在伦理道德方面,无论是个人还是社会或国家同样受到一定的影响。从个人的角度来看,对于大多数未成年人,甚至部分成年人,尚未形成成熟且稳定的心智,在使用ChatGPT的过程中,个人想法很容易被直接或间接地带偏,进而做出不合适的行为;从社会或国家的角度来看,ChatGPT如果作为一个文化冲击的工具,对整个社会和国家产生不良影响。
以上这些方面,都亟待相关技术方在技术层面对相关内容进行完善,对各种使用方进行权限的控制和监控,同时相关职能部门应从国家层面进行立法,进行合理的限制和管控。
四、关于ChatGPT算法的拓展构想
站在数据智能垂直应用的角度上,零点有数数据科学家基于丰富的业务经验,从以下四个方面谈了关于ChatGPT算法的拓展构想:
一是行业训练数据优势。ChatGPT还需要进一步整合各行业历史沉淀数据,并将数据转换为高质量、有效的训练数据集,才能更好地提升行业应用模型的精度。
二是强化推理能力。基于对业务场景的了解出发,对未知业务场景做从规则、向量表示推理到prompt的范式多层次学习推理过程。
三是线上更新机制。实时收集线上数据,并实时进行模式化的更新,动态反馈更新至模型中,形成模型长期反馈更新学习的机制。
四是合理挖掘发现行业应用场景。通过更深层次地将GPT技术与垂直行业的业务做融合,构建行业化的GPT模型,并服务于业务实际需求。