最近chatGPT很火,作为一名计算机科班出生的码农来说,就很有必要来聊下这个话题,因为从我专业的认知来说,我觉得chatGPT的火中带有太多的非专业情绪。虽然作为一名专业人士,但由于没有在模型和算法领域深入实践,说得不对的也希望大家海涵,当然更欢迎大家交流:
1)chatGPT是什么?
chatCPT是基于预先训练生成式模型(GPT)的一种聊天机器人。该机器人除了聊天之外,还可以进行撰写邮件、视频脚本、文案、翻译、代码等任务。这次之所以能取得突破的主要原因是在相关文本处理中引入了新的深度学习模型--RLHF (Reinforcement Learning with Human Feedback,即基于人类反馈的强化学习)。
2)chatGPT特点是什么
基于预先训练生成式模型,并引入了RLHF(基于人类反馈的强化学习)算法;训练样本大,参数多;是一种强大的文案辅助性工具。长处是知识面广,收集和组织能力强,速度快。短处是只是一种基于概率的“拟合”,不具有逻辑推理能力,缺乏应变,专业度差(如果要引入某个领域,需要针对性训练)。
3)chatGPT的核心是什么?
其核心是数据和想法。chatGPT是基于GPT模型和RLHF算法的创新应用。这些模型和算法其实都是现成的,但如何将这些模型和算法应用于某个领域并拥有海量的数据进行训练和调整是关键。因此chatGPT可以算作是应用型创新。
4)chatGPT可以在相关领域替代人类么?
chatGPT是一种应用工具。即使其在很多方面可能都比人类有优势,但其基础算法决定了其不可能替代人类。你可以利用它进行文档或论文撰写和翻译,你也可以利用它的知识面装逼,甚至你可以利用它进行程序代码编写,但它没法替代你进行思考和推理。利用chatGPT可以增强你的能力(主要是知识面,信息采集、收集和组织,多语言能力等),降低一些劳动强度;可以拉平普通人的知识水平差距,但无法拉平人的认知差距。我的看法是:普通人更卷,精英更强。
5)chatGPT将影响的领域
主要还是在文案及知识相关的领域,包括交流,教育,媒体等文字文案相关工作领域。正面的影响是可以减少劳动强度,提升文字工作质量。负面的影响可能包括:拉平普通人差距,文字文案工作领域会更卷;精英和普通人之间差距更大;线上的可信任度和可评价性变低(反过来有利于线下交流和直播)。
6)chatGPT为什么会这么火
一方面是技术确实取得突破,功能确实比较强大,而且很新鲜;另一方面是资本在背后推动,IT界需要新的概念,新的技术,新的故事,新的镰刀。加上中美之间微妙的关系,chatGPT没有对内开放,更是参杂了很多情绪在里面。一些人借机炒作割韭菜,一些人则制造天要塌下来的架势,宣传我们要玩了。而大部分吃瓜群众不明就里,被制造了焦虑,助长了对chatGPT的宣传。
7)中国在这块会落后么?
暂时会落后一点,但很快会赶上来,而且相关超级应用一定会在我们国家产生。因为其核心的GPT模型及RLHF算法,我们也是可以掌握的。而数据方面我们更不缺。只是这里我比较担心的就是那些拥有大量数据的企业,特别是国企和政府,在模型和算法的应用创新上跟不上,出现放着一堆数据黄金而讨饭的局面。从这里也可以看出数据的重要性。无论是国家还是企业,数据即资产的观念还要进一步,更应该树立起数据即生产力的观念。
8)除了对chatGPT的关注之外,我们更应该关注什么?
chatGPT只是GPT和RLHF的一种应用。我们更应该关注的是背后的算法和领域数据的结合。例如,美国最近出现的基于深度学习的蛋白质设计也是基于这些模型和算法在生物领域的一种应用。我希望我们的企业可以把这些模型和算法尝试在各个领域中进行应用。就如我们前面对待图像识别相关技术一样,只要涉及到这个都拿来试一试。因此,我并不担心中国会在这方面落后。相反,我们一旦将我们的数据规模优势加上工程师优势结合在一起,这些技术很快就会在我们的各个行业开花结果。至于模型和算法的本身研究,现阶段还是会落后一些,等待00,10后起来的时候,这也不是问题,因为现在的社会中坚力量很多都是在美国科技强大的氛围内长大,要突破或者有勇气去突破都是很难的。