出品|网易科技《智见访谈》
采访|丁广胜
撰文|袁宁
风暴自ChatGPT 震撼亮相起。
国外,一路狂飙,其背后的GPT大模型全方位秀肌肉,不断展现其惊人能力。又迅速演化,完成迭代,仅四个月后就发布GPT4,引发连连惊叹。
国内,百花齐放,你方唱罢我登台。百度、阿里等互联网大厂纷纷亮相对标产品,试与ChatGPT比高。然而与此同时,对于国产对标产品的质疑声也愈发响亮。
新一轮技术革命已然来袭,我们距离ChatGPT有多远?网易科技与北京智谱华章科技有限公司(下称“智谱AI”) CEO张鹏进行了对谈。
“
谈差距:国内起步略晚,但持续革新
智谱AI在大模型领域深耕多年,其研究出的GLM-130B是国内唯一一个入选斯坦福大学基础模型研究中心测评,能跟顶尖模型一较高下的基座模型。自2022年8月发布以来,已收到55个国家989个研究机构的使用需求。
谈到国内外的差距,张鹏表示,虽然国外在人工智能领域的布局更早,但国内很多大厂和研究机构也一直保持着很高的关注度。
大模型技术具有高投入、高要求的特点,团队、算法等方面也是一个系统性的工程,因此大家对此的投入都比较谨慎。中国起步时间可能会比国外晚一些,但并不代表国内没有做这些事情。比如智谱团队2020年就参与研发 GLM 预训练架构和训练百亿参数模型,2021年参与训练万亿级别稀疏模型。
2022年主导推出高精度开源千亿模型GLM-130B(https://github.com/THUDM/GLM-130B), 2023年2月,团队推出ChatGLM,公开评测性能还不错。
其开源的ChatGLM-6B 模型全球下载超过70万(https://huggingface.co/THUDM/chatglm-6b),持续两周位列 Huggingface 全球模型趋势榜榜首。
ChatGLM-6B可以帮助更多人了解和参与到大模型的开发和使用中来,共同推进技术的发展和创新。他支持在单张消费级显卡上进行推理使用,甚至还有网友把模型进一步压缩到只需要2G内存就可以运行,大模型研究进入普及阶段。这是继此前开源GLM-130B千亿基座模型之后,智谱再次推出大模型方向的研究成果。
“
谈落地:基座的能力很关键
张鹏介绍,目前在生成式AI领域,主要可以分为三类角色。第一类是关注于底层模型和基础能力的建设,目标是以通用模型为目标,提高模型的通用能力、方法能力、多任务能力和跨模态能力等。第二类是基于基础模型的泛化能力去做上层应用开发,结合场景和行业的深入知识和积累,去快速地帮助行业用户解决实际问题。第三类是作为辅助性技术的供应商,帮助解决工具提效等方面的辅助性问题。
智谱作为专注于底层模型的一类,张鹏强调,基座的能力是非常关键的。ChatGPT正是摸索出了一套方法来更好地发挥能力上限,而落地的动作也能对技术本身的能力进行验证,在不同场景下实现与用户的触达,获得用户的反馈,帮助对大模型的进一步优化。
智谱AI很早便提出了Model as a Service的理念,主张提供从预训练大模型到API到应用多层级以及从云端到私有化到一体机部署的灵活部署方式。
他认为这种模型与服务的融合可以为传统软件工具驱动的IT系统注入智能驱动的能力,从而重塑整个IT系统的架构。这种重塑将使得IT系统更高效、更智能,进而降低开发成本,提升用户和应用者的收益。因此,Model as a Service的价值会超过过去每一层形成的时候所带来的价值。
“
谈风险:马斯克们的AI伦理与风险观
3月末,包括特斯拉CEO埃隆·马斯克等在内的数千名AI领域企业家、学者、高管发出了一封题为《暂停大型人工智能研究》公开信。他们在信中强烈呼吁:所有AI研究室立刻暂停训练比GPT-4更加强大的AI系统,为期至少6个月。人们对于人工智能发展的恐慌尽显。
对此,张鹏认为,马斯克等也不算极端,他们只是提出了暂停六个月来降低风险的建议,并没有真正要求封禁人工智能技术。相对以往对于克隆技术、基因编辑等的骂声,还相对温和,有助于防止技术发展过快而导致失控的风险。
对于中国来说,我们一直在技术发展过程中进行跟进,这件事情也是给我们很多启发,在重视人工智能的发展和应用的同时,也不能忽视了其可能带来的影响。随着相关法律法规的出台,生成式人工智能技术将进一步实现健康发展和规范应用。
安全性和伦理问题是自AI技术诞生以来,学界、社会和产业界共同关注的问题。然而,在技术发展的同时,解决这些问题还需要考虑到各个方面和群体的利益。技术发展的同时必然会产生新的问题,然而技术本身是可控的。世界不断进步,我们也不需要太过担心。
/
/
扫码关注我们