2023年2月24日下午,第四届OpenI/O启智开发者大会NLP大模型分论坛在深圳人才研修院隆重举办。该论坛以“开源集智创新探索中文NLP大模型生态发展”为主题,众多业内人士和研发者在此共享NLP领域的前沿动态和研发经验,畅想中国NLP领域的发展前景。
NLP大模型论坛会议现场
本次论坛汇集NLP领域顶级专家学者与多家国产NLP大模型开发团队,共同探讨NLP领域前沿资讯与未来技术和应用发展所面临的挑战与机遇,就大模型在可信性、鲁棒性、安全性和应用落地等方面存在的困境进行研讨交流。
1
院士专家齐聚 共话NLP未来
清华大学计算机系教授、欧洲科学院外籍院士、ACL Fellow孙茂松在“大模型:人工智能的大力神与弄潮儿”为主题发言中提到,以大模型为代表的人工智能当前发展基本态势。扼要评介了什么是大模型、大模型的出色性能,并着重探讨了目前国内需要密切关注的、与大模型相关的若干研究与开发问题。
清华大学计算机系教授 孙茂松
华为诺亚方舟实验室语音语义Lab主任蒋欣详细地介绍了华为诺亚方舟实验室在AI基础模型方面的系列工作及研究历程,特别强调了“盘古α”系列基础语言模型和“悟空”系列基础多模态模型的性能及应用优势。
华为诺亚方舟实验室语音语义Lab主任 蒋欣
就当下火爆出圈的“ChatGPT”,IDEA研究院讲席科学家、认知计算与自然语言研究中心负责人张家兴分享自己的见解,他指出ChatGPT对NLP领域的重塑意义在于实现了从专家定义任务到用户定义任务的突破,呼吁在AI模型化、工程化的趋势下国内版ChatGPT的联合创新。
IDEA研究院讲席科学家 张家兴
阿里巴巴达摩院资深算法专家、AliceMind大模型团队负责人黄松芳介绍了AliceMind NLP大模型的相关研发工作,以及如何通过开源开放搭建魔搭社区ModelScope,并邀请研发者分享共建大模型的经验。
阿里巴巴达摩院资深算法专家 黄松芳
清华大学计算机系副教授刘知远围绕大模型值得关注的重要特性展开演讲。他着重介绍了大模型在模型框架、微调适配以及推理计算等方面的重要特性,并分享近期研究发现的大模型相关技术特点,阐述了大模型研究在未来面临的五大挑战。
清华大学计算机系副教授 刘知远
蓝驰创投投资合伙人石建平认为认知智能时代的到来,为实现数字虚拟知识工人带来了可能性,它将无限量地供给、赋能各种行业、企业、个人以任务和场景,使专业的、随时随地、接近人类的认知智能更加触手可得。
蓝驰创投投资合伙人 石建平
鹏城实验室-AITISA联盟算力网推进组组长余跃对“启智飞轮计划”进行了重点阐述。余跃表示,开源开放是解决复杂问题的最好手段。他希望能有更多的模型,有持续终身学习的服务模式,提供更多创新的平台和服务场。
鹏城实验室-AITISA联盟算力网推进组组长
余跃
2
交流中碰撞思想 对话中凝聚共识
在圆桌论坛环节中,孙茂松、徐睿峰、黄松芳、刘知远、石建平、王晖作为嘉宾参与讨论,鹏城实验室云计算所副所长相洋进行主持。与会院士、专家围绕“NLP大模型技术与应用十大挑战”展开系列探讨,发表真知灼见和独到见解。
圆桌讨论环节
王怀民院士也提出问题和大家共同探讨,他提出“随着大模型承载的内容和数据越来越多,它能不能通过训练变得更“智能”,更自主地持续性学习?”
中国科学院院士 王怀民
王怀民院士认为大模型产生后,获得了观察智力或者认知的人造模型,人工构造的结构通过深度网络的学习能够产生人类相似的能力。大模型既然能实现功能分区,还能形成稀疏关系,而不是对全网的破坏性影响。认知本质的问题在于研究观察新手段,按照目前算力网络基础设施继续建设的话,我们可以让网络的连接远超出一个人的神经网络,持续把人类积累的文明都吸纳进去,用工程化的方法进行探索和实践。
发言的最后,王怀民院士升华了问题的讨论,首先他指出我们做的很多事情不应该只看经济成本,而要看对社会、国家、人类的积极拉动作用;其次,像中国算力网这样跨时代基础设施的建成,将会爆炸式的点燃国家创新能力,极大繁荣我国人工智能技术发展,赋能各行各业产生巨大价值。
他表示,在中国我们要有更大的视野,建设算力网,一方面要建设软硬件,另一方面也要建设引爆性要素。开源生态的意义就在于互相成就,通过开源,我们将做到智力融资,我们也将以更低的成本找到通路人和同路人。人类社会的发展,依靠的就是并肩同行。
3
中国NLP大模型总部基地启动
官宣进入“大模型”时代
为了进一步支持中国NLP大模型的发展,鹏城实验室联合国内开展大模型研究的多家单位,携手助力中国NLP大模型生态建设。在本次论坛期间汇聚国内NLP大模型产学研机构共同启动了中国NLP大模型总部基地的建设,期望通过开源开放,给世界一个新的选择。
在万众瞩目的启动仪式环节中,王怀民院士、孙茂松、李革、徐睿峰、刘知远、黄松芳、石建平、余跃等专家作为参与嘉宾共同启动装置。本次启动仪式的举办预示着中国NLP领域正在进入“大模型”时代,基于中国算力网的中国NLP大模型的技术和应用生态未来可期!
中国NLP大模型总部基地启动仪式
中国NLP大模型总部基地未来将基于中国算力网充沛资源支持,凝聚国内中文NLP大模型产学研用各方力量,构建基于国产AI芯片和AI架构的中文NLP大模型持续演化生态,以开源开放集智创新为宗旨,努力为中国NLP大模型技术与应用创新发展做出贡献。
4
CCF开源创新中心授牌仪式举行
打造独具特色“中国方案”
在本次论坛的重磅环节,CCF开源发展委员会副秘书长王涛主持了CCF开源创新中心授牌仪式。作为中国计算机领域最大的学术团体之一,中国计算机学会(CCF)一直致力于推动计算机领域的学术交流和产学研合作,依托学会现代学术阵地体系探索学术共同体开源创新发展新途径。
本次论坛邀请中国科学院王怀民院士、鹏城实验室网络智能部副主任李革完成CCF开源创新中心授牌仪式。“中国计算机学会鹏城开源创新中心”牌匾正式亮相,标志着CCF发展委员会和鹏城实验室正式达成合作,共同推动建立CCF鹏城开源创新中心。
CCF开源创新中心授牌仪式
王怀民院士提到,作为中国计算机学会(CCF)成立的最新委员会,开源发展委员会以一个学术社团的结构来推动开源的发展,通过开源来推动创新模式探索的体制机制建设的参与,共同推进中国开源创新的发展。
鹏城实验室网络智能部副主任李革提到,在过去五年的工作中,启智社区通过开源开放的形式来推动国内人工智能的发展。期待更多年轻开发者能够充分利用好鹏城实验室的算力资源,以及由中国计算机学会(CCF)和鹏城实验室共同开发的工具,实现理论和实践的突破。
未来,CCF开源创新中心将为会员乃至全球开源创新实践者提供更高水平的开源创新服务,更好地助力我国开源生态建设的发展,推动开源人工智能在中国发展的成功实践范例!
本次论坛的成功举办,离不开鹏城实验室、新一代人工智能产业技术创新战略联盟(AITISA)的大力支持。论坛希望通过该领域前沿动态和研发经验的共享,打破技术壁垒,凝聚行业共识,锚定未来方向,全力打造基于中国算力网C2Net的人机协作复杂AI软件系统持续构造与演化飞轮,立足国产AI软硬件环境,通过开源开放,聚智创新中文NLP大模型的技术与应用生态,为世界提供独具特色的“中国方案”!