2023年8月10日,由CCF CTO Club发起的第22期C³活动在百度北京总部进行,以“AI大语言模型技术与生态发展”主题,50余位企业界、学界专家、研究人员就此进行深入探讨。
CCF C³走进百度
本次活动,CCF秘书长唐卫清与百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜先后致辞。致辞后,吴甜和北京航空航天大学吴文峻教授进行了主题报告。接着,吴文峻教授、中国人民大学高瓴人工智能学院副院长窦志成、百度飞桨总架构师于佃海、国网智能电网研究院计算及应用研究所人工智能总工程师吴春鹏、中科曙光智能计算产品部总经理杜夏威展开高峰对话,由百度AI技术生态总经理马艳军主持。
唐卫清致辞
开场,CCF秘书长唐卫清进行了致辞,他提到C³系列活动是CCF在“企业化”方向的有益探索,也将推出“合作伙伴计划”。本次活动让大家对百度产生了新认识,百度在AI大语言模型方面领先成果是值得肯定的,期望活动可以让产学研各方面建立联系,积极探索技术前沿。
吴甜:大模型产业实践与文心一言
大语言模型发展给市场带来了新的发展空间。百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜以“大模型产业实践与文心一言”为题作报告,介绍了文心大模型的产业落地实践和文心一言最新进展。百度在2019年就推出了文心大模型,今年5月升级到3.5版本。文心大模型3.5进行了基础模型升级、精调技术创新、知识点增强、逻辑推理增强、插件机制新增,相比3月份的版本,效果提升50%,训练速度提升2倍,推理速度提升30倍。
吴甜致辞并作主题报告
在大模型产业化方面,百度已和多个行业的带头企业、机构共同研发行业大模型,训练出了更适配行业场景的模型。根据IDC相关报告,百度文心大模型在14个参评模型中拿下12项指标的7个满分,得到“综合评分第一,算法模型第一,行业覆盖第一”三个绝对第一。同时,百度已为社会培养了300万AI人才,未来还将持续加大投入力度,为推进大模型的落地与发展持续做出贡献。
吴文峻:通用人工智能时代的群体智能研究
从专用模型到通用大模型还有多远的距离?北京航空航天大学吴文峻教授在报告中指出,“大模型要落地应用,真正重塑产业,关键还是基于大模型的智能决策能力发展”, 强大的基座模型对产业和生态都形成了很深刻的影响。当前基础模型在决策领域应用已经非常广阔,有助于解决教育、医疗、网络搜索等领域的问题,支持跨领域的通用智能决策模型研发。
吴文峻作主题报告
而针对通用基础模型存在泛化性弱、稳定性差、难实用等突出问题,多模态LLM模型结合MDP框架可以提升Agent的感知-认知能力,推进高层任务需求的理解和规划决策,并形成作为环境迁移和Reward的生成模型。有了以上基础,我们就有可能让海量知识和物理世界形成对照,提升智能体在新环境下的智能决策,进而形成群体化通用具身智能系统。报告认为,大模型开启了通用人工智能时代,让群体智能研究也进入了全新阶段,通用群体智能已经初现端倪。
高峰对话:产学研协同 共建大模型生态
马艳军、吴文峻、窦志成、于佃海、吴春鹏、杜夏威(从左到右),进行高峰对话
大语言模型为发展通用人工智能带来曙光,也正在形成一个繁荣的创新生态圈。高峰对话环节由百度AI技术生态总经理马艳军主持,吴文峻教授、中国人民大学高瓴人工智能学院副院长窦志成、百度飞桨总架构师于佃海、国网智能电网研究院计算及应用研究所人工智能总工程师吴春鹏、中科曙光智能计算产品部总经理杜夏威五位产学研各方面的专家,就大模型发展态势进行了深入探讨。对话串起了大模型产业链上的一系列问题,涵盖基础研究、底层软硬件支撑、产业发展应用等多个大模型生态话题,展现了专家们对科研-产业、软件-硬件、行业应用等多个生态关系的思考与分析。
百度高校合作部总监李轩涯担任主持人
大模型的发展需要深厚的技术积淀、丰富的落地应用和繁荣的技术生态,不能一蹴而就。在未来的大模型生态中,产学研必须更加紧密结合,在应用中发现问题,在研究中夯实基础;同时,只有让模型开发者、应用开发者、底层软硬件支撑者都能从中受益,才能形成一个良性的生态体系。