文 | 智能相对论
作者 | 陈泊丞
2019年,彼时的AI赛道还不像今天这么热。
这一年,人工智能连续第三年出现在政府工作报告中,政策关键词从“加快”“加强”转变为“深化”,开始进入行业需求快速增长的应用探索期。而华为也在这个阶段完成了初步的战略布局和自主技术储备,向更深层次迈进。科大讯飞也前瞻性地联合多家国内厂商围绕根技术进行科研攻关,并希望通过一系列自主创新,提升AI领域的自主化水平,从而真正与国际科技巨头们能在同一起跑线上进行竞争。相似的经历、一致的目标,让科大讯飞和华为意识到对根技术的探索任重道远,并开始寻求深度的合作。
本土科技厂商的双向奔赴:“敢用-真用-会用-用好”步步深入
回顾讯飞星火大模型和华为昇腾的合作之路,科大讯飞副总裁、AI工程院院长潘青华梳理出了四个关键阶段,即“敢用-真用-会用-用好”,双方在每一个阶段都遇到了大量的问题、顾虑,最终携手克服困难,才把原生创新的路径走通。在与昇腾合作之前,科大讯飞就已经做了很多技术上的行动,比如自研深度学习并行训练框架和训推工具链,基于国内优秀软硬件基础设施打造稳定高效的大规模深度学习训练平台等等,但是在核心算力层面上始终没有很好的国产化解决方案,算力资源成了本土科技厂商发展AI大模型的一个关键限制。在这种情况下,科大讯飞走出了“敢用”的第一步。
随着对根技术需求的认识加深以及对昇腾AI平台性能的了解,科大讯飞开始尝试基于昇腾AI进行模型训练和推理工作。昇腾以其高度专业的服务态度和服务能力,全力支持讯飞AI训练移植优化,包含语音识别、语音理解、机器翻译等模型在昇腾算力资源上的移植适配。这让科大讯飞与昇腾AI的合作继续进入了“真用”阶段,开始寻求发展中解决大模型训练推理的核心难题。
以国内首个支持万亿参数大模型训练的智算集群“飞星一号”正式上线为标志性节点,科大讯飞不仅在业界首创基于RoCE的大规模无损组网,还与昇腾AI联合解决500余次软硬件问题,首次实现千亿参数大模型训练效率达到业界水平。在这个过程中,科大讯飞与昇腾AI共同攻坚克难,解决大规模集群训练中保存断点后性能“抖动”、性能“爬坡”等疑难杂症。有了这些成功的探索与验证,科大讯飞与昇腾AI的合作进入了以原生创新为主导的“会用”阶段,双方在根技术上的攻关取得显著回馈。
基于昇腾硬件亲和特性,科大讯飞对星火大模型的模型结构进行重新设计,不仅让星火大模型训练性能较之前提升10%,还创新实现了混合长序列并行算法,促使星火大模型在昇腾上的长序列性能提升了15%。今年6月,科大讯飞正式发布完全基于昇腾算力训练的星火大模型V4.0,其中星火V4.0在国内外中英文12项主流测试集的8项中,实现了对GPT-4Turbo的超越,成功晋升为业界领先的通用大模型底座。
未来,科大讯飞将继续思考如何进一步“用好”昇腾AI,面向更大规模集群和更大规模训练任务,共同探索如何持续挖潜集群性能、大模型推理性能如何进一步提升等等一系列问题。
一路走来,步步深入,科大讯飞与昇腾AI从最初的接触探索到后来的深入协同,再到原生创新的成功实践,双方以深度合作的姿态,在AI原生创新之路上越走越坚定。
本土化技术创新完成了一次很好的验证
本土化技术创新难在两大方面,一是技术难做,没有解题思路,二是项目难坚持,没有持续解决问题的理念,往往就会无疾而终。这是一段长期的探索历程,技术决定了起步,而理念决定了起步后的发展是否能长期。
一、技术与理念的双向奔赴。
科大讯飞与昇腾AI的这场合作之所以能成功,不仅是技术层面的深入协同,还有理念层面的双向奔赴。比如针对大规模集群训练两个月后“越训越慢”的问题,科大讯飞与昇腾AI通过集合通信-驱动-内核的层层分析,最终发现操作系统内核问题,导致算子下发时间变长、训练性能下降,才有了后续的解决方案。
二、互为反哺的价值共生。
此次合作中,业界看到的更多是科大讯飞基于昇腾AI完成了一系列成就,但与此同时,昇腾AI也在接受反哺。科大讯飞深入参与并助力昇腾持续完善面向大模型的软件生态,共同开发和优化了基础算子和通信算子共120多个,基于底层开放API接口也开发了自定义融合算子30多个。同时,双方共同组建的联合项目组还推动了昇腾工具50多项关键特性的开发,促使Mindstudio工具不断完善,也持续丰富了昇腾的大模型工具集。
好的合作关系一定是互相成就的,双方在本次合作中收获的巨大成果便是具象化呈现,若要实现本土化技术创新,就应该在互为反哺的价值共生关系中去寻求答案。
三、惠及产业发展的生态成果。
科大讯飞和昇腾AI的这场合作,在惠及企业自身的同时,也在推动着中国AI产业的跨越发展。比如,双方联合打造的国内首个支持万亿参数规模大模型训练的智算集群“飞星一号”,大幅提升我国在人工智能领域的行业竞争力。接下来双方将继续深入探索未来中国人工智能产业发展的关键问题,相信将有更多技术创新与生态成果,更广泛地惠及千行万业。
大模型原生创新时代开了个好头
科大讯飞和昇腾AI的双向奔赴为中国AI产业发展开了一个好头。正如潘青华院长在演讲中强调,“只有持续跑得快才能最终跑得赢。”中国AI产业发展需要持续跑得快。
现阶段,“原生创新”概念经常被行业所提及。但大部分的讨论只停留在了应用原生创新之上,认为只要把AI应用孵化在技术平台上,就是做到了原生创新,往往却忽视了根技术的原生创新。
如果孵化到国外的技术平台,做到了应用的原生创新,那确实是“跑得快”,但是能“持续”吗?其中客观存在的不稳定性和高风险,或许会在未来的某天突然“暴雷”,给企业经营和产业发展带来不可挽回的损失。
而只有基于根技术的自主创新,放在自家的技术平台上孵化、培育,那才有“持续跑得快、跑得稳”,最终“跑得赢”,跑向一个真正的大模型原生创新时代。科大讯飞和昇腾AI就一直在为这样的时代而努力。
基于讯飞星火医疗大模型平台和昇腾AI基础软硬件,科大讯飞与华为联合打造了一体化医疗健康私有化解决方案。同时,讯飞医疗还携手华为,与四川大学华西医院达成了三方战略合作伙伴关系,共同围绕创新医疗服务模式、改善就医体验、医疗大模型技术应用等重点领域展开深入合作。
这将是医疗大模型应用落地的一个里程碑,未来一个“AI为每个医生打造诊疗助理,为每个居民打造健康助手的世界”或许很快就会到来。那么,站在社会民生的角度来看,大模型原生创新时代的到来,不仅仅是对产业发展有助益,更将是AI普惠社会民众的开端。
据多家媒体统计,2024年上半年,在已公开的行业大模型中标信息中,科大讯飞的合同数量、合同金额均保持行业领先,行业场景逐步拓宽。今天,随着AI赛道越来越热,千行万业都在向AI领域发起冲锋,而产业经济的高质量发展需要持续跑得快、跑得稳,最终才能跑得赢。这一目标离不开本土企业对根技术的攻关以及对原生创新的坚持。
在讯飞星火与昇腾AI的双向奔赴中,业界看到了一条从技术攻关到应用探索的完整路径。以此为标杆,中国的AI产业又完成了一次探索验证,将跨入一个更稳定、坚实的发展新阶段。
*本文图片均来源于网络