讯飞星火与昇腾AI双向奔赴:本土化技术创新应对全球化挑战的一次成功验证

文 | 智能相对论

作者 | 陈泊丞

2019年,彼时的AI赛道还不像今天这么热。

这一年,人工智能连续第三年出现在政府工作报告中,政策关键词从“加快”“加强”转变为“深化”,开始进入行业需求快速增长的应用探索期。而华为也在这个阶段完成了初步的战略布局和自主技术储备,向更深层次迈进。科大讯飞也前瞻性地联合多家国内厂商围绕根技术进行科研攻关,并希望通过一系列自主创新,提升AI领域的自主化水平,从而真正与国际科技巨头们能在同一起跑线上进行竞争。相似的经历、一致的目标,让科大讯飞和华为意识到对根技术的探索任重道远,并开始寻求深度的合作。

本土科技厂商的双向奔赴:“敢用-真用-会用-用好”步步深入

回顾讯飞星火大模型和华为昇腾的合作之路,科大讯飞副总裁、AI工程院院长潘青华梳理出了四个关键阶段,即“敢用-真用-会用-用好”,双方在每一个阶段都遇到了大量的问题、顾虑,最终携手克服困难,才把原生创新的路径走通。在与昇腾合作之前,科大讯飞就已经做了很多技术上的行动,比如自研深度学习并行训练框架和训推工具链,基于国内优秀软硬件基础设施打造稳定高效的大规模深度学习训练平台等等,但是在核心算力层面上始终没有很好的国产化解决方案,算力资源成了本土科技厂商发展AI大模型的一个关键限制。在这种情况下,科大讯飞走出了“敢用”的第一步。

随着对根技术需求的认识加深以及对昇腾AI平台性能的了解,科大讯飞开始尝试基于昇腾AI进行模型训练和推理工作。昇腾以其高度专业的服务态度和服务能力,全力支持讯飞AI训练移植优化,包含语音识别、语音理解、机器翻译等模型在昇腾算力资源上的移植适配。这让科大讯飞与昇腾AI的合作继续进入了“真用”阶段,开始寻求发展中解决大模型训练推理的核心难题。

以国内首个支持万亿参数大模型训练的智算集群“飞星一号”正式上线为标志性节点,科大讯飞不仅在业界首创基于RoCE的大规模无损组网,还与昇腾AI联合解决500余次软硬件问题,首次实现千亿参数大模型训练效率达到业界水平。在这个过程中,科大讯飞与昇腾AI共同攻坚克难,解决大规模集群训练中保存断点后性能“抖动”、性能“爬坡”等疑难杂症。有了这些成功的探索与验证,科大讯飞与昇腾AI的合作进入了以原生创新为主导的“会用”阶段,双方在根技术上的攻关取得显著回馈。

基于昇腾硬件亲和特性,科大讯飞对星火大模型的模型结构进行重新设计,不仅让星火大模型训练性能较之前提升10%,还创新实现了混合长序列并行算法,促使星火大模型在昇腾上的长序列性能提升了15%。今年6月,科大讯飞正式发布完全基于昇腾算力训练的星火大模型V4.0,其中星火V4.0在国内外中英文12项主流测试集的8项中,实现了对GPT-4Turbo的超越,成功晋升为业界领先的通用大模型底座。

未来,科大讯飞将继续思考如何进一步“用好”昇腾AI,面向更大规模集群和更大规模训练任务,共同探索如何持续挖潜集群性能、大模型推理性能如何进一步提升等等一系列问题。

一路走来,步步深入,科大讯飞与昇腾AI从最初的接触探索到后来的深入协同,再到原生创新的成功实践,双方以深度合作的姿态,在AI原生创新之路上越走越坚定。

本土化技术创新完成了一次很好的验证

本土化技术创新难在两大方面,一是技术难做,没有解题思路,二是项目难坚持,没有持续解决问题的理念,往往就会无疾而终。这是一段长期的探索历程,技术决定了起步,而理念决定了起步后的发展是否能长期。

一、技术与理念的双向奔赴。

科大讯飞与昇腾AI的这场合作之所以能成功,不仅是技术层面的深入协同,还有理念层面的双向奔赴。比如针对大规模集群训练两个月后“越训越慢”的问题,科大讯飞与昇腾AI通过集合通信-驱动-内核的层层分析,最终发现操作系统内核问题,导致算子下发时间变长、训练性能下降,才有了后续的解决方案。

二、互为反哺的价值共生。

此次合作中,业界看到的更多是科大讯飞基于昇腾AI完成了一系列成就,但与此同时,昇腾AI也在接受反哺。科大讯飞深入参与并助力昇腾持续完善面向大模型的软件生态,共同开发和优化了基础算子和通信算子共120多个,基于底层开放API接口也开发了自定义融合算子30多个。同时,双方共同组建的联合项目组还推动了昇腾工具50多项关键特性的开发,促使Mindstudio工具不断完善,也持续丰富了昇腾的大模型工具集。

好的合作关系一定是互相成就的,双方在本次合作中收获的巨大成果便是具象化呈现,若要实现本土化技术创新,就应该在互为反哺的价值共生关系中去寻求答案。

三、惠及产业发展的生态成果。

科大讯飞和昇腾AI的这场合作,在惠及企业自身的同时,也在推动着中国AI产业的跨越发展。比如,双方联合打造的国内首个支持万亿参数规模大模型训练的智算集群“飞星一号”,大幅提升我国在人工智能领域的行业竞争力。接下来双方将继续深入探索未来中国人工智能产业发展的关键问题,相信将有更多技术创新与生态成果,更广泛地惠及千行万业。

大模型原生创新时代开了个好头

科大讯飞和昇腾AI的双向奔赴为中国AI产业发展开了一个好头。正如潘青华院长在演讲中强调,“只有持续跑得快才能最终跑得赢。”中国AI产业发展需要持续跑得快。

现阶段,“原生创新”概念经常被行业所提及。但大部分的讨论只停留在了应用原生创新之上,认为只要把AI应用孵化在技术平台上,就是做到了原生创新,往往却忽视了根技术的原生创新。

如果孵化到国外的技术平台,做到了应用的原生创新,那确实是“跑得快”,但是能“持续”吗?其中客观存在的不稳定性和高风险,或许会在未来的某天突然“暴雷”,给企业经营和产业发展带来不可挽回的损失。

而只有基于根技术的自主创新,放在自家的技术平台上孵化、培育,那才有“持续跑得快、跑得稳”,最终“跑得赢”,跑向一个真正的大模型原生创新时代。科大讯飞和昇腾AI就一直在为这样的时代而努力。

基于讯飞星火医疗大模型平台和昇腾AI基础软硬件,科大讯飞与华为联合打造了一体化医疗健康私有化解决方案。同时,讯飞医疗还携手华为,与四川大学华西医院达成了三方战略合作伙伴关系,共同围绕创新医疗服务模式、改善就医体验、医疗大模型技术应用等重点领域展开深入合作。

这将是医疗大模型应用落地的一个里程碑,未来一个“AI为每个医生打造诊疗助理,为每个居民打造健康助手的世界”或许很快就会到来。那么,站在社会民生的角度来看,大模型原生创新时代的到来,不仅仅是对产业发展有助益,更将是AI普惠社会民众的开端。

据多家媒体统计,2024年上半年,在已公开的行业大模型中标信息中,科大讯飞的合同数量、合同金额均保持行业领先,行业场景逐步拓宽。今天,随着AI赛道越来越热,千行万业都在向AI领域发起冲锋,而产业经济的高质量发展需要持续跑得快、跑得稳,最终才能跑得赢。这一目标离不开本土企业对根技术的攻关以及对原生创新的坚持。

在讯飞星火与昇腾AI的双向奔赴中,业界看到了一条从技术攻关到应用探索的完整路径。以此为标杆,中国的AI产业又完成了一次探索验证,将跨入一个更稳定、坚实的发展新阶段。

*本文图片均来源于网络 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/445203.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

爬虫(反调试)

其实就是一种给页面反爬机制,一般页面用不到。 万能解决反调试方法:

vue-插槽作用域实用场景

vue-插槽作用域实用场景 1.插槽1.1 自定义列表渲染1.2 数据表格组件1.3 树形组件1.4 表单验证组件1.5 无限滚动组件 1.插槽 插槽感觉知道有这个东西,但是挺少用过的,每次看到基本都会再去看一遍用法和概念。但是在项目里,自己还是没有用到过…

查看 Excel 应用程序中已打开的 Excel 文件的完整路径

要查看 Excel 应用程序中已打开的 Excel 文件的完整路径(全路径),你可以通过以下几种方法获取具体路径,尤其是在 VSTO 应用程序中。 方法1:使用 VSTO Excel 外接程序代码 在 VSTO 外接程序代码中,您可以直接…

海外市场充电桩需求激增:充电基础设施展望

报告显示,在大多数欧盟国家的路网中,充电桩数量存在不足、不支持快速充电且分布不均匀的问题。具体而言,有6个欧洲国家的平均每百公里充电桩数量不足1个,17个国家的平均每百公里充电桩数量少于5个,仅有5个国家的平均每…

计算机网络之传输层

一、传输层提供的服务 1、传输层的功能 向上面的应用层提供通信服务,属于面向通信的最高层,用户功能的最低层。传输层为运行在不同主机上的进程中间提供了逻辑通信,网络层提供主机之间的逻辑通信。边缘部分两台主机使用网络核心部分的功能进…

网络编程(15)——服务器如何主动退出

十五、day15 服务器主动退出一直是服务器设计必须考虑的一个方向,旨在能通过捕获信号使服务器安全退出。我们可以通过asio提供的信号机制绑定回调函数即可实现优雅退出。 之前服务器的主函数如下 #include "CSession.h" #include "CServer.h"…

[Git] Git下载及使用 从入门到精通 详解(附下载链接)

前言 目录 Git概述 简介 下载 Git代码托管服务 Git常用命令 Git全局配置 获取Git仓库 在本地初始化一个Git仓库 从远程仓库克隆 基本概念 工作区文件状态 本地仓库操作 远程仓库操作 分支操作 标签操作 在IDEA中使用Git 在IDEA中配置Git 本地仓库操作 远程仓…

Ngx+Lua+Redis 实时IP黑名单系统

实时黑名单系统,如果用php脚本实现很容易,但是效率惨不忍睹呀。 要想速度快还的在nginx层实现阻塞。如果iptables 层阻塞速度更快,但是黑名单列表如果有更新就必须要重载配置,实现还是有难度的。php管理后台把黑名单ip写入到redis…

万字详解AI实践,零手写编码用AI完成开发 + 数据清洗 + 数据处理 的每日新闻推荐,带你快速成为AI大神

用AIdify完成前后端开发数据处理和数据清洗。 引言数据获取和数据处理dify构建workflow进行数据清洗前端页面构建和前后端交互总结 引言 AI时代对开发人员的加强是非常明显的,一个开发人员可以依靠AI横跨数个自己不熟悉的领域包括前后端、算法等。让我们来做个实践…

生信初学者教程(二十八):单细胞数据标准化

文章目录 介绍加载R包导入数据消除测序深度影响评估细胞周期的影响识别高度可变的特征缩放数据降维聚类输出结果总结介绍 scRNA-seq的标准化是一个重要的预处理步骤,目的是消除技术变异(比如比如测序深度和基因长度等因素),使基因表达和/或样本之间的比较更加可靠。标准化方…

如何彻底掌握 JavaScript 23种设计模式

设计模式是解决特定问题的常用解决方案,它们可以帮助开发者编写更清晰、可维护、可扩展的代码。在 JavaScript 中,常见的设计模式可以分为三大类:创建型模式、结构型模式 和 行为型模式。本文将全面介绍 JavaScript 中常见的设计模式&#xf…

Java 日志打印

使用日志打印: private static Logger log LoggerFactory.getLogger(DeptController.class);RequestMapping("/depts")public Result list() { // System.out.println("查询全部部门数据");log.info("查询全部部门数据");ret…

pytorch 与 pytorch lightning, pytorch geometric 各个版本之间的关系

主要参考 官方的给出的意见; 1. pytorch 与 pytorch lightning 各个版本之间的关系 lightning 主要可以 适配多个版本的 torch; https://lightning.ai/docs/pytorch/latest/versioning.html#compatibility-matrix; 2. pytorch 与 pytorch geometric 各…

【AIGC】2022-NIPS-视频扩散模型

2022-NIPS-Video Diffusion Models 视频扩散模型摘要1. 引言2. 背景3. 视频扩散模型3.1. 重建引导采样以改进条件生成 4. 实验4.1. 无条件视频建模4.2. 视频预测4.3. 文本条件视频生成4.3.1 视频与图像建模的联合训练4.3.2 无分类器指导的效果4.3.3 更长序列的自回归视频扩展 5…

线程池简单原理

设置了isRun导致任务没有执行完是因为子线程在消费队列的时候的run内while循环取队列的值,如果isRun为flase会停掉所有线程,解决是不仅isRun为false还要求队列的数据10个全取出队列大小为0. 当线程池队列满的时候任务会不会丢 可以使用默认的rejectExc…

Superset SQL模板使用

使用背景 有时想让表的时间索引生效,而不是在最外层配置报表时,再套多一层时间范围。这时可以使用SQL模板 参考官方文档 https://superset.apache.org/docs/configuration/sql-templating/#:~:textSQL%20Lab%20and%20Explore%20supports%20Jinja 我…

面试题:Redis(二)

1. 面试题 2. MoreKey案列 事故案例 2.1 生成上如何限制key*/flushdb/flushall等危险命令的使用? 通过redis.conf配置文件中在SECURITY选项中禁用这些命令 2.2 不用key*避免卡顿那用什么? 用scan命令,类似mysql中的limit命令 语法&…

VSCode的常用插件(持续更新)

点击左边工具栏的“扩展”,在搜索栏中查找对应插件,点击“安装”,安装完成后右边界面的插件会显示“卸载”按钮。 1、中文(简体)语言包 2、Auto Rename Tag 修改开始标签,结束标签也会随之自动变化。 3、O…

《Windows PE》4.3 延迟加载导入表

延迟加载导入表(Delayed Import Table)是PE文件中的一个数据结构,用于实现延迟加载(Lazy Loading)外部函数的机制。 延迟加载是指在程序运行时,只有当需要使用某个外部函数时才进行加载和绑定,…

wms智能供应链仓储管理系统,一站式仓储管理产品溯源解决方案

几度WMS条码仓储 管理系统是公司凭借多年为制造企业信息化服务的经验积累,结合WMS、条码、ERP思想而设计的智能供应链仓储系统。 主要包括以下六大模块:库位管理、存货管理、来料管理、发料管理、成品管理、日常管理。WMS条码仓储管理系统,是…