NVIDIA等40家伙伴助攻!百度飞桨的硬件生态已成气候

954a58c2f5473d323cfa97589c428d99.jpeg

文|卖萌酱

当前人工智能产业迅猛发展,各种场景对AI算力和硬件适配的需求与日俱增。要充分发挥硬件算力的潜能,硬件厂商必须与成熟的AI框架深度适配和优化,从而形成一个软硬一体的AI开发工具栈。

笔者注意到,作为国内市场综合份额第一的深度学习平台百度飞桨成为了这场合作盛宴的核心。

受深度学习浪潮的带动,人工智能芯片赛道可谓持续爆火。如果说,2020年以前,人工智能概念更多偏重于研究,那么2022年以后,人工智能的概念可谓是应用生态的全面爆发,无论是传统互联网,还是金融、能源、制造、交通等其他行业,都被带入了新一代人工智能技术升级的红利期。

尤其近期在ChatGPT应用破圈的影响下,AI算力的需求被推到了史无前例的高度。甚至有人喊出“得算力者得ChatGPT”的夸张口号。

0836bf794525998d29000aa7d3a2b425.png

但是,“囤卡”真的能解决全部问题吗?

相信任何一个AI从业者心里都有个清晰的答案: 不是

同样是100张A100卡,如果没有强大的中间件——深度学习框架支持,那这100张A100的实际运行算力可能仅能做到理论值的20%甚至更低。底层算子优化、框架计算效率、跨卡通信优化、网络优化、IO优化等,都会极大的影响算力的释放。换句话说,硬件+框架的联合建设才能做到全局最优解。

在刚刚结束的NVIDIA GTC2023大会上,笔者留意了一下,发现大量的议题是跟算力工具和硬件设施优化相关的。其中,百度在GTC2023的主题演讲特别精彩,在此推荐一波:

15c2b3032d5227a8100afa79b5ee3510.jpeg

为什么要这么强调框架+硬件共建呢?

我们知道,在各行各业AI产品大爆发的背后,是百花齐放的AI硬件/芯片底座。可以确定的是,底层硬件设计、框架中间件架构、上层软件系统都在不断的升级变化,因此,各行各业都会面临新硬件新框架适配困难、部署复杂、应用开发困难、算力无法得到充分释放等问题。

而这个问题,对硬件厂商来说也很头疼。

比如,国内某硬件厂商曾经在2019年围绕着Tensorflow 1.x版本展开了大量的研发适配,但到了2020年,新发布的Tensorflow 2.x版本在接口、架构体系上相比1.x版本做了大幅改动,导致该厂此前对1.x投入的成本远未获得相匹配的回报。

因此,可以说,如果实现不了开源深度学习框架与AI芯片、计算系统的联合优化,那么硬件厂商将不得不增加额外的研发成本和资源消耗,整个上层的AI应用生态的爆发速度和进化效率都会受到严重掣肘。反之,则是一个多赢局面。

解决问题的关键

在上面的问题中,开源深度学习框架则是实现硬件跨平台统一、高效发挥硬件性能并支撑上层各类AI应用开发的关键软件平台。因此,要解决上述问题,释放AI生态的潜力和行业赋能效率,那么就需要一个强有力的深度学习框架来作为纽带,带动上下游联动优化,实现AI算力和工具链效率的极致优化。笔者注意到,作为国产深度学习框架担当的百度飞桨,在去年5月份,其携手NVIDIA、Intel、瑞芯微、Arm、Imagination等国内外硬件厂商联合发布 了 “硬件生态共创计划” ,笔者认为,这正是问题破局的关键点。

飞桨硬件生态共创计划

一句话来解释这个计划—— 飞桨“硬件生态共创计划”是面向飞桨硬件生态伙伴的合作计划,主要包含联合研发、资源共享、联合授权、培训赋能四项重点工作,旨在协同战略合作伙伴软硬一体全面共创,聚生态之力,促进人工智能产业繁荣发展。

151919a7c4fddf3e7f51a537e4b3a806.jpeg

飞桨硬件生态共创计划,犹如一场AI产业界的盛大狂欢,让国内外的硬件厂商们齐心协力,共同打造一个软硬协同的全栈式人工智能平台。这个生态计划不仅有利于解决硬件厂商在AI框架适配上的实际需求和硬件市场份额提升,还可以为企业和开发者提供更高效、稳定、可靠的一站式AI服务,进而为下游的AI应用生态的爆发提供坚实、稳定、高效的生产力后盾。

这项计划不仅有助于解决各大硬件厂商在适配AI框架时可能面临的技术和投资失误问题,而且将大大提升人工智能产业链的协同效率,最终这份效率提升会传导至消费端,进而创造巨大的社会和经济价值。

据笔者了解,这个计划已经产生了许多突破性的成就:已经有超过40家硬件厂商与飞桨深度融合优化,29家企业成为了这项计划的核心成员,其中有13家已经推出飞桨生态发行版。

从2020年到现在,飞桨与硬件伙伴合作已经经历了“共聚”、“共研”、“共创”三个阶段。从开始的解决成本收益权衡和如何共建生态的问题,到后续解决厂商软件栈不统一引发的适配难度和接入成本问题,再到去年与硬件伙伴联合推出飞桨生态发行版,共建模型库,实现生态繁荣共赢,可以说每一步都挑战重重,但最终的结果都是硕果累累。

769c6c6a9fcbac753bbeeb01d20b956b.png

在这个发展过程中,飞桨与众多硬件厂商如NVIDIA、Intel、瑞芯微、Arm、Imagination、昆仑芯等紧密合作,通过技术的联合研发和生态共建,不断取得突破,共同推动了人工智能产业链的高质量发展。

以百度飞桨与NVIDIA围绕硬件生态展开的合作举例

一方面,作为全球领先的GPU硬件厂商,NVIDIA持续为飞桨的开发者做训练推理优化——比如在数据处理方面,NVIDIA帮助飞桨集成 DALI;在大规模训练方面,支持各类数据和ASP、CUDA等算子函数API;在优化推理方面,开发了Paddle-TRT,Deep Learning Examples;在规模部署方面,集成了NCCL,开发了Triton PaddlePaddle Backend等。

另一方面,其与飞桨经常与开发者交流,进而发现生态共建过程中暴露的问题。

比如在一次交流中,就发现了飞桨用户遭遇的一个痛点——如果用户希望使用 NVIDIA 最新软件栈进行开发、训练、部署,那就需要做大量的手动配置工作,这对不少用户而言是一个巨大的工程挑战。

受本次交流的启发,NVIDIA便与飞桨联合开发了 NGC飞桨容器(NGC PaddlePaddle Container),其将最新版的飞桨框架与最新的 NVIDIA 的软件栈进行了无缝的集成与性能优化,最大程度地释放飞桨框架在 NVIDIA 最新硬件上的计算能力。

具体来说,这个容器,不仅能够适应各种硬件环境,从裸机到虚拟机、K8S、X86、ARM、Power、云等等,其广泛的适应性让开发者无惧环境变化。而且,NGC飞桨容器还经过了众多专业团队的优化与调试,进而具备了强大的计算性能,让飞桨平台在NVIDIA最新硬件上能发挥出越来越强大的计算性能。

可以说,NGC飞桨容器充分挖掘了NVIDIA GPU的潜力,为飞桨用户提供了一个“一站式”的AI开发环境,让开发者无需担心硬件兼容性与性能问题。这样,开发者便能更加专注于自己的创意和应用本身,实现性能极致又高效便捷的AI训练推理体验。

目前,NGC飞桨容器已上线到百度飞桨官网和英伟达官网

https://www.paddlepaddle.org.cn/documentation/docs/en/install/install_NGC_PaddlePaddle_ch.html

https://catalog.ngc.nvidia.com/orgs/nvidia/containers/paddlepaddle

除此之外,还不得不提一个工业级的模型库——NVIDIA Deep Learning Examples。

NVIDIA GPU 的开发者能通过这个模型库,快速复现极致精度和高性能的模型。既包括了机器人、数字孪生、金融等行业模型,又包含了ResNet50等学术研究模型。感兴趣的小伙伴可以在如下页面查看

详情:https://developer.nvidia.com/deep-learning-examples

一些畅想

对于不同的硬件厂商和开发者而言,有了飞桨这个强大后盾,他们可以更好地应对市场需求和技术挑战,共创一个应用广泛、性能优越的人工智能平台。飞桨硬件生态共创计划不仅为行业提供了一个全新的发展蓝图,更为整个人工智能产业打开了诸多无限可能。

对于整个人工智能产业链而言,行业效率的提升将大大促进下游应用的爆发,这份价值最终将反馈给全社会。

百度飞桨的硬件生态,或许将成为中国AI行业腾飞的有力基础

abdf3182e37360dbe9746bf1d190307b.jpeg后台回复关键词【入群

加入卖萌屋NLP、CV、搜推广与求职讨论群

5f6a1ef6fd5f45059f041f2060c26d7c.gif

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/72648.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

为什么使用高匿代理IP会被检测出许多问题,都有哪些问题呢?

现如今关于代理IP的相关种类和分类当中,高匿代理IP经常被使用,因为这种代理IP能够很好的解决大数据当中的信息抓取问题,不过在信息抓取的时候,并不是所有的高匿代理IP都非常好用,有一些平台服务商如果是小型的话&#…

解决同一个局域网两个DHCP冲突问题--涉及到局域网IP扫描,主机操作系统扫描,mac地址查询

最近这几天我们大优能公司的网络(网段为10.0.0.1/24)总是出问题,常有一部分机器获取到192.168.1.0/24网段的IP和DNS,这部分机器无法上网且邮箱均不能用。公司同事囧的不成样子,不断有同事说“难道咱公司的网络被黑了&a…

IP冲突解决办法

1.用ssh/console登入核心交换机(10.10.11.1) 2.查看arp冲突 dis arp ip-conflict track 冲突ip地址:10.10.26.29 冲突mac1:2452-6aea-a1b9 冲突mac2:2452-6adc-039d 3.通过冲突ip查看下联口 dis arp network x.x.x…

如果精确判断一个IP是否被占用

如果精确判断一个IP是否被占用 我们在局域网经常需要去测试一个IP是否在用,通过使用ping命令去测试网络通还是不通,但这种方法不是很精确。 我在cnaaa.com上购买了云服务器。 原因是 ping 命令使用的是 ICMP 协议(Internet Control Messag…

win10设置pin一直转圈_win10系统pin码无法使用的解决方案

win10系统pin码无法使用的解决方案,win10系统想要使用windows hello功能,就要先设置pin码,当你遇到pin码无法使用的问题时,可参照以下的方法进行解决。 有很多用户在使用win10系统的时候,想要使用windows hello功能&am…

OFFICE登录不上,一直转圈

首先打开控制面板,左上角查看方式选择小图标,点击网络和共享中心 点击连接的网络,打开后点击属性, 双击Internet版本协议4 ,将DNS服务器地址改为4.2.2.1或者4.2.2.2

outlook打不开一直转圈怎么办

1.打开 office 文档(表格或文档),选文件,找到选项菜单。 2.取消勾选“硬件图形加速”,保存设置,重启电脑设置生效。Outlook即可恢复正常打开。

centos7进系统图形化一直转圈或命令行提示starting switch root 处理方法

文章目录 说明测试解决方法 说明 测试系统:rhel7.3 , 该方法通用与centos和红帽。 原因,开机进不去系统,一直转圈,如下图 命令模式提示:starting switch root(忘截图) 测试 重启…

智能对话 | 使用 Java实现 智能对话机器人

人工智能 目前人工智能与深度学习顺应了互联网时代潮流,人机对话已经成为目前人工智能领域中非常热门的处理技术。其中基于深度学习的人机对话交换系统(智能机器人)是人工智能最有潜力的领域,甚至被称作人工智能的皇冠。相对于传…

如何用Java实现智能对话机器人

如何用Java实现智能对话机器人 前言 这个时代人工智能如此火爆,身为圈内人我们应该多少对他有些了解,为了靠他近一些今天我们动手用Java实现一个智能聊天机器人,当然此处我们需要依赖图灵机器人的Api 点我进入图灵机器人官网注册帐号 这篇博…

智能对话机器人开发实战案例剖析(2)

一、前言 本文是《智能对话机器人开发实战案例剖析》系列的第2篇:智能对话机器人分类标准,旨在对智能对话系统的进行一个系统性的介绍。相关内容已同步录制成视频课程,发布在网易云课堂。 二、正文 2.1 分类标准 2.2 闲聊型智能问答机器人…

智能对话机器人实战开发(1)- 体系结构和分类

一、前言 人工智能时代,以智能对话机器人为最核心的技术应用方向之一,实现人机之间通过自然语言的沟通和交流,是智能人机对话机器人的核心目标之一。尤其是Google Assistant 语音助手近期的卓越表现,如何开发智能对话机器人系统&…

智能对话机器人开发实战案例剖析(3)

一、前言 本文是《智能对话机器人开发实战案例剖析》系列的第3篇:智能对话机器人典型案例,旨在对智能对话系统的进行一个系统性的介绍。相关内容已同步录制成视频课程,发布在CSDN学院。 二、正文 2.1 国内外主要智能音箱产品 2.2 智能音箱…

数据可视化工具是什么

智能手机的普及,互联网使用的增长,机器学习的快速发展,以及云计算技术和物联网的不断采用,都在推动全球数据可视化市场。此外,对智能工厂的日益倾向,以及视觉分析、信息可视化和科学可视化在小型和大型组织…

如何进行数据可视化图表设计?

如何进行数据可视化图表设计? 对数据人来说,数据可视化是分析理解数据,并最终呈现数据的必修课。本文从以下几个点来说明,如何进行数据可视化图表设计。1、数据背后的故事2、充分理解数据3、多种图表类型设计指南 1数据背后的故…

优秀的数据可视化,原来是这样做的!

大数据时代,数据驱动决策。处理不好庞大、复杂的数据,其价值将大打折扣。 可以想象一本没有图片的教科书。没有图表、图形或是带有箭头和标签的插图或流程图,那么这门学科将变得更加难以理解。人类天生就是视觉动物,而视觉效果对于…

数据可视化是什么,数据可视化怎么做最好?

数据可视化都有一个共同的目的,那就是准确而高效、精简而全面地传递信息和知识。可视化能将不可见的数据现象转化为可见的图形符号,能将错综复杂、看起来没法解释和关联的数据,建立起联系和关联,发现规律和特征,获得更…

如何完美实现数据可视化?

为什么要可视化数据? 在工作中,无论你在哪个场景,你都会接触到数据,需要表达出来。数据可视化的作用是通过结合图表和数据来更好地传达业务信息。目前,大多数公司正在逐步从传统的流程管理过渡到基于数据的管理。数据可视化可以…

为什么会看到IP地址相同的两台电脑?附查询自己公网IP的方法

为什么会看到IP地址相同的两台电脑? 我们会询问这个问题的原因是因为我们经常看到在两个不同的地方可以配置相同的类似于192.168.xxx.xxx的IP地址,或者在实验室机房里可以随意配置类似于192.168.xxx.xxx的IP地址,这时我们就会产生疑问了&…

今天排查一个网关IP冲突的问题

问题概述:近几天,无线wifi发现总是出现随机断网,ping包外网发现不定时的丢包十几个,后排查是不是DNS出现了问题,经查外线不通时ping网关也能通,其实这是一种假像,当我打开网关的web地址时&#…