英伟达终于开源GPU内核模块代码

作者 | 钰莹,核子可乐

内容来源:infoq

近日,英伟达(NVIDIA)宣布,将 Linux GPU 内核模块作为开放源代码发布。早在几天前,NVIDIA 开始在 GitHub 上陆续公开相关代码,目前该项目已经收获 7.7k star,众多网友对本次开源纷纷表示难以置信。

英伟达开源 GPU 内核模块代码

本次开源无疑可以帮助改善英伟达 GPU 在 Linux 环境下的体验,与操作系统的紧密集成是帮助开发人员开展调试、集成和贡献回馈的重要一步。这些模块的开源还使得驱动程序在 Linux 发行版供应商手中更加易用。英伟达也改进了开箱即用体验,让用户轻松对英伟达 GPU 驱动程序进行签署与分发。现在,Canonical 和 SUSE 可以即刻将开放内核模块与 Ubuntu 及 SUSE Linux Enterprise Distributions 共同打包。

开发者可以跟进代码路径,查看内核事件调度如何与工作负载进行交互,从而快速开展根源性调试。此外,企业软件开发者现可将驱动程序无缝集成至项目配置的定制化 Linux 内核当中。此番开源举措将帮助英伟达充分吸纳来自 Linux 最终用户社区的意见和评论,进而提升 GPU 驱动程序的质量和安全性。

每次发布新驱动,英伟达都会在 NVIDIA/open-gpu-kernel-modules 页面上发布源代码快照。社区提交的补丁一旦经过审核批准,即可被集成到后续驱动程序版本当中。

关于更多详细信息,请参阅英伟达贡献指南(https://github.com/NVIDIA/open-gpu-kernel-modules/blob/main/README.md)与驱动程序发布节奏与周期(https://docs.nvidia.com/datacenter/tesla/drivers/index.html#lifecycle)说明文档。

支持的功能

作为首个开放 GPU 内核模块版本的 R515 不仅包含源代码,同时也提供驱动程序的完整构建与打包版本。

对于英伟达 Turing 和 Ampere 架构家族中的数据中心用 GPU 产品,此版本代码可用于生产支持。英伟达专注于测试各类工作负载,确保开源版本与专有内核模式驱动程序具备相同的功能和性能。

未来,HMM 等功能也将成为英伟达 Hopper 架构上实现机密计算的基础组件。这个开源版本对 GeForce 和 Workstation GPU 的支持度已经很高。GeForce 和 Workstation 用户可以在英伟达 Turing 和 Ampere 架构 GPU 上使用此驱动来运行 Linux 桌面,并在 Vulkan 和英伟达 Optix 中实现多屏显示、G-SYNC 和英伟达 RTX 光线追踪等功能。

开发者也可以选择将内核模块参数设置为 NVreg_OpenRmEnableUnsupportedGpus=1。在后续版本中,英伟达还将提供更加强大、功能齐备的 GeForce 与 Workstation 支持,最终推动英伟达开放内核模块全面取代闭源驱动程序。

拥有英伟达 Turing 和 Ampere 架构 GPU 的客户可以具体选择要安装的模块。对于 Turing 之前产品的用户,将继续使用闭源模块。

开源内核模式驱动程序继续沿用相同的固件和用户模式堆栈,包括 CUDA、OpenGL 和 Vulkan,但驱动程序中的所有组件必须与发行版中的版本相匹配。例如,用户不能使用来自更早或更新版本中的用户模式堆栈,发布、构建或运行当前版本中的源代码。

关于如何安装正确版本的更多信息及其他故障排查步骤,请参阅驱动程序自述文件(http://us.download.nvidia.com/XFree86/Linux-x86_64/515.43.04/README/kernel_open.html)。

安装选择

R515 版本包含闭源驱动程序和开源内核模块的预编译版本。这些版本间彼此互斥,需要在安装过程中做出选择。与英伟达 Turing+ GPU 相比,默认选项提供的静默安装能够为英伟达 Volta 及其他较早 GPU 提供最佳路径。可以根据源代码构建内核模块,并配合相关用户模式驱动进行安装。

图片图一:启用 GPU 内核模块和闭源模块默认路径的安装选项

上游方法

多年以来,英伟达 GPU 驱动程序在设计上一直强调跨操作系统、跨 GPU 和跨 Jetson SOC 实现代码共享,以确保能够在全部受支持的平台上提供一致的体验。但当前代码库并不符合 Linux 内核设计约定,因此并未成为 Linux 上游社区的备选方法。

但我们已经在积极筹划,希望与 Linux 内核社区及合作伙伴(包括 Canonical、Red Hat 和 SUSE)合作开发上游方法。

与此同时,已发布的这部分源代码也可作为参考,帮助改进 Nouveau 驱动程序。Nouveau 与此次开源的驱动程序共享相同固件,因此公开的多项 GPU 功能,包括时钟管理与热量管理也将为 Nouveau 驱动带来更多新功能。也欢迎大家继续关注 GitHub 上的后续驱动发布与协作进展。

常见问题

哪里可以下载 R515 驱动程序?

开发者可以在 CUDA Toolkit 11.7 中下载 R515 开发驱动,或者在“Beta”驱动程序中的驱动下载页面(https://www.nvidia.com/en-us/drivers/unix/)处下载。R515 数据中心版驱动程序将根据英伟达的发布节奏,在后续版本中与大家见面。

开放 GPU 内核模块本身能否二次分发?

可以,英伟达开放内核模块遵循 GPL/MIT 双许可,许可条款允许二次分发和打包。

英伟达是否会开放其他用户模式驱动程序(例如 CUDA)?

此次变更主要针对内核模块,用户模式组件将保持不变。用户模式继续保持闭源形式,并将与驱动程序和 CUDA 工具包内的预构建二进制文件一同发布。

开放 GPU 内核模块支持哪些 GPU?

开放内核模块支持所有英伟达 Ampere 及 Turing 架构 GPU。数据中心 GPU 将获得生产级支持,GeForce 和 Workstation GPU 则为高质量支持。关于更多详细信息,请参阅数据中心、英伟达 RTX 与 GeForce CUDA GPU 产品表(https://developer.nvidia.com/cuda-gpus)。可以看到,英伟达 Turing 及更新 GPU 的算力评分均为 7.5 及以上。

如何上报 bug?

开发者可以通过 GitHub repo 问题跟踪器(https://github.com/NVIDIA/open-gpu-kernel-modules/issues)或我们的最终用户支持论坛(https://forums.developer.nvidia.com/c/gpu-graphics/linux/148)上报问题。另外,安全问题请通过 GitHub repo 安全政策(https://github.com/NVIDIA/open-gpu-kernel-modules/security/policy)中列出的渠道进行上报。

如何提交补丁?补丁 SLA/CLA 流程是怎样的?

欢迎社区通过 PR 请求在 GitHub 页面上提交补丁。提交的补丁将在审查核准后,与其他修改成果一道被集成到后续驱动程序版本当中。关于更多详细信息,请参阅英伟达驱动程序生命周期(https://docs.nvidia.com/datacenter/tesla/drivers/index.html#lifecycle)文档。

这里发布的源代码是根据共享代码库生成的快照,因此各项贡献可能不会在 GitHub repo 中体现为单独的 Git 提交。英伟达正在规划社区贡献认可流程。出于同样的理由,建议各位贡献者不要对代码进行重大格式调整。

提交 PR 请求的流程请参阅 NVIDIA/open-gpu-kernel-modules GitHub 页面,贡献规则请参阅贡献者许可协议(https://cla-assistant.io/NVIDIA/open-gpu-kernel-modules)。关于更多信息,请参阅开放 GPU 内核模块 NVIDIA/open-gpu-kernel-modules GitHub 页面。

博客地址:

https://developer.nvidia.com/blog/nvidia-releases-open-source-gpu-kernel-modules/

项目地址:

https://github.com/NVIDIA/open-gpu-kernel-modules

开源的重要意义

在英伟达宣布开源后不久,Red Hat 的桌面高级经理 Christian F.K. Schaller 发表了篇题为《Why is the open source driver release from NVidia so important for Linux?》的文章表示,这次开源意味着英伟达已经发布了一个能够使用 Linux 内核中 GPL-only API 的内核驱动程序,尽管这个初始版本不使用旧驱动程序未使用的任何 API。该驱动程序还仅支持 NVidia Turing 芯片 GPU 及之后的更新版本,这意味着它不能用于 2018 年之前的 GPU。因此,对于大多数 Linux 桌面用户来说,并不是立即可用。

博客地址:

https://blogs.gnome.org/uraeus/2022/05/11/why-is-the-open-source-driver-release-from-nvidia-so-important-for-linux/

对于开源社区来说,这意味着我们将有一个内核驱动程序和固件,允许改变 GPU 时钟,以提供研究者期望从英伟达显卡获得的性能;我们将拥有一个开源驱动程序,可以访问新一代英伟达硬件固件和内核更新;可以开始使用 Linux 内核中的 GPL-only API。

Canonical 公司芯片联盟副总裁 Cindy Goldberg 评论道,“新的英伟达开源 GPU 内核模块在简化安装流程之余,也提升了 Ubuntu 用户的安全保障水平。无论您是 AI/ML 开发者、游戏玩家还是云用户,都能够从中受益。作为最受开发者欢迎的 Linux 类操作系统 Ubuntu 的开发商,我们现在能够立足 Ubuntu 与英伟达 GPU 实现紧密集成,为 AI 和 ML 等前沿领域的开发人员提供更好的支持。”在未来几个月内,英伟达开放 GPU 内核模块将正式登陆刚刚推出的 Canonical Ubuntu 22.04 LTS。

SUSESUSE 公司业务关键 Linux 总经理 Markus Noga 指出,“我们 SUSE 高兴地看到,英伟达决定将 GPU 内核模式驱动程序以开源形式发布。这是开源社区与加速计算领域的真正里程碑。SUSE 有幸通过今年 6 月的 SUSE Linux Enterprise 15 SP4,成为首个引入这一突破性成果的主要 Linux 发行版。英伟达与 SUSE 将凭借安全的软件供应链和卓越的技术支持,共同满足用户跨云、数据中心及边缘等位置的 GPU 加速计算需求。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/36139.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2002年3月英伟达发布核弹GPU与大算力自动驾驶芯片

2002年3月英伟达发布核弹GPU与大算力自动驾驶芯片 英伟达核弹级GPU:800亿晶体管,20块承载全球互联网流量 2022年3 月 22 日,在英伟达 GTC2022 上,英伟达介绍了 Hopper 架构、H100 GPU、元宇宙、新型超级计算机、软件、数据中心等方…

最近火爆的英伟达数据中心GPU所有型号及参数汇总,含售价

关注、星标公众号,精彩内容每日送达 来源:网络素材 注:英伟达A800是NVIDIA公司生产的显卡,是为了解决美国商务部的半导体出口新规,以取代A100 GPU。 NVIDIA H100 CNX产品规格 ———— / END / ————

从英伟达 vs ATI的芯片大战看GPU前世今生

导读:本文带你回顾从CPU到GPU的历史,再展望从GPU到TPU的未来。 作者:钱纲 来源:大数据DT(ID:hzdashuju) 01 第一代、第二代GPU 1998年英伟达宣布GPU的研发成功,是计算机显示的历史性…

20 个 GPU 可承载相当于全球互联网流量、Grace CPU 超级芯片现世,英伟达这届 GTC 发布了什么?...

整理 | 苏宓 出品 | CSDN(ID:CSDNnews) 技术的极限在哪里? 想必科技圈给出回答大概率是没有! 这不,在 GTC 2022 Keynote 上,身着黑色夹克「战袍」的黄仁勋挂帅,英伟达带着采用台积电…

随着ChatGPT、文言一心的大火,未来可能的生活工作方式

前面的文章笼统的扯了一些ChatGPT、文言一心的差异化,感觉还是不够明白直观。特地找了一份资料,通过基础能力、进阶能力、和一些垂直领域的几百个各种问题,来对比分析两者的回答情况,让大家可以有个更接地气的了解。 由于问题太多…

chatgpt赋能python:Python是如何实现数据可视化的

Python是如何实现数据可视化的 看到数据可能让人头疼,但它也是条件成熟时必不可少的细节。在这些细节中,数据可视化是一个让人看起来轻松的过程,很多时候这种方法都是为了达到更好的效果。对于数据 Visualization,Python 无疑是一…

chatgpt赋能python:Python画图怎么保存

Python画图怎么保存 Python作为一门高级编程语言,广泛应用于数据分析、机器学习、人工智能等领域。在数据分析这一领域中,数据可视化是非常重要的一环,而Python作为数据分析的利器之一,也有着强大的画图能力。那么,在…

他山之石可以攻玉:解锁9个chatGPT常用姿势

ChatGPT是一个颠覆性的人工智能,可以用来实现众多目标。下面是我们用中文提出的关于这些任务的指令,以及来自ChatGPT的中文回答示例。 调试代码 提示:为什么我的python代码报错:x [2, 3, 8 9]? ChatGPT回答&#x…

JSP实现简易的聊天功能(Session机制)

JSP实现简易的聊天功能&#xff08;Session机制&#xff09; 基于服务器端全局应用空间 application 的简易聊天室实现 1.login.jsp <% page language"java" contentType"text/html; charsetUTF-8"pageEncoding"UTF-8"%> <!DOCTYPE …

在本地使用远程服务器的Jupyter Notebook

问题 python项目含有ipynb文件&#xff0c;用Pycharm打开&#xff0c;提示安装jupyter。于是转到jupyter notebook中运行项目&#xff0c;这就引出了一个问题&#xff0c; 即如何在本地使用远程服务器上的jupyter notebook。  这里提供一种方法。 解决方法 1 在服务器上安装…

硅基罗丹明-小分子聚乙二醇-叠氮 SiR-PEG4-azide

科研实验中大家比较常见硅基罗丹明&#xff0c;对于其性质应用&#xff0c;大家有所了解吗&#xff1f;今天瑞禧小编通过对SiR-PEG4-azide 硅-罗丹明-四聚乙二醇-叠氮来为大家介绍硅基罗丹明的应用。 下面是瑞禧小编整理的SiR-PEG4-azide 硅-罗丹明-四聚乙二醇-叠氮的产品详情&…

硅基罗丹明荧光染料小分子聚乙二醇修饰反式环辛烯SiR-PEG3-TCO

硅基罗丹明-三聚乙二醇-反式环辛烯 SiR-PEG3-TCO 硅基罗丹明SIR(siliconrhodamine)染料是一种深红色近红外荧光染料、细胞渗透性强、高特异性的DNA探针。具有优异光物理性质、良好的生物相容性&#xff0c;在保留了罗丹明荧光染料优越的光学性质的同时&#xff0c;光谱发生明显…

英特尔正式宣布:All in硅基自旋量子比特

&#xff08;图片来源&#xff1a;英特尔&#xff09; 最近&#xff0c;在美国物理学会&#xff08;APS&#xff09;的三月会议上&#xff0c;英特尔不仅介绍了公司最新发表的14篇论文成果&#xff0c;并透露了公司的量子战略计划。 在英特尔看来&#xff0c;实用的量子计算未来…

给小朋友讲故事——科学课,地球,太阳和月亮

在2022年05月19日按照九迁的课程表&#xff0c;给他上了一节科学课&#xff0c;内容是&#xff1a;地球&#xff0c;太阳和月亮。 但是因为当天发生的事情&#xff08;关于校园霸凌&#xff0c;刚刚发生&#xff08;2022年05月20日教育局加三个校长的到来&#xff09;&#xff…

硅基生命之漫谈-4:意识是电流的运动?还是量子的运动?

核磁共振成像是一种利用核磁共振原理的最新医学影像新技术&#xff0c;对脑、甲状腺、肝、胆、脾、肾、胰、肾上腺、子宫、卵巢、前列腺等实质器官以及心脏和大血管有绝佳的诊断功能。与其他辅助检查手段相比&#xff0c;核磁共振具有成像参数多、扫描速度快、组织分辨率高和图…

澳大利亚科学家开发出可用于脑机接口的新型碳基生物传感器

澳大利亚悉尼科技大学的科学家团队开发出一种新型碳基生物传感器&#xff0c;该传感器由外延石墨烯制成&#xff0c;作为一种碳基材料&#xff0c;可以直接种植在硅基碳化物基板上。研究人员将石墨烯的优点&#xff08;生物相容性和导电性&#xff09;与硅技术的优点结合起来&a…

生物计算机的主要原材料是(),新材料为生物计算机打造“神经元”和“突触”...

一项最新研究利用复杂的氧化物&#xff0c;打造出了与神经元和突触相似的元件。 图片来自pixabay.com 虽然电脑的计算速度比人脑快&#xff0c;但在物体识别任务等方面&#xff0c;人脑还是更胜一筹。除此之外&#xff0c;人脑耗费的能量也远低于电脑。大脑的运作方式可以在一定…

SiR-PEG4-NHS ester 硅基罗丹明-四聚乙二醇-活化脂 |SIR荧光探针

SiR-PEG4-NHS ester硅基罗丹明近红外荧光探针 产品英文名称:SiR-PEG4-NHS ester 产品中文名称:硅基罗丹明-四聚乙二醇-琥珀酰亚胺酯 外观:实心 分子式:C42H50N4O10Si 分子量:798.97 储存条件:-20C,在黑暗中 结构式: 相关产品&#xff1a; SDS-AgNCs 水溶性荧光十二烷基磺…

SiR-alkyne/azide 硅基罗丹明-炔基/叠氮 |SIR荧光染料

英文名称&#xff1a;SiR-alkyne 中文名称&#xff1a;硅基罗丹明-炔基 分子式&#xff1a;C30H31N3O3Si 分子量&#xff1a;509.68 纯 度&#xff1a;≥ 95% 存储条件&#xff1a;-20C&#xff0c;避光&#xff0c;避湿 结构式&#xff1a; 相关产品 SiR-alkyne SiR-a…

SiR-BCN 硅基罗丹明-环丙烷环辛炔 | SIR荧光染料

产品英文名称&#xff1a;SiR-BCN 产品中文名称&#xff1a;硅基罗丹明-环丙烷环辛炔 外观&#xff1a;实心 分子式&#xff1a;C44H54N4O7Si 分子量&#xff1a;779.02 储存条件&#xff1a;-20C&#xff0c;在黑暗中 结构式&#xff1a; 我们供应的几类常见的近红外小分…