超越CUDA的软件生态,究竟有多难?

06-21 14:42

电子爱好者网报道(文章 / 周凯扬)近日,英伟达正式超越微软,成为全球市值最高的企业,股价持续上涨,这当然离不开微软。 GPU 这一 AI 硬件之所以火爆,是因为它能一举成为世界第一,也离不开软件的支持。真正把它推向神坛的,还是围绕着它。 CUDA 创建一系列软件生态系统。


英伟达—— CUDA 的绝对统治


相信对 GPU 有一定了解的人都知道,英伟达最大的环城河就是 CUDA。CUDA 随着后端架构处于绝对统治地位, AI 发展得越快,英伟达 GPU CUDA 研究与开发的生态发展日益壮大,甚至达到了很多竞争对手期待的水平。CUDA 自 2006 自2008年推出以来,即使在 AI 与深度学习并未成为主流阶段,也在不断发展并行计算,为开发者提供丰富的库、工具算法。


时至今日,CUDA 它为世界开发者创造了一个巨大的社区,包括大多数深度学习框架, TensorFlow、Pytorch 等都对 CUDA 进行改进。为迅速进入市场,大多数开发者更倾向于选择 CUDA 作为主要的计算平台。


同时,英伟达也围绕着英伟达。 CUDA 通过更先进的工艺和封装技术,对硬件架构进行更深入的创新和优化,提高计算性能和效率。例如, Volta 架构中引入 Tensor 英伟达是核心之后 GPU 矩阵运算得到了很大的加强,深度学习训练和推理的性能也取得了飞跃。两者的结合促进了 CUDA 坐在第一个宝座上。


英伟达的游戏软件领域 DLSS 可说是市场上最先进的专有超分技术,而且归功于持续的训练,每一次版本更新都能带来图形渲染领域的突破。


最终,在与生产力工具相关的软件生态方面,英伟达在这一块的优势更加充分,过去苹果和苹果 AMD 仍在 GPU 在合作的时候,很多生产力工具还是针对的。 AMD 的 GPU 做了很多硬件优化。然而,随着苹果的发展 Arm 结构,英伟达在这一行业中逐渐壮大。


无论是 Adobe 旗下的多媒体处理软件,或者是一些独立开发商打造的软件,许多都有英伟达 CUDA 对硬件加速的支持,即使是英特尔的核显在某些软件支持方面,也要好于 AMD。正因为如此,除了一些与特效制作相关的工作外,工作站内的工作 AMD GPU 越来越少。


尽管谷歌、英特尔和高通等科技巨头也在寻找打破 CUDA 垄断地位的机会,但对于软件生态来说,合作并不一定意味着双赢,最终很可能只是为市场提供更多的选择,但在便利性和性能方面,还不如不停留一路奔跑。 CUDA。


AMD


AMD 对其 GPU 软体生态态度较为开放,对开源开发社区的重视程度极高。AMD 的 ROCm 正是英伟达的对标 CUDA,但是它对硬件没有限制,除了 Radeon、Instinct 系列 GPU 另外,设备也在扩展到其它硬件制造商。这也得益于 AMD 不能在硬件中引入 Tensor 像核心这样的专有硬件,但也正是因为如此, ROCm 有些任务稍逊一筹。


ROCm 作为一个开源平台,它还提供了多种库和框架的支持,以及一套完整的开源工具链。就是这样, HPC 在云计算等领域,厂商实际上更愿意使用。 AMD 的 GPU,没有必要忍受英伟达的专用软件栈。然而,由于英伟达的先行软件生态,他们不得不首选英伟达的软件。 GPU。


AMD 就算有了 ROCm,整个软件生态系统的成熟度仍然不如英伟达, HPC 这些项目中有一部分不是为了商业成功而设计的,AMD 已获得许多份额,例如, TOP500 前十名的多台超算。但以整个 TOP500 从名单上看,英伟达仍然占据主导地位。然而,对于云供应商来说,英伟达的统治在短时间内仍然无法摆脱。因为租用这些云服务的客户更愿意在英伟达。 CUDA 开发平台。


尤其是对于驱动软件, Linux 显卡驱动,AMD 采用开源和闭源两条路线,在不断更新闭源驱动的同时,也允许开源社区定制开源驱动。以基于 Linux 系统内 AMD Radeon 显卡打造的 Vulkan 驱动 AMDVLK 举例来说,它支持光跟踪。但是,开源驱动虽然因为手动设备和社区贡献而具有更高的兼容性,但如果追求更高的性能,那么闭源驱动仍然更有优势。


摩尔线程


国产 GPU 主要分为两个方向,即支持图形渲染和不支持图形渲染。后者仍然希望 AI 前者正在推动领域内的突破。 C 在终端产品的同时,也在布局上 B 端一系列 AI GPU 商品。国产产品 GPU 在产品中,摩尔线程在软件生态方面做得更好,他们在软件生态方面做得更好。 AI 以及图形渲染软件支持都有喜人的进步。


基于 MUSA 摩尔线程建立了这种统一的结构。 MTT S80 这种桌面显卡,以及面向服务器的应用 MTT S3000 等等。与之相匹配的是摩尔线程打造的软件开发平台,包括 AI 开发平台、MUSA SDK、MT Smart Media 和 MTVerse XR 等。


而且在摩尔线程打造的这种生态结构中,可以充分适应当前的软件生态,借助于当前的软件生态 MUSIFY 实现代码零成本转移的工具 MUSA 平台。与 AMD 的 ROCm 一样,MUSA 做同样的事情也是适应 CUDA 路线,而非形象 ZLUDA 同样重新编译二进制代码,因此不违反英伟达的代码。 EULA 条款。


根据摩尔线程最近官方发布的消息,他们 AI 在此基础上,选择了逐步完成大型模型适应支持的路线。他们已经完成了摩尔线程的夸娥千卡智算集群。 30 亿到 700 大模型训练和推理适配亿参数。摩尔线程的 GPU 与国际大厂相比,计算能力还是略逊一筹,但随着未来的发展, IP、在硬件开发方面取得了进一步的突破,我相信他们也可以创造出高性能。 AI 算率底座。


摩尔线程也在不断更新和提高消费级图形显卡的驱动软件的性能。以 5 月底发布的 v260.70 以版本驱动为例,除提供对比外 OpenGL 4.0 支持和改进功能 Blender 3.6 LTS 除了感觉之外,还有很多热门游戏。 DirectX 11 下层性能得到了显著提高。尽管与英伟达相比,这一驱动更新规模仍有差距,但也代表了厂商不断优化性能的决心。


写在最后


事实上,越来越多的制造商进军 GPU,越来越多的 GPU 厂商使力 AI 可以看出,即使是 CUDA 有着深厚的生态积累,但日新月异。 AI 其它厂商仍然有机会分一杯羹,甚至可能在某一应用程序中后来者居上。但是,在图形渲染相关软件生态方面,厂商面临着较厚的技术壁垒。不但要有钻研十几年的决心,还要继续打磨硬件产品,与工业软件生态系统合作,挖掘和培养更多的图形研究人才。


阅读更多热门文章


加关注 星标我们


把我们设为星标,不要错过每一次更新!


喜欢就奖励一个“在看”!


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com