华为与DeepSeek携手迈进新征程

09-19 06:30

由于国际政治等复杂因素,华为轮值董事长徐直军在发布会上坦言,华为单片芯片的算力表现不及英伟达。不过,他强调华为拥有三十年连接技术的积累,其超节点计算机能够成为世界上算力最强的设备,满足全球在AI训练推理方面的巨大需求。

9月18日,在上海举办的华为全联接大会(HC大会)上,徐直军一开场就提及了年初由DeepSeek引发的全民热潮。

徐直军表示:“从今年春节到4月30日,经过多团队协同努力,昇腾(Ascend)910B/910C的推理能力终于达到了客户的基本要求。”DeepSeek出现后,众多政府机构和央企纷纷接入,作为算力提供商,华为也积极响应跟进。

自2018年首次发布昇腾310芯片、2019年推出昇腾910芯片以来,华为持续投入AI基础算力的研发与创新。尽管DeepSeek开创的模式大幅降低了算力需求,但徐直军认为,算力过去是、未来也仍将是人工智能走向AGI和物理AI的关键要素。

1、华为发布多款芯片产品,规划至2028年

徐直军宣布,华为已为未来规划了三个系列的昇腾芯片,即950、960和970系列

其中,昇腾950系列包含950PR和950DT两颗芯片,950PR将于2026年一季度上市,950DT将于2026年四季度上市。昇腾960芯片预计2027年四季度上市,昇腾970芯片则预计在2028年四季度上市。

华为昇腾芯片发布规划;图片由作者拍摄

与上一代相比,昇腾950在多方面实现了根本性技术提升:新增支持FP8/MXFP8/HIF8、MXFP4等低精度数据格式,算力分别达到1 PFLOPS和2 PFLOPS,显著提高了训练与推理效率;大幅提升向量算力,支持更精细粒度的内存访问;互联带宽提升2.5倍,达到2TB/s;还搭载了自研HBM技术HIBL1.0和HIZQ2.0。

在通算领域,华为规划了鲲鹏950鲲鹏960,分别将于2026年第四季度和2028年第一季度上市,将围绕支持超节点和更多核、更高性能持续发展。

此外,华为正式发布了面向超节点的互联协议——灵衢,并开放灵衢2.0技术规范。自2019年开始研究,灵衢1.0已开启商用验证,此次开放灵衢2.0,旨在邀请产业界基于灵衢研发相关产品和部件,共同构建灵衢开放生态。

2、发布全球最强算力超节点

徐直军在发布会上再次提到,受国际政治等因素影响,华为单片芯片的算力不如英伟达,但凭借三十年的连接技术积累,华为的超节点计算机能成为全球算力最强的设备,满足全球AI训练推理的需求。

超节点(SuperPod)是当前智算发展的重要趋势。徐直军认为,超节点在物理上由多台机器组成,但在逻辑上如同一个整体进行机器学习、思考和推理。

在超节点业务方面,华为发布了Atlas 950 SuperPoD和Atlas 960 SuperPoD。基于昇腾950芯片的Atlas 950超节点支持8192卡规模,由128个计算柜和32个互联柜组成,占地面积约1000平方米,FP8算力达8EFlops,FP4算力达16EFlops,互联带宽高达16 PB,是当前全球互联网总带宽的10倍以上。

华为发布了Atlas 950 SuperPoD展示;图片由作者拍摄

昇腾950超节点将于2026年第四季度上市,徐直军强调,Atlas 950超节点将是2026 - 2028年间全球算力最强的AI超节点

另外的Atlas 960超节点支持15488卡,由176个计算柜和44个互联柜组成,其算力、内存和带宽在Atlas 950基础上再次翻倍,计划于2027年四季度上市。

徐直军特别指出,超节点的价值不仅体现在制造、通信和计算等传统业务领域,在互联网产业广泛应用的推荐系统方面也具有重要作用。华为基于泰山950和Atlas 950可构建混合超节点,为下一代深度推荐系统开创全新的架构方向。

然而,大规模超节点虽然大幅提升了智能计算和通用计算能力,但互联技术仍存在不足。

例如,实现8192卡乃至15488卡规模的可靠互联,是行业亟待解决的技术难题。目前产业界许多已发布的超节点方案无法大规模部署,核心瓶颈并非芯片本身,而是互联技术不成熟,主要体现在两方面挑战:

一是长距离且高可靠的实现难题。大规模超节点机柜众多,柜间联接距离达1000至2000米。当前电互联技术在高速信号传输时距离受限,最多仅支持两个机柜互联;光互联技术虽能满足长距离连接需求,但无法达到单一计算机系统所需的高可靠性。

二是超大带宽与超低时延的实现挑战。当前跨机柜卡间互联带宽与超节点需求存在5倍以上差距,时延最好仅能达到3微秒左右,与Atlas 950/960设计目标仍有24%的差距。在时延已接近物理极限的情况下,每0.1微秒的提升都极具挑战。

华为在超节点层面的技术积累;图片由作者拍摄

针对长距离且高可靠的问题,华为在互联协议的各层都引入了高可靠机制;在光路中引入百纳秒级故障检测和保护切换,使应用在光模块闪断或故障时不受影响;还重新定义和设计了光器件、光模块和互联芯片。这些创新使光互联的可靠性提升100倍,互联距离超过200米,实现了电的可靠和光的距离优势。

为解决大带宽且低时延的问题,华为突破了多端口聚合与高密封装技术,以及平等架构和统一协议,实现了TB级的超大带宽和2.1微秒的超低时延。

徐直军表示:“正是因为一系列系统性、原创性的技术创新,我们才攻克了超节点互联技术,满足了高可靠、全光互联、高带宽、低时延的互联要求,让大规模超节点成为可能。”

本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com