中国联通发布超1500公里跨域大模型异构混训成果
IT之家7月20日消息,在2025中国联通合作伙伴大会期间,中国联通研究院联合上海人工智能实验室等合作伙伴,于7月19日正式发布了全球最长距离大模型异构混训试验成果。

随着人工智能技术快速发展和大模型时代加速到来,模型训练对算力基础设施的高吞吐、低时延、高性能有了更高要求。但当前算力资源呈现异构化和多中心化格局,面临跨域资源互联互通机制不完善、长距离传输存在带宽和时延瓶颈、异构资源统一调度与高效融合能力有限等挑战。
在此情况下,中国联通联合上海人工智能实验室、阿里云、浪潮、基流科技、加佳科技等行业伙伴,面向国产异构GPU环境,针对超大模型跨域训练和碎片化算力整合需求,依托“算力智联网AINet”长距无损传输技术优势,结合上海人工智能实验室“DeepLink”超大规模跨域混训技术方案,在上海临港和山东济南鲍山数据中心间构建了长度超1500公里的跨域异构混训系统。
IT之家从大会了解到,联合团队通过自动调整多种并行策略和跨域收敛比下MoE模型和Dense模型的参数配置,完成了超1500公里跨域的千亿参数AI大模型异构混训试验,经验证等效算力可达单芯片单集群等效算力的95%以上。
在算力互联方面,采用联通自研内置长距RDMA协议栈的RoCE交换机,满足DC内和DC间高性能网络需求;
在算力调度与资源管理方面,通过联通“智驭”平台实现对跨域网络和集群的统一管控及任务调度;
在算力协同方面,基于DeepLink在训练加速、异构通信、并行策略等核心技术,实现千亿参数大模型在超长距离异构GPU环境下的高效训练。

中国联通表示,上述成果标志着其在算力基础设施跨域协同调度、异构资源融合与高性能分布式训练等关键领域实现了实质性技术突破,为下一代互联网产业发展奠定了基础。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com




