浪潮发布推理加速存储AS3000G7:“以存代算”节省算力

08-01 06:54

快科技7月31日消息,据媒体报道,2025(第二届)产融合作大会在北京举行。会上,浪潮存储重磅推出推理加速存储产品AS3000G7,该产品旨在解决大模型推理中因KV Cache重复计算造成的算力浪费和时延问题,为金融、科研等领域的模型规模化落地提供关键支持。


目前,大模型推理严重依赖昂贵的GPU服务器,其利用效率直接影响着模型从‘实验室’走向‘生产线’的进程。


同时,IDC预测,未来五年智能算力规模将增长1.7倍,到2027年,推理工作负载占比将超70%,提升GPU利用效率的需求愈发紧迫。


浪潮存储AS3000G7创新性地提出‘以存代算’方案,该产品可集中存储所有KV Cache及多轮对话结果。


其架构能将KV Cache从GPU本机内存,通过高速网络缓存至AS3000G7。在后续对话中,系统可按需直接提取缓存,避免了重复计算。


这一突破性设计大幅节省了算力消耗,提高了宝贵的GPU资源利用率,推动了大模型在实际场景中的高效应用。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com