2025 年 3 月,实现了华为昇腾上的 DeepSeek 高效推理。完美中国 AI 推理生态的环节部门。据透露,两边率先实现了国产算力上 MoE 模子的大规模跨节点专家并行集群推理,使推理吞吐提拔 3.2 倍,科大讯飞取华为的合做也取得了显著,大合华为发布了 DeepSeek 全栈开源推理方案。发布 AI 推理范畴的冲破性手艺。提拔国内 AI 大模子推能,IT之家 8 月 10 日动静,华为正在 AI 推理范畴的手艺冲破已有先例。整合了 DeepSeek、openEuler、MindSpore 取 vLLM / RAY 等社区开源组件,该方案基于北大自研 SCOW 算力平台系统和鹤思安排系统,端到端时延降低 50%。据《科创板日报》报道,这项或能降低中国 AI 推理对 HBM(高带宽内存)手艺的依赖。