在近日举行的华为中国合作伙伴大会2026上,华为正式发布并展示了搭载全新昇腾950PR(Ascend 950PR)处理器的AI训练推理加速卡——Atlas 350,标志着昇腾950代际推理算力正式迈入商用阶段。

发布会上,昆仑、华鲲振宇、神州鲲泰、长江计算、宝德、软通华方、百信等七家华为核心伙伴同步推出了基于Atlas 350的服务器整机产品。其中,软通动力旗下软通华方发布的“超强A860 A5”AI服务器,搭载鲲鹏920新型号处理器,可支持8块Atlas 350加速卡。软通动力计算产品事业群企业级产品研发管理本部总经理邓忠良将其形容为赋能大模型时代的“核武级”算力。

科大讯飞集团副总裁、星火企业军团总裁刘江在会上表示,讯飞新一代星火大模型将与昇腾910/950系列算力底座深度适配,共同打造“懂行业、能干活、守规矩、会进化”的行业AI解决方案。

作为华为AI算力战略的核心,昇腾芯片历经多代演进。2018年,华为发布首款昇腾310芯片;2019年推出昇腾910芯片;2025年,随着Atlas 900超节点大规模部署,昇腾910C逐渐进入公众视野。去年9月,华为副董事长、轮值董事长徐直军首次披露昇腾950系列芯片,并明确昇腾950PR将于2026年第一季度推出。此次Atlas 350的亮相,正是这一规划的如期落地。

与前代产品相比,昇腾950PR在低精度数据格式、向量算力、互联带宽及自研HBM等方面均有显著提升。据华为昇腾计算业务总裁张迪煊介绍,Atlas 350单卡算力达到英伟达H20的2.87倍,是目前国内唯一支持FP4低精度的推理产品;HBM容量达112GB,为H20的1.16倍,多模态生成速度提升60%;内存访问颗粒度由512字节降至128字节,小算子访存效率提升4倍。

展会现场展示的参数显示,Atlas 350的FP4精度算力达1.56P,带宽为1.4TB/s,功耗600W。工作人员表示,该卡除支持FP16、FP8外,对FP4的支持使其在推荐系统等场景中具备更低时延和更高响应速度,尤其适合短视频、电商、广告等高并发场景,在多模态任务中性能与英伟达L20相当。

张迪煊进一步指出,基于Atlas 350等产品,昇腾将围绕大、中、小三大核心算力场景,助力伙伴满足差异化需求:面向万亿级模型,昇腾384超节点通过超大带宽、超低时延和统一内存编址,实现有效算力线性扩展;面向千亿级模型,提供开箱即用的单机服务器,兼顾快速部署与成本控制;面向百亿级模型,开放更多算力档位、高集成度模组及丰富SDK,赋能伙伴打造多样化产品。

会上,昇腾联合20家行业头部伙伴发布2026年AI应用场景解决方案,覆盖辅助办公、AI实训、电子病历、智能客服、政务办公等核心场景,主打轻量部署、快速落地与可规模复制。

此外,随着“养虾”热潮带动一体机需求增长,华为副总裁、ICT产品组合管理与解决方案部总裁马海旭透露,过去一个多月已有十余家合作伙伴推出基于昇腾的OpenClaw一体机。截至目前,昇腾已联合伙伴打造400余款行业一体机,服务客户超2700家,占据国内一体机市场80%以上份额。

更多推荐