近日,国家超算互联网核心节点在郑州正式上线试运行,引起业内外广泛关注。尤其该节点首次完成了3套scaleX万卡超集群系统的同步部署,更是让一众央媒发声为其点赞。

图片

根据人民网报道,此次事件包含了中国算力的三重重大突破。首先是国产万卡超集群的集中落地,成功建成3万卡部署、且实际投入运营的最大国产AI算力池。据说,国产超算互联网将以此在中部建成全国最大算力调度枢纽,有效联动中国乃至全球算力资源与应用需求。

事件意义自不必多说,“十五五”规划已经将“全国一体化算力网”,首次纳入国家级基础设施体系,包括“东数西算”工程的战略背书,都让这一算力枢纽含金量暴涨。而scaleX万卡超集群也必然会被当做一个建设样本,在算力组网过程中发挥关键作用。

第二项突破即在于万卡超集群本身。大规模计算集群的技术难度毋庸置疑,据人民网消息,中科曙光是以系统性创新,接连攻克了高速互联网络、存算传紧耦合设计、高密供电与散热、统一资源高效调度等关键技术难题,进而打造出首个基于AI计算开放架构的万卡超集群。

所谓开放架构,代表着scaleX全面兼容CUDA等主流软件生态,支持多品牌国产加速卡混合部署,不仅可以大幅降低开发者迁移适配门槛,更具备向十万卡、百万卡规模的灵活扩展,更好地契合产业规模化发展需求。这在大参数模型时代绝对是战略级“重器”。

第三项突破表现在应用生态层面。据悉,scaleX万卡超集群已完成400多个主流大模型、世界模型的适配优化,依托国家超算互联网可以接入上千款应用,链接更多AI产业生态伙伴,实现“算力+应用”一体化交付,最大程度上解决了算力和场景匹配难的问题。

比如针对超大规模模型训练,scaleX能够支持万亿参数模型的整机训练与容错恢复。面向高通量推理场景,该集群更已服务于多家头部互联网用户的核心智能化业务,通过联合深度优化持续提升推理效能。

另外就是更尖端的AI for Science领域,据说scaleX还帮助国内某材料研发大模型登顶了国际权威榜单,推动国内顶级科研团队将蛋白质研究效率提升了3-6个数量级。搭配OneScience科学大模型一站式开发平台,更进一步降低了多学科交叉研究的创新门槛。

可以看出,三项重大突破都事关国家战略级领域布局。尤其我们现在的国内算力市场,面临着“外部卡脖子、内部低协同”双重困境,国产万卡超集群与超算互联网核心节点共振,显然是冲着关键性难点、堵点去的。未来,这套组合拳的威力可能将远超外界预期。

PS:个人观点、仅供参考,如有收获,别忘了点赞、分享与csva01交流

更多推荐