国内首个开放架构AI超集群系统发布
【导语】9月5日,中科曙光在2025世界智能产业博览会上发布国内首个基于AI计算开放架构设计的曙光AI超集群系统,该系统以GPU为核心,具备“超高性能、超高效率、超高可靠、全面开放”四大特点,可应对多种AI场景算力需求,还通过开放设计降低成本、保护投资,中科曙光也将开放多项技术能力助力合作。
9月5日,中科曙光在2025世界智能产业博览会上发布了国内首个基于AI计算开放架构设计的产品——曙光AI超集群系统。

记者在现场了解到,这一AI超集群系统以GPU为核心,实现了“算、存、网、电、冷、管、软”一体化紧耦合设计,具备“超(chāo)高(gāo)性(xìng)能(néng)、超(chāo)高(gāo)效(xiào)率(lǜ)、超(chāo)高(gāo)可(kě)靠(kào)、全面(miàn)开(kāi)放(fàng)”四(sì)大(dà)特(tè)点(diǎn),可(kě)为(wèi)万(wàn)亿(yì)参(cān)数(shù)大(dà)模(mó)型(xíng)训(xun)练(liàn)推(tuī)理(lǐ)、行(xíng)业(yè)大(dà)模(mó)型(xíng)微(wēi)调(diào)、多(duō)模(mó)态(tài)大(dà)模(mó)型(xíng)开(kāi)发(fā)、AI4S等(děng)场(chǎng)景(jǐng)提(tí)供(gōng)高(gāo)效(xiào)算力底座。
据介绍,曙光AI超集群系统具有高性能、高效率、高可靠、全面开放的技术特点。比如,在性能方面,单机柜可搭载96张GPU卡、算力规模达百P级、访存总带宽超180TB/s,支持多精度、混合精度运算以及百万卡超大集群扩展;效率方面,千(qiān)卡(kǎ)集群(qún)大(dà)模(mó)型训练推理性能达到业界主流水平2.3倍,开发效率提升4倍。
当前,伴随AI大模型快速演进以及全球IT产业生态体系调整,国内AI算力领域面临高端算力供给不足、国产加速卡性能差距大、算力成本高、自主软硬件生态不成熟等挑战。而发展更大规模、更高效智算集群来弥补国产单卡算力差距以突破算力瓶颈,打造开放式、标准化、高效率的算力集群,以实现智算集群的易用与可控成本,正逐渐成为业界共识。
值得关注的是,相比封闭系统,曙光AI超集群系统不仅通过紧耦合设计像一台计算机般高效工作,还支持多品牌AI加速卡以及兼容主流软件生态,为用户提供更多开放性选择,并降低硬件成本和软件开发适配成本,保护前期投资。
中科曙光总裁助理、智能计算产品事业部总经理杜夏威表示,克服国内AI算力多维挑战,需汇聚芯片、计算系统、大模型等产业链多方力量,构建开放AI计算架构并拉通产业间跨层协作,以打破“技术墙”与“生态墙”。据他透露,依托AI超集群系统,中科曙光将开放AI存储优化能力、液冷基础设施设计规范、DeepAI基础软件栈等三(sān)项(xiàng)技(jì)术(shù)能(néng)力(lì),助(zhù)力(lì)合(hé)作(zuò)伙(huǒ)伴(bàn)、重(zhòng)点(diǎn)用(yòng)户(hù)在(zài)AI应(yīng)用(yòng)存(cún)储(chǔ)性(xìng)能(néng)加(jiā)速(sù)、液(yè)冷(lěng)超(chāo)节(jié)点(diǎn)系(xì)统(tǒng)设(shè)计(jì)、GPU开(kāi)发(fā)统(tǒng)一(yī)开(kāi)发框架等方面获得高级别技术共享、深度定制优化与专业技术支持。




