中科曙光发布国内首个开放架构AI超集群系统
【导(dǎo)语(yǔ)】9月(yuè)5日(rì),中(zhōng)科(kē)曙(shǔ)光(guāng)在(zài)2025世(shì)界(jiè)智(zhì)能(néng)产(chǎn)业(yè)博(bó)览(lǎn)会(huì)上(shàng)发(fā)布(bù)国(guó)内(nèi)首(shǒu)个(gè)基(jī)于(yú)AI计(jì)算(suàn)开(kāi)放(fàng)架(jià)构(gòu)设(shè)计(jì)的(de)曙(shǔ)光(guāng)AI超(chāo)集群(qún)系(xì)统(tǒng),该(gāi)系(xì)统(tǒng)以(yǐ)GPU为核心,实现“算、存、网”等多要素一体化紧耦合设计,具备四大突出特点,可高效支撑多种AI场景,还能为用户提供开放选择、降低成本,中科曙光也将开放多项技术能力助力产业发展。
9月5日,中科曙光在2025世界智能产业博览会上发布了国内首个基于AI计算开放架构设计的产品——曙光AI超集群系统。

记者在现场了解到,这一AI超集群(qún)系(xì)统(tǒng)以(yǐ)GPU为(wèi)核(hé)心(xīn),实(shí)现(xiàn)了(le)“算(suàn)、存(cún)、网(wǎng)、电(diàn)、冷(lěng)、管(guǎn)、软(ruǎn)”一(yī)体(tǐ)化(huà)紧(jǐn)耦(ǒu)合(hé)设(shè)计(jì),具(jù)备(bèi)“超(chāo)高(gāo)性(xìng)能(néng)、超(chāo)高(gāo)效(xiào)率(lǜ)、超(chāo)高(gāo)可(kě)靠(kào)、全面(miàn)开(kāi)放(fàng)”四(sì)大(dà)特(tè)点(diǎn),可(kě)为(wèi)万(wàn)亿(yì)参(cān)数(shù)大(dà)模(mó)型(xíng)训(xun)练(liàn)推(tuī)理(lǐ)、行业大模型微调、多模态大模型开发、AI4S等场景提供高效算力底座。
据介绍,曙光AI超集群系统具有高性能、高效率、高可靠、全面开放的技术特点。比如,在性能方面,单机柜可搭载96张GPU卡、算力规模达百P级、访存总带宽超180TB/s,支持多精度、混合精度运算以及百万卡超大集群扩展;效率方面,千卡集群大模型训练推理性能达到业界主流水平2.3倍,开发效率提升4倍。
当前,伴随AI大模型快速演进以及全球IT产业生态(tài)体(tǐ)系(xì)调(diào)整(zhěng),国(guó)内(nèi)AI算(suàn)力(lì)领(lǐng)域面(miàn)临(lín)高(gāo)端(duān)算(suàn)力(lì)供(gōng)给(gěi)不(bù)足(zú)、国(guó)产(chǎn)加(jiā)速(sù)卡(kǎ)性(xìng)能(néng)差(chà)距(jù)大(dà)、算(suàn)力(lì)成(chéng)本(běn)高(gāo)、自(zì)主软(ruǎn)硬(yìng)件(jiàn)生(shēng)态(tài)不(bù)成(chéng)熟(shú)等(děng)挑(tiāo)战(zhàn)。而(ér)发(fā)展(zhǎn)更(gèng)大规模、更高效智算集群来弥补国产单卡算力差距以突破算力瓶颈,打造开放式、标准化、高效率的算力集群,以实现智算集群的易用与可控成本,正逐渐成为业界共识。
值得关注的是,相比(bǐ)封(fēng)闭(bì)系(xì)统(tǒng),曙(shǔ)光(guāng)AI超(chāo)集群(qún)系(xì)统(tǒng)不(bù)仅(jǐn)通(tōng)过(guò)紧(jǐn)耦(ǒu)合(hé)设(shè)计(jì)像(xiàng)一(yī)台(tái)计(jì)算(suàn)机(jī)般(bān)高(gāo)效(xiào)工(gōng)作(zuò),还(hái)支(zhī)持(chí)多(duō)品(pǐn)牌(pái)AI加(jiā)速(sù)卡(kǎ)以(yǐ)及(jí)兼(jiān)容(róng)主流(liú)软(ruǎn)件(jiàn)生(shēng)态(tài),为(wèi)用(yòng)户(hù)提(tí)供(gōng)更(gèng)多(duō)开(kāi)放(fàng)性(xìng)选(xuǎn)择(zé),并(bìng)降(jiàng)低(dī)硬(yìng)件(jiàn)成(chéng)本(běn)和(hé)软(ruǎn)件(jiàn)开(kāi)发(fā)适(shì)配(pèi)成(chéng)本(běn),保(bǎo)护(hù)前(qián)期(qī)投(tóu)资(zī)。
中科曙光总裁助理、智能计算产品事业部总经理杜夏威表示,克服国内AI算力多维挑战,需汇聚芯片、计算系统、大模型等产业链多方力量,构建开放AI计算架构并拉通产业间跨层协作,以打破“技术墙”与“生态墙”。据他透露,依托AI超集群系统,中科曙光将开放AI存储优化能力、液冷基础设施设计规范、DeepAI基础软件栈等三项(xiàng)技(jì)术(shù)能(néng)力(lì),助(zhù)力(lì)合(hé)作(zuò)伙(huǒ)伴(bàn)、重(zhòng)点(diǎn)用(yòng)户(hù)在(zài)AI应(yīng)用(yòng)存(cún)储(chǔ)性(xìng)能(néng)加(jiā)速(sù)、液(yè)冷(lěng)超节点系统设计、GPU开发统一开发框架等方面获得高级别技术共享、深度定制优化与专业技术支持。




