《金基研》 寒松/作者 杨起超 时风/编审

在全球科技竞争日趋白热化的时代,高性能GPU(图形处理器)已成为驱动数字经济发展的核心算力基础。面对外部技术封锁与内部产业升级的双重挑战,国内GPU产业在政策支持与下游需求的双重驱动下蓬勃发展。作为国内高性能GPU产品的领军企业之一,沐曦集成电路(上海)股份有限公司(以下简称“沐曦股份”)迎来黄金发展期。

凭借全栈自研的技术体系,沐曦股份不仅在技术攻坚上持续突破,更在商业化落地上展现出令人瞩目的速度。通过技术创新和设计优化,沐曦股份的GPU产品性能指标达到国际主流水平,在短短三年内率先实现“技术-产品-市场”的产业化应用,是国内少数实现千卡集群大规模商业化应用的GPU供应商之一。近年来,沐曦股份的存量客户持续复购、新客户不断开拓,收入规模快速增长,在手订单及潜在商机充足。沐曦股份已成为国内人工智能产业链的重要参与者,持续推动国产算力产业链自主可控,不断加速GPU芯片国产替代进程。

一、“政策支持+下游需求”双轮驱动,国产GPU驶入发展快车道

在全球科技竞争日益激烈的当下,高性能GPU作为数字经济的核心算力引擎,已成为大国科技博弈的战略制高点。在这一宏大背景下,作为国内领先的高性能通用GPU企业,沐曦股份正站在政策与产业交汇的风口之上。

1.1、政策红利持续释放,人工智能与集成电路产业迎机遇

随着人工智能技术发展和产业化进程加速,人工智能作为引领新一轮科技革命和产业变革的战略性技术,已被提升至国家战略高度。

近年来,国内将人工智能、集成电路产业作为战略性产业之一,出台了一系列产业鼓励、扶持政策,有效激发了行业发展动力。沐曦股份的发展显著受益于国家在集成电路、人工智能等领域出台的一系列系统性支持政策。

2024年,工信部等七部门发布《关于推动未来产业创新发展的实施意见》,提出加快突破GPU芯片、集群低时延互连网络、异构资源管理等技术,建设超大规模智算中心。

2025年2月,国务院国资委召开中央企业“AI+”专项行动深化部署会,会议要求着力强化中央企业推进人工智能发展的要素支撑,在编制企业“十五五”规划中将发展人工智能作为重点,打造更多科技领军企业。

2025年8月,国务院出台《关于深入实施“人工智能+”行动的意见》,提出要深入实施“人工智能+”行动,大力推进人工智能规模化商业化应用,推动人工智能赋能千行百业,加快智能算力、数据中心等数字基础设施建设。

2025年10月,《中共中央关于制定国民经济和社会发展第十五个五年规划的建议》在多个章节明确人工智能的战略地位,提出全面实施“人工智能+”行动,强调加强原始创新和关键核心技术攻关。

在此背景下,全国各地智算中心建设热度持续,各地方也结合本地产业特色,加快人工智能应用创新,聚合人工智能产业生态。

1.2、国内智能算力规模快速增长,GPU芯片市场空间广阔

在新一轮人工智能发展浪潮下,国内智算中心持续建设与扩容。根据IDC数据,2020-2024年,国内智能算力规模分别为75.0EFLOPS、155.2EFLOPS、259.9EFLOPS、416.7EFLOPS、725.3EFLOPS,CAGR达76.35%。IDC预计,到2028年国内智能算力规模将达到2,781.9EFLOPS。

图表, 条形图, 瀑布图

AI 生成的内容可能不正确。

随着人工智能技术向各行业的纵深渗透,算力基础设施需求激增,互联网企业、运营商及地方政府纷纷加大投入。

例如,互联网企业中阿里巴巴在2025年2月宣布未来三年将投入超过3,800亿元,用于建设云和AI硬件基础设施,总额超过去十年总和;字节跳动预计2025年资本开支达1,600亿元,其中约900亿元用于AI算力采购。而三大运营商2025年资本开支计划规模合计达2,898亿元,投资重心将继续向算力网络建设倾斜。各地政府亦纷纷出台政策提升智算供给规模,智算中心建设热度持续。

根据Bernstein Research预测,到2027年,国内人工智能资本支出总额将从2024年的600亿美元增长至1,470亿美元,其中云服务商、其他企业资本支出占比预计分别为60%、40%。

GPU芯片具备灵活的指令集和精巧的处理器架构,可覆盖人工智能领域多元化应用场景,是目前主流的AI芯片。数字经济的深入发展推动了对高效并行计算GPU芯片的需求,尤其是在人工智能训练和推理场景中。

根据中商产业研究院数据,2020-2024年,国内GPU芯片市场规模分别为345亿元、457亿元、608亿元、807亿元、1,073亿元,CAGR为32.80%。

图表, 条形图

AI 生成的内容可能不正确。

GPU芯片下游客户群体广泛,各类群体对算力的采购需求均持续激增,为具有领先技术实力和商业化能力的国产厂商创造了巨大的市场开拓空间。

1.3、地缘博弈与国产替代共振,本土GPU开启黄金发展期

长期以来,国内算力基础设施被境外厂商主导,国产替代潜力巨大。

近年来,受美国针对高性能AI芯片及相关技术的出口管制政策影响,国际厂商高性能芯片向国内市场的供应受限,其在国内AI芯片市场的份额已明显下降。

同时,实现人工智能产业链的自主可控已成为国内产业发展的核心诉求与驱动力。在此背景下,国内GPU厂商凭借创新的产品与技术参与市场竞争,逐渐打破国外厂商垄断,实现了市场份额的不断提升,为推进新质生产力发展提供动力引擎。

在地缘风险与自主可控需求的双重驱动下,国内GPU市场的国产化率持续提升,逐步实现对进口产品的替代,这为具有领先技术实力和商业化进展的国产厂商创造了巨大的发展空间。

综上,在国家政策支持、下游需求旺盛、国产替代加速的驱动下,以沐曦股份为代表的优质国产GPU企业迎来良好的发展机遇。

二、加码研发提升自主创新能力,全栈自研构筑技术护城河

宏观的东风已至,但要将机遇转化为实实在在的市场地位,核心在于企业自身的技术硬实力。唯有具备全栈自研实力和持续创新机制的企业,才能将外部势能转化为内生动能,在激烈的全球竞争中实现突围。沐曦股份正是凭借深厚的技术积累与前瞻的战略布局,成为这一进程中的核心推动者。

2.1、研发投入呈逐年增长趋势,拥有全建制世界级技术团队

作为国家级专精特新“小巨人”企业、国家高新技术企业,沐曦股份高度重视技术创新与研发投入,各年度研发投入持续增长,始终保持在较高的水平,为不断创新提供强力保障。

2022-2024年及2025年1-3月,沐曦股份的研发投入分别为6.48亿元、6.99亿元、9.01亿元、2.18亿元,占营业收入的比例分别为151857.63%、1317.63%、121.24%、68.01%。需要说明的是,在早期由于沐曦股份营收规模尚小,研发投入占比偏高;随着营收规模的快速增长,其研发投入占比显著下降。

图表, 条形图, 瀑布图

AI 生成的内容可能不正确。

研发团队建设方面,沐曦股份重视人才的培养和引进,形成了一支富有远见、洞察力强且具备持续自主创新能力的技术研发团队,为产品开发并最终实现产业化落地奠定了坚实基础。

截至2025年3月31日,沐曦股份已在北京、南京、成都、武汉、杭州、中国香港等地建立全资子公司及研发中心,共有652名研发人员,占员工总人数的比例为74.94%。截至2025年8月31日,沐曦股份研发人员数量上升至670人。

其中,沐曦股份创始人陈维良博士带领团队主导并完成多款高性能GPU产品的流片和量产,曾获“上海产业菁英高层次人才-产业领军人才”“2025年度AI人物”等称号或荣誉;联合创始人彭莉曾作为主架构师完成了多款高端复杂的GPU芯片设计;联合创始人杨建博士是三维图形与高性能计算生态领域资深专家,拥有丰富的GPU芯片设计及软件生态开发经验。彭莉和杨建均曾在国际领先的GPU公司获得企业院士称号。

2.2、国内少数掌握全流程核心技术企业之一,技术水平国内领先

在GPU这一高度复杂的系统级芯片领域,仅拥有部分模块设计能力难以形成有竞争力的产品,也难以构建可持续发展的产业生态。唯有打通从指令集、架构、IP到编译器、通信库的软硬件全栈技术链条,才能真正摆脱对外依赖,支撑大规模商业化应用。

作为国内领先的GPU芯片设计企业,沐曦股份聚焦关键核心技术攻关,不断强化科技创新能力,坚持核心技术自主可控的发展路线,掌握了一系列底层核心技术,并构建了完善且自主可控的技术体系。

具体而言,沐曦股份通过自主研发,形成了覆盖计算和渲染场景的核心GPU IP,打造了由超过600条(XCORE1.0计算GPU)、800条(XCORE2.0渲染GPU)指令组成的MXMACA指令集,为新一代GPU芯片研发奠定了良好基础。

同时,沐曦股份在硬件设计层面掌握高性能GPU处理器架构设计技术、高性能GPU流处理器设计技术、高性能GPU多级缓存结构及内存管理设计技术等8项核心技术;在软件开发层面掌握GPU异构计算编程语言与开发环境、人工智能编译器与编译技术、GPU高性能通信库设计与优化技术等6项核心技术。

目前,沐曦股份已成为国内少数几家全面系统掌握了GPU架构、GPU IP、高性能GPU芯片及其基础系统软件研发、设计和量产等全流程核心技术的企业之一,其核心技术处于国内领先水平,具备原创性、引领性和前沿性。

截至2025年3月31日,沐曦股份拥有境内发明专利245项、集成电路布图设计专有权3项、软件著作权25项,并多次与政府合作科研项目,技术储备位居国内GPU行业头部阵营。

简言之,沐曦股份凭借持续高强度的研发投入、世界级全建制技术团队的支撑,以及对GPU软硬件全流程核心技术的系统性掌握,已在国内GPU领域建立起显著的技术领先优势。

三、软硬件协同构筑竞争壁垒,产品核心指标比肩国际主流产品

技术领先性最终需通过产品接受市场检验。沐曦股份不仅构建了完整的GPU底层技术体系,更通过软硬件深度协同,将全栈自研能力高效转化为具有国际竞争力的产品,实现了从“能做”到“好用”的关键跨越。

3.1、持续完善GPU产品矩阵与软件生态,软硬件协同释放产品性能

多年来,沐曦股份始终专注于GPU产品的技术创新和迭代升级,形成了独具优势的GPU产品体系和自主开放的软件生态,持续为云端计算提供高能效、高通用性的算力支撑。

自2023年以来,沐曦股份基于自主研发的GPU IP和统一的GPU计算架构,先后推出了用于智算推理的曦思N系列GPU、用于训推一体和通用计算的曦云C系列GPU。同时,面向图形渲染的曦彩G系列GPU也在研发中,由此形成了日趋完善的GPU产品矩阵。

其中,沐曦股份于2023年推出了首款训推一体GPU芯片曦云C500,并在此基础上陆续推出了曦云C550、曦云C588。曦云C500/C550芯片的算力水平与英伟达A100相当;而曦云C588芯片实现算力跃升,大幅缩小了与英伟达H100的差距,达到国内先进水平。

曦思N100产品是沐曦股份2022年推出的首款产品,后续又推出了曦思N260。曦思N系列是面向云端应用的智算推理产品,采用高带宽内存,提供强大的算力和领先的视频编解码能力。

曦彩G系列是面向图形处理和智算推理的图形渲染GPU,具备卓越的图形处理能力。截至2025年10月24日,曦彩G系列相关产品已完成GPU IP设计和验证。

目前,沐曦股份正在研发基于国产供应链的新一代训推一体芯片曦云C600系列(已回片并点亮)和C700系列、智算推理GPU曦思N300,以及图形渲染GPU曦彩G系列的新产品,进一步丰富产品矩阵。

表格

AI 生成的内容可能不正确。

计算产业通常可以分成硬件行业和软件行业。硬件产业链遵循牛顿力学“还原论”,即通过分解简化、线性组合组建产业链,因此需要有为政府弥补产业链早期的外部性;软件生态遵循达尔文的”演化论”,用户需求变化万千,适者生存,因此需要维护有效市场,确保用户需求可以透过市场竞争快速反馈给企业。

优秀的GPU芯片与完善的软件生态相辅相成。2012年后的AI算法快速演进与CUDA(一种由英伟达公司推出的通用并行计算架构)形成了互利共生的关系。当CUDA几乎与AI画等号的时候,会有大量的社区力量为其助力。这就是一种良性循环:好的性能带来好的生态,好的生态会有助于更好的性能。由此形成了“GPU算力-CUDA生态-AI算法-新质生产力”之间的正向 “飞轮效应”。

基于自研指令集及GPU并行计算引擎,沐曦股份打造了自主可控MXMACA软件栈,是国内少数能为云端AI开发者提供兼顾易用性、高性能、通用性的基础软件栈的企业之一。

MXMACA软件栈拥有统一、完整且高效的全栈式工具链,涵盖应用开发、功能调试和性能调优等核心环节。同时,它高度兼容CUDA生态,能够便捷地利用全球开发者的开源成果,从而在易用性、迁移效率、通用性和灵活性方面均具备独特的竞争力。

软硬件的深度协同确保了产品性能的高效释放,为沐曦股份构建了深厚的竞争壁垒。

3.2、GPU产品在多维度具有领先表现力,推动进口替代进程

作为国内高性能通用GPU的领导者之一,沐曦股份的GPU产品性能达到了国际上同类型高端处理器的水平,在国内处于领先地位,推动了国产产品的进口替代进程。

其中,沐曦股份的训推一体GPU产品基于通用、灵活、自主的架构,具备国内领先的计算能力。其显存容量、显存带宽等关键性能参数在国内同业中位居前列,通信能力亦属国内领先且稀缺。在部分应用场景下,沐曦股份的训推一体GPU产品核心指标已比肩国际主流产品。

根据多家行业权威的国家实验室、计算中心、研究所的测试结果,沐曦股份的GPU产品在单卡性能、集群性能及稳定性等多维度方面具有领先的产品表现力。

单卡性能方面,沐曦股份是国内首批同时具备高性能GPU芯片设计与商业化能力的企业之一,全栈GPU产品基于自主研发和自主知识产权的GPU IP、GPU指令集和架构,单卡性能处于国内头部阵营。

集群性能方面,沐曦股份自研的MetaXLink具备国内稀缺的高带宽卡间互连能力,可实现2-64卡多种互连拓扑,并且在智算集群的线性度和稳定性方面具有良好的产品表现。

软件生态兼容性方面,在设计MXMACA软件栈时,沐曦股份就注重与CUDA的兼容性。根据客户实际使用经验反馈,MXMACA在兼容性方面表现卓越,甚至优于AMD和Intel的同类产品。用户的源代码只需要用沐曦的编译工具编译后,就可以直接运行在曦云C500系列GPU上。

总的来说,沐曦股份已构建起完整的GPU产品体系,并持续研发新一代产品,展现出突出的科研成果转化能力。同时,沐曦股份依托自主可控的MXMACA软件栈,实现了软硬件深度协同,形成显著竞争壁垒。沐曦股份的GPU产品在诸多方面达到国内领先水平,并展现出显著的进口替代能力。

四、三年破局凸显商业化能力,加速GPU产业链国产化进程

优异的产品性能是商业化的基石,而规模化落地则是技术价值的最终检验。沐曦股份凭借产品指标和高度兼容的软件生态,迅速赢得客户信任,仅用三年时间就完成了从技术验证到千卡级集群部署的跨越,展现出强大的商业化能力。

4.1、GPU产品累计销量超过2.5万颗,构建“1+6+X”生态与商业布局

仅用三年时间,沐曦股份就实现两款芯片一次流片并成功量产,快速实现了商业化、规模化落地,是国内少数实现千卡集群大规模商业化应用的GPU供应商。同时,沐曦股份正在研发和推动万卡集群的落地,目前已成功支持128B MoE大模型等完成全量预训练。

凭借突出的产品性能和稳定的供应能力,截至2025年3月末,沐曦股份GPU产品累计销量超过25,000颗,充分印证了其产品获得市场高度认可并成功实现商业化。

其中,沐曦股份的核心产品训推一体系列GPU板卡产品销售收入呈快速增长趋势。根据招股书数据,2023-2024年及2025年1-3月,沐曦股份的训推一体GPU系列产品销售收入分别为0.15亿元、5.12亿元、3.13亿元。

图表, 条形图

AI 生成的内容可能不正确。

同时,沐曦股份深度构建“1+6+X”生态与商业布局,加大市场开拓力度。沐曦股份已与国内多个行业知名企业建立了战略合作关系,为业务拓展打下了坚实的基础。

“1+6+X”战略即在维持与智算中心客户深度合作的基础上,重点围绕教科研、金融、交通、能源、医疗健康、大文娱6大极具市场潜力的重点行业和“X”个长尾行业市场,积极寻找和发展垂类场景销售机会。

目前,沐曦股份产品相继应用部署于10余个智算集群,算力网络覆盖国家人工智能公共算力平台、运营商智算平台和商业化智算中心,区域横跨北京、上海、杭州、长沙、中国香港等地区,并逐渐向更多区域延伸;GPU产品深度赋能众多行业应用场景,已率先布局教科研、金融、交通、能源、医疗健康、大文娱等行业,产品赋能效果和交付能力得到充分验证。

此外,沐曦股份荣获“2024年VENTURE50硬科技企业”“‘中国芯’2023年年度重大创新突破产品奖”“国产GPU飞跃产品”“胡润2023全球数字经济独角兽”“2023年度中国AI芯片企业先锋企业TOP30”等荣誉奖项,其行业地位与品牌影响力获得了广泛认可,进一步反哺商业拓展。

4.2、构建稳定供应链体系,助力GPU产业链国产化突破

大规模快速商业化的背后,是稳定可靠的供应链支撑。随着技术不断自主创新和商业化能力日臻完善,沐曦股份已成为国内人工智能产业链的重要参与者,其构建的稳定供应链体系是实现快速交付的关键一环。

多年来,沐曦股份坚持开放共赢,凭借领先的技术实力、长期的行业资源积淀已与产业链上下游建立了良好的合作关系,广泛适配整机服务器、操作系统、运维管理平台、主流AI框架、主流大模型等上下游生态。

作为典型的Fabless模式企业,沐曦股份构建了稳定的供应链体系,积累了丰富的供应链管理经验,拥有动态、灵活的库存管理机制。这套高效的供应链系统,确保了沐曦股份能够满足市场爆发性增长带来的订单需求,是其商业化能力的重要组成部分。

截至2025年10月24日,沐曦股份在晶圆生产制造、封测、存储颗粒、EDA、IP等核心环节的国产化进程中取得阶段性突破。

综上,超过2.5万颗的销量、“1+6+X”生态布局,以及十余个智算集群的应用部署,共同绘就了沐曦股份成功的商业化版图。同时,沐曦股份构建了稳定的供应链体系,打通了国产GPU从研发到规模化商业落地的全链路闭环,推动国内智能算力自主可控和良性发展。

五、营收指数级攀升,募资加码新一代GPU研发与产业化

商业化能力的快速释放,直接推动了沐曦股份经营业绩的爆发式增长。随着产品大规模交付和客户复购率提升,沐曦股份的营收实现指数级攀升,并已跨越盈利拐点,为其持续投入下一代技术研发提供了坚实的资金保障。

5.1、近三年营收CAGR达4,074.52%,在手订单达14.30亿元

随着产品快速商业化落地,沐曦股份的业务规模不断扩大,实现了营业收入的跨越式增长。

根据招股书数据,2022-2024年及2025年1-6月,沐曦股份营业收入分别为42.64万元、5,302.12万元、74,307.16万元、91,493.10万元,最近三年CAGR达到4,074.52%。需要说明的是,沐曦股份2025年1-6月财务数据经立信会计师审阅,但未审计。

图表, 瀑布图

AI 生成的内容可能不正确。

同时,随着营业收入的快速增长,沐曦股份的亏损幅度显著收窄。2025年1-6月,沐曦股份的归母净亏损较上年同期收窄63.74%。值得关注的是,2025年第二季度,沐曦股份的归母净利润为4,661.89万元,已实现扭亏为盈。

从在手订单金额来看,截至2025年9月5日,沐曦股份在手订单金额(不含税)为14.30亿元,以曦云C500系列板卡为主,主要来自超讯通信、新华三、汇天网络、武珞智慧等存量客户的复购订单以及部分新客户大订单。

5.2、募资加速GPU研发与产业化,增强核心竞争力驱动增长

此番上市,沐曦股份拟募集资金39.04亿元,分别用于投资“新型高性能通用GPU研发及产业化项目”“新一代人工智能推理GPU研发及产业化项目”和“面向前沿领域及新兴应用场景的高性能GPU技术研发项目”。

表格

AI 生成的内容可能不正确。

其中,“新型高性能通用GPU研发及产业化项目”包括沐曦股份第二代高性能通用GPU芯片(代号C600)和第三代高性能通用GPU芯片(代号C700)两个研发子项目,基于国产先进工艺开发具备较高性能和更高性能的两款通用GPU,是曦云C系列训推一体芯片的后续主力产品。“新一代人工智能推理GPU研发及产业化项目”系沐曦股份研发下一代基于先进封装技术的云端大模型推理芯片(代号Nx),主要用于生成式AI推理。

“面向前沿领域及新兴应用场景的高性能GPU技术研发项目”围绕前沿芯片技术研发和前沿GPU系统研发两大方向,具体包括但不限于超高带宽显存、芯粒架构、设计工艺联合优化、GPU光互连技术、大功率POL电源设计优化等研发内容。

本次募投项目的顺利实施,将帮助沐曦股份完成现有核心产品线的持续迭代升级,巩固行业领先地位,进一步扩大市场份额,同时有利于增强其整体研发实力,丰富前沿技术储备,构筑更高的竞争壁垒,为未来长期发展奠定坚实基础。

六、结语

综上所述,回顾沐曦股份的发展路径,可以清晰地看到一条“政策引领、技术攻坚、产品落地、商业成功”的完整闭环。面对全球人工智能竞赛再度加速和算力资产价值链重构这一“百年未有之大变局”,沐曦股份通过持续高强度的研发投入构建起全栈技术壁垒,最终以超过2.5万颗的销量和指数级增长的营收验证了其商业化能力,走出了从研发优势到市场优势的稳健步伐。

随着募集资金投入新一代GPU研发与产业化,沐曦股份将进一步巩固技术领先优势,加速万卡集群部署与产业链国产化进程。在“十五五”规划全面实施“人工智能+”行动的新阶段,沐曦股份有望保持高速发展态势,持续为国家数字经济发展提供强大的算力支撑,为民族复兴、国家强盛贡献科技力量。