摩尔线程,科创板IPO最大黑马,国产AI芯片正当时

发布时间:2025年09月30日 来源:算泥 作者:suani 浏览量:23

国产AI芯片深度报道系列专栏

一家成立仅5年的国产芯片公司,用88天就走完了科创板的上市审核流程,如果一切顺利,它将成为今年科创板募资规模最大的新上市公司。

图片

一场风驰电掣的急行军

摩尔线程的IPO进程堪称"闪电速度"。根据公开信息,摩尔线程科创板IPO从受理到过会仅耗时88天,创下科创板IPO过会纪录。公司计划募资80亿元,如果年内顺利上市,将成为科创板今年挂牌的最大IPO。

图片

科创板自2019年7月22日开市以来至2024年6月30日,上市573家公司累计募集资金超9,100亿元,占同期全A范围21,850亿的41.7%,排名各板块第一。特别是在半导体行业,科创板累计募资超2700亿元。

今年6月,中国证监会发布《关于在科创板设置科创成长层增强制度包容性的意见》,扩大第5套标准适用范围,支持人工智能、商业航天、低空经济等更多前沿科技领域企业适用。

摩尔线程的IPO也受益于科创板的第5套上市标准。该标准以“市值≥40亿元+核心技术突破+阶段性成果”替代盈利门槛,精准覆盖人工智能、生物医药、商业航天、低空经济等前沿领域企业的研发周期痛点。

这传递出的信号,远不止“快”这么简单。

2020年,中国AI芯片市场超过80%的份额依赖进口,其中,以英伟达和AMD为代表的美国企业,占据着绝对的主导地位。这种高度依赖单一来源的局面,在当时的环境下,风险不言而喻。

同年,国家发改委首次将“集成电路”明确纳入“新基建”的范畴。紧接着,《新时期促进集成电路产业和软件产业高质量发展的若干政策》等一系列文件出台,为本土芯片企业提供了覆盖税收减免、融资支持、研发补贴等全方位的政策红利。

根据IDC数据,2023年中国数据中心加速卡市场中,国产芯片占比仅为14%,而到2024年,这一比例已跃升至34.6%,预计到2027年将进一步提升至55%。更细分的数据显示,2024年上半年中国AI芯片国产化比率为20%,到下半年已显著提升至34%。

AI芯片作为驱动人工智能训练和推理的算力基石,其战略地位愈发凸显。

资本、人才、政策,多股力量汇聚。互联网巨头、地方政府引导基金、产业资本纷纷下场,将重金押注在GPU、TPU、NPU等各类AI芯片的研发上。

摩尔线程,在这样一片热土上诞生。

摩尔线程的目标也很宏大——“中国版英伟达”。

一群“英伟达老兵”的国产化野心

摩尔线程的掌舵人,是张建中。

张建中2006年加入英伟达,凭借出色的能力和对中国市场的深刻理解,一路晋升,最终坐上了英伟达全球副总裁、中国区总经理的位置。

在任期间,他完整地主导和见证了英伟达在中国市场的业务拓展,尤其是CUDA生态的建设和推广。

CUDA是英伟达构建的并行计算平台和编程模型,它将GPU从一个只能用来玩游戏的图形硬件,变成了一个强大的通用计算引擎,催生了今天深度学习和人工智能的革命。

可以说,张建中比任何人都清楚,英伟达的强大,不仅在于其领先的芯片硬件,更在于CUDA这个看似开放实则封闭的软件生态所构建的坚固壁垒。

20年张建中投身创业。摩尔线程在北京正式注册成立,同年十月开始实际运营。

据公开信息,团队的骨干成员,有相当一部分是追随他多年的“英伟达系”老将,这些人是GPU架构设计、驱动程序开发、软件生态构建等领域的专家,对GPU研发的全链路有着丰富的实战经验。

团队还吸纳了来自地平线、微软亚洲研究院的AI与软件算法专家,招募了曾在英特尔、AMD、Arm等国际芯片巨头工作过的工程师,负责芯片从设计到流片、封装、测试等关键的量产环节。

这让摩尔线程拥有了业内罕见的完整建制和高效的执行力。他们不仅懂得如何设计一颗强大的GPU芯片,更懂得如何围绕这颗芯片,去构建一个能够与CUDA竞争的软件生态。

兵马未动,粮草先行。

摩尔线程自成立以来,共完成了八轮融资,累计融资金额超过百亿元人民币。

翻开它的股东名册,星光熠熠。

既有深创投、红杉中国、五源资本这样嗅觉敏锐、出手果断的一线VC,也有字节跳动、腾讯投资这类身兼“金主”与“潜在客户”双重身份的产业资本。后者的加入尤为关键,它们不仅带来了资金,更带来了宝贵的应用场景和生态合作资源,为摩尔线程产品的早期商业化落地提供了重要支撑。

24年12月完成的Pre-IPO轮融资中,投前估值246.2亿元,38家机构增资52.25亿元,投后估值达298.45亿元。今天6月,摩尔线程以310亿元人民币企业估值位列《2025全球独角兽榜》第212位。

图片

高估值、高融资的背后,是同样惊人的高投入和高亏损。

图片

2022年至2024年,摩尔线程分别实现营业收入4608.83万元、1.24亿元、4.38亿元,复合增长率为208.44%。2025年上半年营收继续迅猛增长。

尽管营收快速增长,但摩尔线程尚未盈利。2022年至2025年上半年,公司累计亏损约53亿元,主要用于研发投入和市场拓展。

这正是硬科技创业的典型写照:在技术壁垒极高、研发周期漫长的赛道里,必须依靠雄厚的资本进行持续输血,以“烧钱”换时间、换技术、换市场,直到跨越从技术突破到商业盈利的“死亡谷”。

摩尔线程的“烧钱”,换来了肉眼可见的成果。

2021年10月,也就是正式运营仅一年后,摩尔线程便宣布其第一颗全功能GPU芯片研制成功并成功点亮,完成了从零到一的技术原型验证。

2022年3月,公司召开了盛大的发布会,正式推出了自家的核心技术——MUSA(Meta-computing Unified System Architecture,元计算统一系统架构),并发布了基于该架构的首款桌面级显卡产品MTT S80,标志着其商业化征程的正式起步。

此后,摩尔线程的产品迭代按下了加速键。2022年11月,推出第二颗GPU芯片,并发布了面向数据中心市场的服务器GPU产品MTT S3000。2023年,产品线进一步扩展,发布了专为大模型智算设计的加速卡MTT S4000和面向专业视觉应用的MTT X300。

时至今日,已成功量产五颗芯片,完成四次GPU架构迭代,形成了覆盖AI智算、高性能计算、图形渲染、计算虚拟化、智能媒体和面向个人娱乐与生产力工具等应用领域的多元计算加速产品矩阵,同时实现了“云-边-端”全栈AI产品线的布局。

MUSA架构与全栈产品,正面挑战CUDA霸权

英伟达之所以能长盛不衰,其最大的护城河并非某一款性能超强的显卡,而是历经十余年发展、拥有数百万开发者、海量应用程序和库的CUDA生态。

任何后来者,如果不能解决软件生态的兼容性问题,即便硬件性能再强,也只是一座无法被有效利用的“算力孤岛”。

摩尔线程从成立之初就清醒地认识到了这一点。他们选择了一条最艰难,但也可能是唯一正确的道路:正面构建一个能够替代CUDA的自主软件生态。

这个生态的核心,就是MUSA。

图片

MUSA并非一个简单的软件开发工具包(SDK),而是一套完整的、自下而上的全栈技术体系。它包括了统一的指令集架构、统一的编程模型、驱动程序、运行时库、AI算子库、通信库以及上层的应用开发框架等所有关键组件。

MUSA的设计目标非常明确:

实现与主流生态的兼容。它深度兼容CUDA和PyTorch等业界主流的AI框架,支持Megatron-LM、DeepSpeed、FSDP等先进的分布式训练框架。这意味着,习惯于在英伟达GPU上进行AI开发的程序员,几乎不需要修改代码,或者只需要进行少量适配,就能将他们的程序平滑地迁移到摩尔线程的GPU上运行。这极大地降低了用户的迁移成本和学习曲线。

提供全面的算力支持。MUSA架构下的GPU硬件原生支持FP64、FP32、TF32、FP16、BF16、INT8等多种数据精度格式。这覆盖了从需要高精度计算的科学计算场景,到大模型训练和推理中广泛使用的混合精度计算的全部需求。

值得一提的是,摩尔线程还在其新一代MUSA架构中,原生支持了FP8数据格式。FP8是一种更低精度的浮点格式,它可以在牺牲极少模型精度的情况下,大幅减少显存占用和数据传输带宽,从而显著提升大模型训练和推理的效率。

摩尔线程的FP8支持与DeepSeek的UE8M0 FP8 Scale技术对齐,是少数实现FP8原生支持的国产GPU厂商,与华为昇腾、寒武纪等同步推进这一技术方向。

适应云原生时代的需求。通过其独有的MT Mesh 2.0硬件虚拟化技术,MUSA可以实现单张GPU物理资源的弹性切分,将其虚拟成多个独立的GPU实例,供不同的容器(Container)或虚拟机(Virtual Machine)使用,并保证它们之间的资源隔离和安全。这一特性对于需要高效、灵活调度算力资源的云计算和数据中心运营商来说,至关重要。

在MUSA这块坚实的地基之上,摩尔线程构建起了自己日益丰富的产品矩阵。

图片

其中MTT S4000,是摩尔线程目前面向AI大模型市场的旗舰级智算加速卡。它基于第三代MUSA架构,单卡配备了高达48GB的HBM显存,显存带宽达到768GB/s。它还搭载了摩尔线程自研的MTLink多卡互联技术,能够提供240GB/s的卡间通信带宽,使得多张MTT S4000可以高效地协同工作,从而构建起支持千卡甚至万卡规模的大型智算集群。根据官方公布的数据,基于MTT S4000的千卡集群,在训练千亿参数大模型时,线性加速比可以达到91%,展现了出色的系统扩展能力。它目前已经支持了LLaMA、GPT、ChatGLM、Qwen、Baichuan等国内外主流的大语言模型。

MTT S80,是摩尔线程进军消费级市场、直面游戏玩家的旗舰产品。其单精度算力达到14.7 TFLOPS,配备16GB GDDR6显存,并且是全球首款支持PCIe Gen5 x16总线接口的消费级显卡。MTT S80支持多达4路的8K分辨率显示输出,并兼容AV1、H.265等最新的视频编解码格式。对于游戏玩家而言,摩尔线程推出了名为PES控制中心的配套软件,用于驱动更新、性能监控和游戏优化。尽管在上市初期,MTT S80在Windows DirectX游戏下的兼容性和性能表现与英伟达、AMD的成熟产品相比还有差距,但它作为第一款真正意义上的国产游戏显卡,其破冰的意义远大于其初期的性能表现。它为摩尔线程积累了宝贵的消费级市场经验和驱动开发能力。

从单点突破到生态共建,国产GPU的商业化征途

拥有了性能不俗的硬件和自主可控的软件架构,摩尔线程的下一步,是如何将这些技术转化为实实在在的商业收入,并构建起一个能够自我循环、持续壮大的生态系统。

这次计划募集的80亿元,投向也极其聚焦:35亿元将用于下一代GPU芯片的持续研发,25亿元用于扩建名为“夸娥”的通用计算集群项目,15亿元投入到MUSA软件开发和生态建设中,剩余5亿元则作为补充流动资金。

“夸娥智算中心”,是摩尔线程从“卖产品”向“卖服务”、“卖解决方案”转型的关键一步。

它并非一个简单的物理数据中心,而是一套集硬件集群、软件框架、运维管理于一体的全栈解决方案。该方案基于MTT S4000加速卡和MCCX D800 X1等双路8卡GPU服务器,为客户提供了一站式、开箱即用的大模型训练和推理能力。这大大降低了企业,尤其是AI技术储备不足的传统企业部署和使用大模型的门槛。

2024年7月,夸娥智算中心解决方案宣布升级,实现了对“万卡万P万亿参数”(万卡集群、万 P 级算力和万亿参数规模)通用算力的支持,使其成为国产大模型训练领域一个不可忽视的重要基础设施。

除了字节跳动、腾讯等战略投资方兼早期用户,还与国内主流的服务器厂商合作,共同推出搭载摩尔线程GPU的服务器和一体机产品。在开发者生态建设方面,摩尔线程在今年开源了OpenCV-MUSA项目,将流行的计算机视觉库OpenCV中的十余个核心模块用MUSA架构进行了加速,开发者只需简单替换命名空间,就能让自己的程序享受到GPU带来的性能提升。

此外,公司还通过设立“摩尔学院”、发布技术博客、完善开发者文档中心等多种方式,努力降低开发者使用其平台的门槛。

今年9月,摩尔线程还与科大讯飞等企业合作,共同建设AI教育实训基地,旨在从源头上培养熟悉和掌握国产GPU开发技能的人才,为生态的未来播下种子。

从2020年的一纸蓝图,到2025年站在科创板的门前,摩尔线程用5年的时间,走完了一条从技术原型,到产品商业化,再到生态初步构建的完整路径。它的崛起,是国产AI芯片替代浪潮下一个生动而深刻的案例,验证了“政策驱动-技术突破-资本认可-生态完善”这一中国硬科技企业特有的发展模式。

参考资料:

http://www.cb.com.cn/index/show/zj/cv/cv135324671267

https://www.mthreads.com

https://xinwen.bjd.com.cn/content/s67e511a4e4b08edd28f6c827.html

https://developer.mthreads.com/sdk/download/musa

https://static.sse.com.cn/stock/disclosure/announcement/c/202509/002098_20250905_EBZW.pdf

免责声明:本文来自算泥客户端,不代表超天才网的观点和立场。文章及图片来源网络,版权归作者所有,如有投诉请联系删除。

0 0 0
有话要说  人讨论    23 人阅读
发表

游客

这位投稿者太神秘了,什么都没留下~

超天才网©2017 www.supergenius.cn All Rights Reserved ICP备09005826号 京ICP证130304号

联系我们| 加入我们| 法律声明| 关于我们| 评论互动

超天才网©2013-2014 All Rights Reserved ICP备09005826号 京ICP证130304号

关注我们: