本文作者:访客

摩尔线程吕其恒:AI腾飞后,国产GPU如何抓住机会 | 2025向新·AI未来

访客 2025-07-06 13:03:09 74349
摩尔线程吕其恒:AI腾飞后,国产GPU如何抓住机会 | 2025向新·AI未来摘要: 前言:2025年,AI撕裂数据与实体的边界,量子计算探索物理规则的边缘,绿色科技重塑增长的伦理,低空经济、机器人、大模型...

摩尔线程吕其恒:AI腾飞后,国产GPU如何抓住机会 | 2025向新·AI未来

前言:

2025年,AI撕裂数据与实体的边界,量子计算探索物理规则的边缘,绿色科技重塑增长的伦理,低空经济、机器人、大模型打开科技跃迁的大门。

在这个大背景下,中国企业需要以智慧为坐标,穿透技术、组织与商业模式的“三重结界”,在数字与实体的纠缠中锻造新物种。在这背后,是一群技术兴国的信奉者,产业跃迁的掌舵人、商业社会的洞察者、认知边界的拓荒者,这些企业家永远走在创新的前沿。

与智者同行者,必将率先触摸未来;与AI共振,终将定义下一个纪元。

我们邀请了多位国内外顶尖创新与商业领袖,人工智能链主和龙头创新企业,共同展望2025产业发展、技术创新以及战略性新兴产业发展的前景。

此文为融中特别策划·《2025向新·AI未来》系列报道第四篇。

摩尔线程作为国内领先的全功能GPU创新企业,凭借其强大的技术实力和完善的生态系统,在AI产业链中迅速崛起。公司以全功能GPU为核心,致力于为全球提供加速计算的基础设施和一站式解决方案,助力各行各业的数智化转型。摩尔线程不仅在技术研发上取得了显著成就,还在产品迭代、知识产权、应用场景等方面展现出强大的竞争力。面对大模型时代的机遇与挑战,摩尔线程积极布局,通过与开源模型的合作和自主生态的构建,加速国产AI生态发展进程,为我国数字经济的腾飞注入强劲动力。

本次,融中财经与摩尔线程市场生态高级总监吕其恒围绕企业优势、行业发展展开讨论,以下为融中财经整理内容。

融中财经:贵司所处AI产业链条哪些关键环节、市场格局如何,具备哪些技术/产品优势等?

吕其恒:摩尔线程成立于202010月,以全功能GPU为核心,致力于向全球提供加速计算的基础设施和一站式解决方案,为各行各业的数智化转型提供强大的AI计算支持。我们的目标是成为具备国际竞争力的GPU领军企业,为融合人工智能和数字孪生的数智世界打造先进的加速计算平台。

摩尔线程有以下几点核心的团队优势——

1.技术领先:摩尔线程是国内极少数可从功能对标英伟达的GPU。摩尔线程全功能GPU芯片采用自研先进MUSA架构,集成AI计算加速、图形渲染、视频编解码、物理仿真和科学计算等四大引擎,且原生支持包括FP8计算在内的多种精度。

2.产品迭代:摩尔线程保持每年迭代一颗全功能GPU芯片的节奏,建立了从芯片、板卡、集群到软件的全栈AI智算产品线。也是国内仅有的在B端、C端均有产品布局的全功能GPU企业。

3.生态系统:我们拥有千余家生态伙伴,形成了强大的生态网络,这为我们的产品提供了广阔的市场和应用场景。

4.人才优势:摩尔线程创始团队来自全球GPU巨头英伟达,构建了一支涵盖GPU芯片IP研发、系统软硬件设计、生态建设、市场营销等多领域的高端人才队伍,公司员工绝大部分为研发人员,这为我们的技术创新和产品开发提供了坚实的人才基础。

5.知识产权:经过四年投入,摩尔线程在专利数量和价值上取得重要突破进展。根据国家知识产权局的数据,截至20252月,摩尔线程获得470项授权专利,稳居国内GPU企业中专利授权数量首位。这些专利主要覆盖了处理器架构设计、AI应用、驱动软件设计、GPU算力集群等关键技术领域,充分展示了摩尔线程在技术创新上的深厚积累和前瞻布局。202411月,摩尔线程凭借夸娥(KUAE)智算集群项目斩获“2024中国·海淀高价值专利培育大赛”一等奖。此外,摩尔线程还取得了知识产权贯标认证,这一认证属于贯彻国家标准(GB/T29490-2023)的国家级资质认证,是对公司知识产权管理体系科学性、系统性、规范性和专业性的有力证明。

6.应用场景:摩尔线程全功能GPU应用场景广泛,覆盖AI训练与推理、AIGC、数字孪生、物理仿真、科学计算等,可以充分为金融、教育、电力、交通、能源、农业等重点行业的数智化转型提供算力加速,持续助力我国数字经济发展。

7.投资阵容:摩尔线程成立不到五年时间内完成了数轮融资,投资方包括中国移动、深创投、上海国盛、中银国际、建银国际、招商局创投、中关村科学城、红杉资本等知名国资和风投机构。

摩尔线程是一家拥有自主知识产权的全功能GPU创新企业,是国内极少数既覆盖了图形渲染,又支持AI高性能计算的国产GPU公司,产品覆盖从云到端,致力为各行各业的数智化转型提供全栈计算支持。夸娥(KUAE)智算中心全栈解决方案:以全功能GPU为底座,软硬一体化、完整的系统级算力解决方案,包括以夸娥计算集群为核心的基础设施、集群管理平台(KUAE Platform)以及大模型服务平台(KUAE ModelStudio),旨在以一体化交付的方式解决大规模GPU算力的建设和运营管理问题。

2023年,摩尔线程推出了以夸娥智算集群为核心的智算中心产品组合,可实现从千卡至万卡集群的无缝扩展,支持所有主流开源大模型,并与智源研究院、智谱AI、无问芯穹等多家大模型合作伙伴完成适配与测试,能够为千亿和万亿参数的大模型训练提供坚实的算力支撑,满足大模型时代对于算力“规模够大+计算通用+生态兼容”的核心需求。桌面级图形显卡MTT S80:国内首款公开发售的国产高性能游戏显卡,也是国内首个支持DirectX12游戏的国产GPUMTT S80202211月发布至今,其Windows驱动版本已经迭代26次,平均每30天发布一个新版本。目前已实现China Top 50热门游戏100%兼容,已追踪超过450款游戏的运行情况,累计正式发布的适配和优化游戏192款,并且还有更多游戏正在适配和调优。截至202410月,在图形测试软件3DMark 11中,MTT S80的成绩提升至4.5倍。

摩尔线程AI大模型训推一体机:摩尔线程AI大模型训推一体机MCCX D800是专为千卡乃至万卡级别GPU集群、万亿参数大语言模型预训练优化的服务器硬件系统,同时针对大模型推理效率以及性价比优化,支持兼容主流软硬件生态。目前,MCCX D800原生支持包括FP8计算在内的多种精度,现已支持包括DeepSeekQwenGLMAquilaGPTLLaMA在内的多个主流大模型的训练与微调,承托于MUSA底层软件栈,配备完善的推理软件工具包,可实现快速上手、开箱即用。

融中财经:随着这两年大模型的快速发展,特别是Deep seek爆火,您对公司发展有了哪些新的想法?近三年战略路径是?

吕其恒:DeepSeek的核心突破在于算法优化和计算效率的提升,这种低算力需求模型对国产芯片的发展是一个重要机遇。首先,DeepSeek的成功表明,通过模型压缩、稀疏计算、混合精度训练等技术手段降低算力需求,可以在一定程度上弥补硬件性能的不足,为国内芯片提供了软硬件协同设计的新思路,证明了在硬件性能短期内难以赶超的情况下,通过软件层面的创新仍可提升整体计算效能;

其次,DeepSeek在混合精度训练方面的成功,展示了低精度计算在AI训练中的潜力。国内芯片厂商可以借鉴这种模式,优化芯片的计算单元,支持更灵活的精度配置。摩尔线程是目前国内唯一能支持包括FP8在内的全精度AI训练的GPU企业。摩尔线程全功能GPU配备了最新一代的Tensor Core,原生支持E5M2E4M3两种表示方式的FP8数据精度,可以为DeepSeek的模型训练提供国产算力支持。

与此同时,DeepSeek的开源模式为国产芯片厂商提供了与软件开发者合作的机会。通过与DeepSeek等开源模型的合作,国内芯片厂商可以更好地理解AI应用的需求,进行针对性优化,国产模型+国产芯片可以形成完整的AI闭环,加速国产AI生态发展进程。另外,DeepSeek大幅降低AI成本,让AI更加普及,反过来又会提升对算力规模的需求。

行业正处于模型应用落地的关键阶段,摩尔线程已经构建起"软硬一体"的行业解决方案。作为国内率先原生支持FP8计算精度的国产GPU企业,摩尔线程快速适配DeepSeek的各个开源仓库,旨在为更多GPU开发者赋能。凭借先进的MUSA架构和全功能GPU的强大技术实力,我们不仅光速适配了DeepSeek-R1V3满血版,更有DeepSeek大模型一体机提供开箱即用的体验。近日,摩尔线程MTT S4000训推一体计算卡还通过了中国信通院AI芯片和大模型适配验证,对DeepSeek-R1 671B大模型可实现正常、稳定运行,在推理场景下的适配结果符合“AI芯片和大模型通过性适配要求”并获颁检测证书。

同时,基于全功能GPU,我们与合作伙伴联合打造的智算一体机已完成与DeepSeek等主流大模型的深度适配。例如,摩尔线程与雪浪云联合打造的“软硬件紧耦合”大模型训推一体机——雪浪MindCenter X100,凭借其卓越的性能和灵活的架构,已成功部署DeepSeek-R1-Distill-Qwen(适配1.5B7B14B32B)推理服务,并在多种中文任务中展现了优异的性能。通过深度集成,这款一体机能够充分发挥DeepSeek模型的强大性能,同时借助自身高效的计算架构和资源管理能力,实现更快的训练速度、更低的推理延迟和更高的资源利用率。

整体来看,国产模型+国产芯片可以形成完整的AI闭环,加速国产AI生态发展进程。国产芯片通过聚焦能效比、本地化服务和政策红利,有望在边缘和端侧市场、行业AI等场景实现突围。例如:中国有广泛的工业场景,摩尔线程的大模型一体机产品在工业领域受到青睐。但与此同时,国产芯片仍需在生态构建、软硬协同和技术创新上持续投入,才能真正将机遇转化为市场份额。

融中财经:对比中美AI底层生态,您认为目前国内处于何种状态?随着AI产业的快速发展,中国创新企业,实现国产替代弯道超车的突破口在哪里?

吕其恒:我想从英伟达构建的CUDA生态的角度来谈谈这个问题——CUDA生态壁垒的核心在于硬件与软件的深度耦合,以及由此形成的强大生态绑定效应。英伟达的GPU架构通过CUDA进行了深度优化,能够充分发挥硬件的并行计算能力。同时,CUDA生态涵盖了从编程语言、API到优化库的完整工具链,并与主流深度学习框架深度集成,形成了强大的开发者社区和应用生态。

如果希望在全球市场上挑战英伟达的CUDA生态,国产GPU厂商需要从多个方面寻找突破口。一是构建自主可控的软件生态是关键,其次,兼容与创新并行的策略也至关重要。像摩尔线程MUSA既可以兼容主流开放生态,又可以自主发展,能够降低开发者的迁移成本,同时逐步构建自主生态。此外,抓住新技术的机遇也是一个重要方向。例如,DeepSeek的爆火,它的核心突破在于算法优化和计算效率的提升,这种低算力需求模型对国产芯片的发展是一个重要机遇。再次,通过开源和合作,吸引开发者参与,加速技术迭代,以及硬件层面的优化也非常重要。总之,挑战CUDA生态需要国产GPU厂商在硬件性能、软件生态和算法优化等多方面协同发力,逐步构建自主的软硬件生态链。

融中财经:大模型落地需要工程和算法的协同创新,如何建立开放协作的AI产业生态?产学研合作能起到哪些关键作用?

吕其恒:摩尔线程深刻理解开发者在技术生态中的重要性,通过线上线下课程培训、与高校合作交流等多种方式,为开发者提供技术成长和创新的平台。摩尔学院作为摩尔线程创立的专业GPU技术培训与交流平台,专为GPU开发者、科研人员以及产业实践者设计,提供从入门到精通的全方位培训。学院汇聚行业顶尖专家和生态合作伙伴资源,旨在打造一个全面而深入的课程体系,课程内容广泛覆盖人工智能、数字孪生、加速计算等多个前沿技术领域,帮助学员掌握尖端技术知识,拓展创新视野。

除了赋能开发者,围绕自主研发的MUSA统一系统架构和软件平台,摩尔线程正致力于构建一个完善且好用、易用的国产GPU应用生态,既可以自主发展,又兼容主流开放生态。

MUSA架构:MUSAMeta-computing Unified System Architecture)是摩尔线程自主研发的GPU统一系统架构,包括统一的GPU编程模型、软件运行库、驱动程序框架、指令集架构和芯片架构。开发者基于MUSA开发的应用将具备广泛的可移植性,可以同时运行在云端和边缘的众多计算平台上,包括面向图形、计算、多媒体和人工智能的各类应用。

MUSA软件栈:软件生态是推动GPU计算普及的关键,以MUSA架构为核心,摩尔线程发布了完备的MUSA软件栈,以服务广大的开发者和终端用户。MUSA软件栈包括图形渲染、多媒体、人工智能、物理仿真、通用计算等功能模块,将涵盖从底层驱动到GPU加速库,再到为不同行业定制的应用领域开发套件,致力于满足各种行业场景下的应用开发需求。

CUDA兼容:摩尔线程自研先进MUSA架构及软件栈对CUDA具备优良的兼容性,通过MUSIFY代码自动转换工具,用户可以快捷地将原有的CUDA代码无缝迁移到MUSA平台,大幅提升应用移植的效率,缩短开发周期。

MUSA开源软件:借助MUSACUDA的完整兼容,摩尔线程上线了一系列基于国产全功能GPU进行开源项目MUSA移植的软件,包括深度学习框架Torch-MUSA、大语言模型高速推理框架vLLM-MUSA、计算机视觉库OpenCV-MUSA、高性能模板库MUTLASS,以及DeepSeek开源周“全家桶”相关成果,以支持开发者基于国产GPU的技术创新和项目实践。

目前,摩尔线程已经在制造业、工程机械、新能源、教育、金融等多个行业中落地应用,展示了国产GPU在复杂AI任务中的强大支持能力。未来,摩尔线程将持续深化与开源社区合作,通过技术开放与生态共建,推动国产全功能GPUAI计算领域的规模化应用,并协同千余家生态伙伴形成的强大的生态网络,为更多用户提供更智能、高效的解决方案,为各行各业的数智化转型提供强大的AI计算支持。

阅读
分享