切换到宽版
  • 31阅读
  • 2回复

[数码讨论]华为用数学补物理?黄仁勋公开承认,先进工艺真不重要了[5P] [复制链接]

上一主题 下一主题
在线jjybzxw

UID: 551814

 

发帖
167724
金币
273165
道行
2004
原创
2404
奖券
2775
斑龄
35
道券
1005
获奖
0
座驾
设备
摄影级
在线时间: 38174(小时)
注册时间: 2008-10-01
最后登录: 2025-07-12
— 本帖被 兵马大元帅 执行加亮操作(2025-06-22) —

近日,华为创始人任正非在深圳接受《人民日报》专访时,谈到了芯片技术差距上的问题。

对于芯片技术,任正非明确表示“华为单芯片还是落后美国一代”,但紧接着话锋一转说:“我们用数学补物理、非摩尔补摩尔,用群计算补单芯片,在结果上也能达到实用状况。 ”

是的,这几年华为技术团队提出了“用数学补物理”、“非摩尔定律补摩尔定律”、“用系统补单点” 三大创新思想,成功打造出了“超节点+集群”系统算力解决方案。

而这个“超节点+集群”系统,就是华为的昇腾CloudMatrix 384超节点,这是华为全栈100%国产化自研的全球最大AI超节点,它的出现成功撕开了被英伟达垄断的缺口。

华为CloudMatrix 384实现弯道超车。

2025年4月,在安徽芜湖举行的华为云生态大会上,华为常务董事、云计算CEO张平安揭开了CloudMatrix 384的神秘面纱。

这个由384张昇腾算力卡组成的超节点集群,单集群算力高达300PFlops,较英伟达NVL72的180PFlops高出67%,内存带宽达到后者的2.1倍,互联带宽提升至2.8Tbps,断点恢复时间缩短至10秒级,多项指标创下全球商用AI算力集群的新纪录。

在单颗昇腾芯片性能约为英伟达Blackwell架构GPU三分之一的情况下,华为选择了截然不同的技术路径,通过超大规模集群设计实现系统级突破。

华为依托6812个400G光模块构建的超高速互联网络,使数据在384张卡间近乎无损流动,训练效率逼近单卡性能的90%,远高于传统架构60%-70%的水平。

据SemiAnalysis披露,华为云CM384基于384颗昇腾芯片构建,可提供高达300 PFLOPs的密集BF16算力,接近达到英伟达GB200 NVL72系统的两倍。

而这一技术,便是在美国持续技术封锁的背景下取得的突破,硅基流动基于该平台部署的DeepSeek-R1模型实现了单卡解码吞吐1920Tokens/s,与英伟达H100部署性能相当。

英伟达霸主地位将遭遇最强挑战。

华为的迅猛崛起已经引起英伟达高层的高度警觉,今年以来,英伟达CEO黄仁勋已数次提起华为,并将华为视作最大的竞争对手之一。

黄仁勋近日还明确表示:“从技术参数看,华为的CloudMatrix 384超节点,性能上甚至超越了英伟达,比英伟达的尖端技术更具优势,因此我们必须高度重视这家实力雄厚的公司,全力以赴应对挑战。”

黄仁勋的这番表态,被业界视为美国AI芯片巨头对中国竞争对手技术实力的首次公开认可。

全球算力市场格局有望被重构!

对于华为来说,CloudMatrix 384的野心远不止于技术对标,而是规划着中国科技产业参与全球规则制定的深层战略,正如华为在5G通信领域制定标准一样。

接下来华为将通过超节点架构倒逼行业放弃“单卡性能竞赛”,将竞争焦点转向集群效率、TCO(总拥有成本)和生态协同度。

这就意味着,过去紧盯制程工艺、单卡算力、显存容量的方向接下来要发生变化了,算力集群的有效利用率、断点恢复速度和生态协同度才是未来关注的方向,先进工艺真不重要了。

同时华为还要以集群优势吸引AI企业加入昇腾体系,形成硬件-软件-模型闭环,目前华为开发者规模超1200万,伙伴数量4.5万,云商店应用1.2万,正在打造可与CUDA抗衡的替代方案。

很显然,在华为等中国科技公司的努力下,接下来的算力世界大战,中国厂商将首次站到制定规则的位置上,随着CloudMatrix 384的上线计划推进,全球AI产业垄断将彻底被打破!

山庄提示: 道行不够,道券不够?---☆点此充值☆
 
在线jjybzxw

UID: 551814


发帖
167724
金币
273165
道行
2004
原创
2404
奖券
2775
斑龄
35
道券
1005
获奖
0
座驾
设备
摄影级
在线时间: 38174(小时)
注册时间: 2008-10-01
最后登录: 2025-07-12
只看该作者 沙发  发表于: 06-18
  任正非在专访中提到的华为芯片技术策略,以及华为CloudMatrix 384超节点的介绍,揭示了华为在全球AI算力市场中的重要地位和战略布局。以下是对这一情况的总结:

  1. 技术差距与创新策略:

  - 任正非承认华为在单芯片技术上落后美国一代,但他强调华为通过“用数学补物理”、“非摩尔补摩尔”、“用群计算补单芯片”的创新思想来弥补这一差距。

  2. 超节点+集群系统:

  - 华为成功开发了“超节点+集群”系统算力解决方案,特别是CloudMatrix 384超节点,这是全球最大的AI超节点,标志着华为在AI算力领域的重大突破。

  3. 性能对比:

  - CloudMatrix 384的性能显著优于英伟达的NVL72,其算力高达300PFlops,比英伟达高出67%,内存带宽是英伟达的2.1倍,互联带宽达到2.8Tbps,断点恢复时间缩短至10秒级。

  4. 技术路径选择:

  - 尽管单颗昇腾芯片性能约为英伟达GPU的三分之一,但华为通过超大规模集群设计实现了系统级突破,依托6812个400G光模块构建的超高速互联网络,提升了数据流动效率和训练效率。

  5. 业界认可与竞争:

  - 英伟达CEO黄仁勋公开认可华为的技术实力,并将其视为最大的竞争对手之一。他认为华为的CloudMatrix 384在性能上甚至超越了英伟达。

  6. 全球市场格局变化:

  - 华为的CloudMatrix 384不仅在技术上对标英伟达,更是规划着中国科技产业参与全球规则制定的深层战略。华为计划通过超节点架构引导行业竞争焦点从单卡性能转向集群效率、总拥有成本和生态协同度。

  7. 生态建设与替代方案:

  - 华为正在打造可与CUDA抗衡的替代方案,以集群优势吸引AI企业加入昇腾体系,形成硬件-软件-模型闭环。目前华为开发者规模超过1200万,伙伴数量4.5万,云商店应用1.2万。

  综上所述,华为CloudMatrix 384的推出预示着全球AI产业垄断格局将被打破,中国厂商将首次站到制定规则的位置上。这不仅是技术上的突破,也是中国在全球科技产业中影响力提升的重要标志。

如何不发帖就快速得到金币道行
 
在线姜谷粉丝

UID: 1569053

精华: 2
级别: 玉清道君

发帖
144180
金币
263582
道行
20030
原创
756
奖券
185
斑龄
0
道券
0
获奖
0
座驾
设备
摄影级
在线时间: 16767(小时)
注册时间: 2012-06-21
最后登录: 2025-07-12
只看该作者 板凳  发表于: 06-18
华为“用数学补物理”与黄仁勋表态解读
华为“用数学补物理”的含义
在芯片技术发展中,华为面临着美国技术封锁,单芯片技术落后美国一代的困境。在此背景下,华为技术团队提出了用数学补物理、非摩尔定律补摩尔定律、用系统补单点三大创新思想。“用数学补物理”是指基于实际可获得的芯片制造工艺,通过计算、存储和网络技术协同创新,开创计算架构,打造“超节点 + 集群”系统算力解决方案,以弥补物理层面(芯片制造工艺)的不足,在结果上达到实用状况。

华为超节点 + 集群系统的成果
华为打造的超节点 + 集群系统,即升腾 CloudMatrix384 超节点,是全栈 100% 国产化自研的全球最大 AI 超节点。

性能指标:该超节点由 384 张升腾算力卡组成,单集群算力高达 300PFlops,较英伟达 NVL72 的 180PFlops 高出 67%,内存带宽达到后者的 2.1 倍,互联带宽提升至 2.8Tbps,断点恢复时间缩短至 10 秒级,多项指标创下全球商用 AI 算力集群的新纪录。
技术路径:在单颗升腾芯片性能约为英伟达 Blackwell 架构 GPU 三分之一的情况下,华为依托 6812 个 400G 光模块构建的超高速互联网络,使数据在 384 张卡间近乎无损流动,训练效率逼近单卡性能的 90%,远高于传统架构 60% - 70% 的水平。
实际应用:据 SemiAnalysis 披露,华为云 CM384 基于 384 颗升腾芯片构建,可提供高达 300PFLOPs 的密集 BF16 算力,接近达到英伟达 GB200NVL72 系统的两倍。硅基流动基于该平台部署的 DeepSeek - R1 模型实现了单卡解码吞吐 1920Tokens/s,与英伟达 H100 部署性能相当。
黄仁勋的表态及影响
表态内容
黄仁勋明确表示,从技术参数看,华为的 CloudMatrix384 超节点,性能上甚至超越了英伟达,比英伟达的尖端技术更具优势,因此英伟达必须高度重视华为,全力以赴应对挑战。他还称先进工艺真不重要了。

影响解读
对行业的影响:华为的这一技术突破凸显了美国对高端芯片封锁的失败,意味着即使在芯片制造工艺受限的情况下,通过创新的系统架构和技术思路,也能实现强大的算力。这为全球芯片产业发展提供了新的思路,可能会促使更多企业探索非传统的芯片发展路径。
对华为的意义:CloudMatrix384 的成功不仅是技术上的突破,其野心远不止于技术对标,而是规划着中国科技产业参与全球规则制定的深层战略,正如华为在 5G 通信领域制定标准一样。同时,华为还以集群优势吸引 AI 企业加入升腾体系,形成硬件 - 软件 - 模型闭环,目前华为开发者规模超 1200 万。

如何不发帖就快速得到金币道行
 
我有我可以
快速回复
限120 字节
认真回复加分,灌水扣分~
 
上一个 下一个