推广 热搜: ???  ????  content=  校长  时期  日方  裂缝  创新  小品  药厂 

华为亮家底,首次公开昇腾芯片未来3年计划,高管曝光与DeepSeek合作细节

   日期:2025-09-18 20:30:50     来源:搜狐科技    浏览:0    评论:0    

出品|搜狐科技

作者|杨锦

一向遮遮掩掩的神秘的昇腾900系列芯片,第一次被华为系统又具体地公之于众。

9月18日,在上海世博中心,上千人的华为全联接大会现场,华为副董事长、轮值董事长徐直军难掩激动地公布了昇腾芯片未来3年的演进计划。

未来3年,华为将以每年一迭代地节奏,推出昇腾950、昇腾960及昇腾970三代芯片,最早的昇腾950系列将于明年一季度上市。

华为最大的算力追赶目标及对手英伟达,在年初的GTC大会上,也公布了三年计划:Blackwell Ultra、Rubin和Feynman三代芯片。换句话说,未来3年,他们在高端市场的较量将更为激烈,算力在华为的战略地位也正在上升。

徐直军逐一讲解了昇腾芯的技术参数,亮出了代表着华为最先进计算战斗力的家底。

“算力将是中国人工智能的关键”,徐直军表示,要讲算力,首先要讲芯片,昇腾芯片是华为AI战略的基础,

昇腾芯片一向甚少对外,这次为何大尺度披露技术细节?一位华为内部人士对搜狐科技表示,他们今年陆续收到一些客户反馈,表示希望了解华为芯片更清晰、更长期的战略,这是比较重要的原因之一。

昇腾950、960、970系列首次亮相,未来3年每年一迭代

2025年第一季度,华为发布昇腾910C芯片。目前,910B/910C也是昇腾主要在推的产品。

徐直军还提到了华为与DeepSeek的合作细节。他说,DeepSeek的爆火,让所有的大模型训练者有了不少不眠之夜,也对华为带来了巨大的冲击。“从春节开始,华为云夜以继日协助 DeepSeek接入全球用户,一直到4月底,终于把910B/910C的推理能力调试到符合客户要求的水平。”

按照华为公布的计划和目标,未来3年,华为将直接跳过930、940,以每年一迭代的节奏,陆续推出昇腾950、昇腾960、昇腾970系列芯片,支持华为自研低成本HBM技术。

这三代芯片,将主要在算力、规模、互联带宽等核心性能上进行升级。

其中,昇腾950系列算力分别达到1P和2P,互联带宽相比昇腾910C提升了2.5倍,达到2TB/s。这颗芯片将在2026年一季度推出,首先支持的产品形态是标卡和超节点服务器。

规划中的芯片Ascend 960,在算力、内存访问带宽、内存容量、互联端口数等规格上相比再950翻倍,将在2027年四季度推出。

最后一颗是970,计划在2028年四季度推出,这颗芯片的一些规格华为还在讨论中。总体方向是:在各项指标上大幅度升级,全面升级训练和推理性能。目前的初步规划是,相比960,它的FP4算力、FP8算力、互联带宽要翻倍,内存访问带宽至少增加1.5倍。

单颗算力不敌英伟达,超节点集群补短板

由于受到美国制裁的原因,华为的芯片无法在台积电投片,与当前最先进的芯片制造工艺无缘,这导致昇腾的单颗芯片的算力迟迟无法和英伟达拉平。

一位人形机器人公司的工程师告诉搜狐科技,他们公司目前主要使用昇腾910B芯片做训练芯片,“推理还不太行,因为算力太慢了。”

也有AI厂商对搜狐科技表示,昇腾910B/910C芯片是能够用来作为推理芯片使用的,只不过需要优化。

北京大学SCOW算力系统平台的一位老师对搜狐科技透露,华为和英伟达性能还有大概百分之二三十的差距。他们之前主要使用英伟达芯片,这几年,华为给学校捐赠了大量硬件,“华为与英伟达的芯片使用占比基本五五分了。”

有研报指出,当前国产算力芯片呈现“哑铃型”结构,高端市场被英伟达的产品垄断,华为在单颗芯片的性能与英伟达还存在代际差距。

以昇腾910B为例,这颗芯片的算力4096 TFLOPS(每秒浮点运算次数,也被称为每秒峰值速度),低于H100的6240 TFLOPS,内存带宽为600GB/s ,远低于H100的2039GB/s。

华为清醒地认识到,中国半导体制造工艺将在相当长时间处于落后状态,它试图通过超节点集群、新物理材料的应用等动作,来弥补这一短板。

群在物理学中是指元素的集合,要曲线突围,最大的创新当属“超节点+集群”算力解决方案。

超节点由多台机器组成,但逻辑上以一台机器学习、思考、推理。华为发布的最新超节点产品 Atlas 950 SuperPoD和Atlas 960 SuperPoD,分别支持8192及15488张昇腾卡,官方称是全球最强算力的超节点。

搜狐科技在现场看到了颇受关注的昇腾384超节点,华为ICT集群业务某员工告诉搜狐科技,这一集群集成了 384 颗 910C 芯片,售价在1-2 亿元人民币。

搜狐科技了解到,华为还在物理层面应用了光缆材料,相比打英伟达的铜缆,光的传播更快,能够实现低时延和高带宽的目标。

硅基流动政企商业化负责人吴凡对搜狐科技表示,他们和华为云联合推出的解决方案,用昇腾 384 超节点加上硅基流动SiliconLLM推理框架,其核心性能已经能够比肩英伟达的H100 部署。

内容由网友发布或转自其他网站,如有侵权及其他问题,请发送邮件至jiyuwang@qq.com,我们将第一时间处理。
 
打赏
0相关评论

推荐图文
推荐资讯
点击排行
网站首页  |  关于我们  |  联系方式  |  使用协议  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报
Powered By DESTOON