
4月24日,AI领域的目光聚焦在DeepSeek正式发布并开源的全新系列模型V4预览版本上。同时,高性能版DeepSeek-V4-Pro和轻量版DeepSeek-V4-Flash也一同推出。据官方披露股票学习网,DeepSeek-V4拥有百万字超长上下文,在智能体能力、世界知识和推理性能方面均在国内和开源领域保持领先。
人们讨论新模型性能的同时,另一个产业话题迅速升温——DeepSeek首次在官方技术报告中将华为昇腾NPU和英伟达GPU写入同一份硬件验证清单。这标志着万亿参数级别的模型首次在正式文档中完成了对国产AI芯片的“官方认定”。
长期以来,中国大模型厂商的训练与推理几乎全部依赖英伟达的GPU和CUDA生态,但DeepSeek-V4的发布打破了这一局面。如果顶级开源大模型能在华为昇腾生态上跑出不输于英伟达平台的推理性能,那么它将向整个行业释放一个信号:国产芯片已具备承载实际商业负载的能力。
在DeepSeek-V4发布前,市场上便传出其已提前适配华为昇腾950等国产AI芯片的消息。随着正式发布,可以确认该模型已经完成在昇腾NPU平台上的推理适配。以往大模型开发过程中,早期测试与适配往往优先开放给英伟达、AMD等美系芯片厂商。此次DeepSeek在模型阶段就推进国产算力适配,被视为路径上的重要变化。
昇腾芯片是国产算力阵营中的代表,也是华为整个AI战略的基础。2018年10月,华为全联接大会正式发布首款采用自研达芬奇架构的AI芯片昇腾910与昇腾310。其中,昇腾310是SoC小芯片,主要用于边缘计算;昇腾910则面向云端高性能计算。2019年昇腾芯片正式投入商用,但在公开市场的声量和产品节奏相对低调。
直到2025年9月,华为轮值董事长徐直军罕见公布昇腾芯片的演进和目标。他表示,未来三年,华为已经规划了多款昇腾芯片,包括950PR、950DT以及昇腾960和970。其中,950PR面向推理Prefill阶段和推荐业务场景,计划于今年第一季度推出;950DT则更注重推理Decode阶段和训练场景,计划于2026年第四季度推出。
从发布节奏来看,昇腾芯片将进入快速迭代和性能持续飙升的周期。不过,受限于先进制程的获取,华为单颗昇腾芯片的算力目前还难以直接与英伟达芯片竞争。为此,华为选择了一条不同的技术路径:通过“超节点+集群”的算力解决方案,将多颗芯片高效互联,以集成的方式满足持续增长的算力需求。
以芯片制程为例,在摩尔定律放缓的情况下,7纳米到3纳米每代性能提升不超过20%。而超节点可以将模型算力利用率从30%提升到45%,相当于提升了50%,通过资源的高效调度,在一定程度上弥补了芯片工艺代差。国内多家厂商均推出了类似的超节点方案。
昇腾950解决的是“能不能跑”,而Atlas 950 SuperPoD则解决了“能不能跑得更便宜、更大规模”。从价格看,DeepSeek V4-Pro每百万Tokens输入是1元,输出是12元,V4-Flash每百万Tokens输入是0.2元,输出是2元。DeepSeek明确表示,预计下半年昇腾950超节点批量上市并部署之后,Pro版本的价格也会大幅度下调。
据悉,华为Atlas 950 SuperPoD采用面向大规模AI训练场景的超节点架构设计,由8192张基于950昇腾加速卡构成,整套系统共计160个机柜,计划于2026年四季度上市。相较于英伟达同样将在下半年上市的NVL144,Atlas 950超节点卡的规模是其56.8倍,总算力是其6.7倍,内存容量是其15倍。不过,集群也面临能耗、占地等问题。
DeepSeek-V4属于典型的MoE模型,总参数规模达1.6万亿、激活参数49B,这对推理集群的规模和效率提出了极高要求。外界普遍认为,一旦昇腾950超节点批量上市,理论上将带来三重变化:吞吐能力显著提升,单位Token成本下降,国产算力供给规模化。
DeepSeek-V4适配昇腾的消息也让国产算力产业链站上了聚光灯下。根据市场研究机构IDC最新发布的报告,2025年中国AI加速卡市场总出货量达到约400万张,其中国产芯片合计出货约165万张,市场份额首次突破四成,跃升至41%。英伟达以55%市场份额排名第一,此前市场份额高达95%。
在国产阵营中,华为出货量达81.2万张,占据国产芯片总出货量的近一半,占全市场约20%的份额。阿里巴巴旗下的平头哥以约26.5万张位列第二,百度昆仑芯与寒武纪各约11.6万张,并列第三。
知名调研机构Bernstein Research发布报告指出,受外部出口管制持续加码等因素影响,2026年以华为昇腾为首的国产AI芯片市占率有望首次超过50%,预计到2028年,中国本土AI芯片产量即可覆盖国内需求,供应需求比例预计达到104%。
从产业链的价值分布来看,最核心的环节是服务器整机制造。AI芯片必须被物理集成到服务器中,才能进入算力中心、云厂商和政企客户。根据中商产业研究院分析师预测,2026年市场规模将达到2859亿元。
围绕服务器整机制造,昇腾产业链分为三层:最内层是服务器整机制造商,获单最为直接;中间层是由CANN架构为核心的软件生态,决定厂商的生态黏性;最外层是上游材料和元件供应商,包括覆铜板、交换机、高速铜连接模组等。
在整机制造环节,华鲲振宇是华为生态中唯一同时获得“鲲鹏+昇腾”双领先级认证的企业,其“天宫”系列AI服务器已量产并进入多个省级智算中心。A股上市公司中,神州数码旗下神州鲲泰自有产线是华为昇腾生态的重要整机硬件伙伴。拓维信息则是华为鲲鹏、昇腾、鸿蒙的全方位合作伙伴。
在上游材料和组件领域,也有关键企业深度嵌入昇腾产业链。例如,华丰科技是华为高速背板连接器的核心供应商,作为第一大客户,在去年贡献了超60%的收入。
伴随昇腾芯片从910C向950的升级,超节点架构对交换芯片、交换机和铜连接等环节的需求大幅提升。华泰证券研报判断2026年为“国产超节点元年”,并测算到2028年国产超节点市场空间有望达到3414亿元,2026年至2028年的年复合增长率高达194%。
如果说硬件性能的突破是基础,那么软件生态就是昇腾能否长期繁荣的关键。CANN作为昇腾的软件层,其生态主导权正在演变为关键竞争壁垒。中国移动2026年—2027年人工智能超节点设备集中采购项目已开标,采购规模为6208张AI加速卡,总金额约20.6亿元,中标文件明确全线采用华为CANN生态方案。这是三大运营商在集团层面首次启动AI超节点设备集采,标志着运营商级基础设施正在加速接入国产CANN生态。
产业链机遇的背后也有变数,其中算力供给瓶颈是最关键的不确定性。昇腾芯片的产能能否跟上爆发式需求股票学习网,将直接决定整条产业链的订单能否如期兑现。这场由DeepSeek与昇腾共同点燃的算力变革,才刚刚拉开序幕。
联华证券提示:文章来自网络,不代表本站观点。