
本站网报道(文/黄山明)在人们已经对AI越来越习以为常的今天,AI相关的基础建设也随之快速发展,不论硬件上的数据中心、GPU/TPU、超级计算机、高速网络以及分布式存储系统,还是软件层面的开发工具、操作系统以及数据管理工具等,都将因此而受益。
不管是美国的5000亿美元的“星际之门”计划,还是欧盟达到2000亿欧元的InvestAI计划,亦或是日本的10万亿日元投资,以及国内超过万亿元的投入,都证明对AI技术的看好。不过近期,阿里巴巴及高盛都开始提出对AI基础设施的风险预警,AI相关设施开始过剩了吗?
阿里巴巴与高盛的警告
前不久,阿里巴巴主席蔡崇信在香港举行的汇丰全球投资峰会上表示,开始看到人工智能数据中心建设出现泡沫苗头,美国的许多数据中心投资公告都是“重复”或相互重叠的。
无独有偶,日前高盛的分析师团队下调了机架级AI服务器(Rack-level AI Server)的销量预期,将2025年级2026年预计出货量从3.1万台和6.6万台下调至1.9万台和5.7万台。高盛给出的理由是,高性能AI服务器的需求不会被机架级形态完全取代,因为一些客户仍然倾向于使用主板解决方案,以获得设计上的灵活性。
因此高盛方面表示,尽管今年二季度对中国台湾的ODM/散热供应链而言是需求强劲的季度,但全年而言,对出货量持更为保守的态度,并且预计产品的转型期可能会在今年三季度对出货量造成影响。
对此,高盛下调了中国台湾ODM和散热供应链相关的公司,包括广达、鸿海、FII、纬创、艾维克、双鸿等企业的目标价,降幅在7%-21%之间。不过高盛也表示,ASIC AI服务器相关企业表现普遍优于GPU AI服务器供应商,这一趋势可能将持续。
除了阿里和高盛外,前不久微软对市场进行回应,表示本财年超过800亿美元用于AI基础设施建设的计划仍然在进行中,努力的冲淡此前微软取消在美国“数百兆瓦”容量的数据中心租约的传闻。
要知道微软在今年1月份才刚刚决定豪掷800亿美元用于建设AI数据中心,并表示其中超过一半的资金会投向美国本土。但此次的回应中尽管表示计划仍将继续,但微软可能会在某些地区战略性地调整基础设施的步伐或规模。
不过在前不久,微软方面透露将于今年年中在马来西亚推出首个云区域,涵盖三间被命名为“马来西亚西部云”的数据中心,并计划于今年第二季度开始营运,这或许是其计划调整的一环。
另一方面,由OpenAI所主导的1000亿美元的星际之门基础设施合资企业第一个数据中心综合体,将可以容纳多大40万片的英伟达AI芯片。据开发商Crusoe称,该项目位于得克萨斯州小城阿比林,建设工作将于2026年年中完成,功率容量为1.2GW。
更有趣的是,虽然此前微软已经宣布将对投资方向进行调整,但就在前几天,微软宣布和贝莱德、英伟达以及马斯克的xAI一起,共同建设价值300亿美元的数据中心和其他AI基础设施。
以此来看,美国的AI基础设施建设仍然在狂奔,不仅没有停止,而且还有加速的意思。而随着阿里和高盛的警告,是否意味着AI算力设施真的已经到了快要溢出的程度了?
AI算力设施已经溢出?国产产业链受益
如果要论AI算力设施是否已经溢出,可以先来看什么是机架级AI服务器。这是一种以整机柜为单元设计的高密度、高性能AI计算系统,专为大规模人工智能训练和推理任务优化设施。简而言之,就是通过整个多个计算节点,实现的高密度算力集群。
打个比方,英伟达的DGX GB200 NVL72机柜包含18个1U计算节点,每个节点搭载2颗Grace CPU和4颗B200 GPU,总计72颗GPU和36颗CPU,再通过NVLink-C2C互连技术实现高速协同,形成单一逻辑GPU的算力池,这就是一种机架级AI服务器。
而高盛方面也表示,普通高性能AI服务器的需求不会被机架级形态完全取代,因为一些客户仍然倾向于使用主板解决方案,以获得设计上的灵活性。甚至AI推理服务器的需求是在增长的,高盛报告显示,预计2025年-2026年销量将增长41%、39%。
显然,这意味着主要是高端的AI算力设施目前确实受到了影响,但普通的AI服务器仍然在高速增长中。为何会出现这种情况,这就与DeepSeek的出现密切相关了。
简而言之,DeepSeek的出现给了AI技术发展另一条路,即优化算法的方式,来实现同样的AI技术水平,而不单单只是简单的堆砌算力。一边是价格越来越昂贵的显卡,另一边则是普通AI服务器也能够实现的技术,市场会如何选择一目了然。
加上如今美国方面不仅开启了星际之门计划,微软、贝莱德、英伟达、xAI等企业又开始另起炉灶,从技术路径来看,就像蔡崇信所言,几乎是“重叠”的,这显然加剧了高端AI服务器的冗余,并且其高昂的费用,可能很少会有开发者能够承担。
相比之下,DeepSeek的出现,让相关开发者能够以更低的成本来完成AI应用,借助工具链可以将算法部署周期从3个月压缩至7天,DeepSeek-V3模型训练成本仅557.6万美元,是GPT-4的1/20。短期来看,未来两年,由DeepSeek主导的金融、医疗、制造领域将贡献约1200亿元增量市场。
与此同时,国内的算力基建迎来发展窗口期。尽管性能上还无法与英伟达的产品相比,但胜在成本更低,性能也已经够用。
因此,DeepSeek的轻量化模型与低成本特性推动国产芯片大规模适配,包括华为昇腾910B、沐曦MTT S4000、天数智芯天垓100、海光信息DCU等16家厂商完成模型部署。
其中华为昇腾与硅基流动联合发布的DeepSeek推理服务首次实现与英伟达A100性能对标,燧原科技部署数万张自研加速卡,推理成本降低40%。以华为昇腾910B为例,支撑2000万日活需2.78万张GPU,而硬件成本超38亿元,有望将这款产品的市占率从16%提升至25%。
不仅成本下降,同时效率还得到了提升。例如中国电信“息壤”平台实现全栈国产化推理,联通云支持私有化与公有化部署自由切换,三大运营商算力价格战推动单价下降27%,利用率提升1.8倍。
即便是提出预警的阿里,此前也宣布,在未来三年将投入超过3800亿元,用于建设云和AI硬件基础设施,总额超过去十年总和,这也创下中国民营企业在云和AI硬件基础设施建设领域有史以来最大规模投资纪录。
高盛方面预计,阿里的3800亿支出,约80%将用于AI服务器,其余部分将用于通用服务器、数据中心基础设施及其他业务板块。而在AI服务器投资中,约73%用于GPU,27%用于其他硬件。显然,AI设施真的过剩了吗?至少阿里自己投入。
写在最后
如今在国内,服务器整机上,有浪潮信息、中科曙光、宁畅、安擎、华鲲振宇、新华三、智谷算网等厂商充分竞争,算力芯片上,海光信息、寒武纪、华为等都已经开始站稳市场。包括完备的工业制造能力,以及强大的技术设施建设,加上DeepSeek推动的低成本AI应用,国内的AI产业还远未到瓶颈,或者说还处于爆发的前期。
相比之下,OpenAI如今越来越庞大的算力集群,以及更加昂贵的API费用,让AI只能为少数人服务。而微软为了构建独立的AI能力,不惜与贝莱德、xAI另起炉灶,但其AI基建项目与星际之门项目没有太大区别,唯一影响的,可能是未来美国的AI费用会越来越贵了吧。