从DeepSeek爆火看算力基建的发展与布局

发布时间:2025-04-27     稿件来源:《群众·决策资讯》     作者:温建功 李红娟    

DeepSeek,中国人工智能大模型的新里程碑,自20251月上线以来受到全球关注,不仅引爆了新一轮的人工智能应用热潮,更是在短期内引发了市场对人工智能大模型企业巨额算力资源投入的广泛质疑,触发美股部分算力相关科技股的剧烈震荡,在全球算力产业界掀起波澜。算力芯片领域的巨头英伟达,其股价在127日暴跌约17%,市值瞬间蒸发近6000亿美元,这一跌幅创下了美国历史上单日市值跌幅的新纪录,截至3月上旬,英伟达已经较1月的市值高点跌去了约一万亿美元。深度求索公司(DeepSeek)推出的系列开源大模型之所以备受业界关注,主要在于其提供了高性能且成本低廉的训练方案,这引发了业界对算力基础设施深度投资和价值利用的新思考,对整个算力产业产生了广泛而深远的影响。

引发新一轮人工智能热潮

ChatGPT引爆人工智能大模型概念以来,全球大模型规模和数量不断增加,其性能也实现了显著提升。然而,相应的人工智能大模型规模的训练成本也在急速上升。在DeepSeek出现之前,以中美为代表的多个人工智能企业均选择在大模型算力基建上进行超高投入,被外界形象地称为AI领域的军备竞赛

一般来说,降低人工智能大模型训练和应用成本的方法有二:一是依赖于计算设备设施的技术革新或硬件成本下降,通过计算效率的提升来降低成本,例如,以英伟达为代表的算力芯片供应商通过软硬件技术的进步推动芯片计算效率的提升,但芯片计算效率的提高也可能导致芯片价格等硬件成本的增加。二是靠大模型技术优化和算法革新,以减少训练所需的计算资源或时间成本。

DeepSeek选择的是第二种。202412月,DeepSeek-V3正式发布,作为一款强大的MoE(混合专家模型)语言模型,DeepSeek-V3在数学、代码等任务上表现出色,甚至能与一些闭源大模型如GPT-4oClaude-3.5-sonnet相媲美。据官方技术论文披露,DeepSeek-V3的训练成本仅为557.6万美元,远低于其他大型语言模型。20251月发布的DeepSeek-R1是推理模型,擅长处理复杂任务,其在数学、代码、自然语言推理等任务上比OpenAI-o1,小模型超越o1-mini;并且DeepSeek团队将R1推理能力蒸馏到更小的模型中,让小模型在保持高性能的同时,更易于部署。

DeepSeek-R1发布后,在无任何广告投放的情况下,DeepSeek APP7天内便实现了1亿用户增长,迅速跃升为全球增速最快的AI应用,各行各业掀起了DeepSeek大模型的适配和接入应用潮。在算力芯片领域,华为、摩尔线程、英特尔、英伟达等企业迅速响应,不仅宣布了DeepSeek大模型的适配与上线计划,还推出了具备DeepSeek大模型本地部署能力的算力芯片产品。在云服务领域,硅基流动宣布率先和华为云合作推出基于腾云的DeepSeek-R1&V3的推理服务,其他厂商诸如阿里云、腾讯云、浪潮云等也纷纷加入战局;在互联网领域,腾讯系软件如微信、腾讯文档、腾讯元宝、QQ浏览器等纷纷宣布接入DeepSeek-R1满血版,同时,三大运营商、各大手机厂商及新能源汽车厂商也迅速跟进,接入了DeepSeek-R1。在机构方面,多地政府在探索DeepSeek大模型的接入,各大金融机构、高等院校、大量中小企业等也陆续接入并开展AI应用。

相较于已有的推理型大模型,DeepSeek-R1的爆火有以下原因:一是高效能DeepSeek大模型在模型效率上实现了质的飞跃,大幅削减了训练和推理成本,进一步降低了人工智能的应用门槛。同时,凭借创新技术,确保蒸馏后的小模型依然保持卓越性能,便于在低成本环境下实现本地部署。二是开源生态深度求索公司选择了开源之路,于2月中旬连续五日公开五大核心代码库及详尽技术文档,迅速吸引全球AI开发者的密切关注。开源策略不仅加速了各行各业的快速接入,还使得开源的蒸馏小模型获得和部署更为便捷,从而极大地提升了行业影响力,拓宽了应用范围。三是本土化适配DeepSeek大模型针对中文语境或特定行业需求(如合规性、数据安全)进行了一定程度的优化,在中文NLP(自然语言处理)任务中表现优于国际通用型,在网络爆火后,短时间内吸引了大量用户尝试使用,并进一步造成了二次广泛传播,彻底激活国内人工智能市场。

对短期算力市场形成波动

实事求是地说,DeepSeek的横空出世与相关算力科技股的短期波动之间,并不存在单一的因果关系,而是受到多重因素的共同影响。2024年第四季度财报显示,美股七姐妹(苹果、谷歌、亚马逊、微软、Meta、特斯拉、英伟达)中的部分企业增长不及预期,加之云服务业务供给增长放缓,进一步加剧了投资者对人工智能领域巨额投资回报前景的担忧,进而引发了市场对过去几年人工智能行业泡沫的担忧。但股市波动显示了市场普遍对人工智能需要更高算力堆砌的说法的质疑,各类大模型的高价收费和会员费难以支撑其核心卖点,短期内AI大模型领域掀起了新一轮的降价潮,阿里云、腾讯、字节跳动、智谱等国内厂商均宣布其旗下的模型API降价。

深度求索公司的开源策略也刺激了各类大模型企业:阿里云开源了全尺寸多模态的阿里万相大模型(Wan2.1),3月初又开源了QwQ-32B推理模型,后者展现出与DeepSeek-R1(激活参数37B/总参数671B)相匹敌的性能;百度宣布将开源下一代文心大模型;字节跳动豆包大模型团队联合北京交通大学等开发的视频生成实验模型VideoWorld正式开源;月之暗面Kimi宣布开源大模型MoonlightOpenAl向包括免费用户在内的所有用户开放了o3-mini的使用权限,并且未来也计划对免费用户开放GPT-5

DeepSeek通过算法优化,使得原本在大模型训练领域占据绝对主导地位的英伟达系列算力芯片失去了压倒性优势,而且DeepSeek模型在其他算力芯片上的表现同样出色,且成本更低,这为国产算力芯片的发展带来了积极的影响。

长期看智算供需均将保持增长

深度求索公司通过一系列技术创新和开源策略,提出了以算法驱动为核心的大模型训练和推理新模式,推动了人工智能应用向着高效率、低成本和普惠化方向演进。长期看,人工智能应用和智能算力均将保持高速增长态势。

人工智能扩张算力需求将持续增长短期内,DeepSeek对算力市场造成了一定冲击,特别是对算力基础设施大规模投入的成效提出了挑战。然而,从宏观和长远视角来看,DeepSeek所引发的人工智能热潮及其与各行业的深度融合,将促进算力资源需求的持续增长,并加速算力从通用向智能的转变进程。微软首席执行官纳德拉尝试用杰文斯悖论(Jevons Paradox)来解释这一现象,即当技术进步提高了效率,资源消耗不仅没有减少,反而激增,如瓦特改良的蒸汽机让煤炭燃烧更加高效,但结果却是煤炭需求飙升,又如福特的流水线让汽车制造更快、更便宜,直接影响却是全球石油消耗的猛涨。

当下,人工智能大模型成为新质生产力的重要代表,全球人工智能大模型的数量和参数规模迅速膨胀,多模态大模型的出现进一步推高了算力需求,AI越强大,参与者越多,应用越广泛,整体对算力资源的需求也将越高。尽管DeepSeek通过算法和技术进步在一定程度上提升了大模型训练和推理的效率,但这种效率的提升也吸引了更多的参与者,降低了大模型本地化部署的门槛,从而促进了更多大模型的构建与训练。此外,这新一波的人工智能浪潮激发了各大人工智能大模型企业的技术进步,使得算力全产业链得到了赋能升级,再加上各行业多样化的需求,进一步推动了算力资源需求多样性的提升。可见,人工智能技术的普惠化将驱动算力需求侧的爆发式增长,也就是说,DeepSeek等大模型越好用,越可能推动算力的过度扩张,形成效率提升需求激增资源消耗的循环。

国家算力基建持续推进智算转型占比提升2025年的国务院《政府工作报告》指出:持续推进人工智能+行动,将数字技术与制造优势、市场优势更好结合起来,支持大模型广泛应用,大力发展智能网联新能源汽车、人工智能手机和电脑、智能机器人等新一代智能终端以及智能制造装备。该政策显示我国正积极推动人工智能技术在实体经济中的深度应用,DeepSeek引领的人工智能浪潮,将成为推动我国算力基础设施建设的重要力量。在十四五规划期间,我国在全国算力基础设施领域进行了一系列战略布局。2022年,东数西算工程正式启动,着力构建全国一体化算力网,目前已布局的八大国家枢纽节点和十大国家数据中心集群在有序建设中。20243月,工业和信息化部等七部门印发《推动工业领域设备更新实施方案》,提出要推动云边端算力协同发展,加大高性能智算供给,在算力枢纽节点建设智算中心;同年10月,《关于加快公共数据资源开发利用的意见》印发,文件进一步提出要聚焦算力网络和可信流通,支持数据基础设施企业发展,更加明确了我国算力产业的重点任务是聚焦算力网络建设应用和智算中心应用。根据工业和信息化部统计数据,截至20249月底,我国在用算力中心超过880万标准机架,算力总规模达268EFLOPS(每秒百亿亿次浮点运算,以FP32单精度计算)。人工智能热潮使得智能算力的需求猛增,正促使算力基础设施向智能领域转型。国际数据公司(IDC)和浪潮信息联合发布的《2025中国人工智能计算力发展评估报告》测算显示,2025年中国智能算力规模将达到1037.3EFLOPS预计到2028年将达到2781.9EFLOPS20232028年期间,中国智能算力规模的五年年复合增长率预计达到46.2%

算力供给多元化发展本地化部署步伐加快DeepSeek热潮带火算力供给市场。随着算力需求的急剧增长及其多元化趋势,算力供给方迎来了前所未有的市场机遇和发展空间。人工智能大模型应用门槛的降低,也降低了人工智能对高端算力芯片的需求,激活了中国算力芯片市场,打破了美国试图用封锁高端算力芯片出口来维持技术代差的如意算盘。众多国产AI芯片厂商正积极行动,一方面加速DeepSeek模型在智算中心的适配与部署,推出智能算力集群产品;另一方面,致力于研发推理芯片,以满足日益增长的市场需求。DeepSeek为国内人工智能算力芯片企业带来了新机遇,也是我国人工智能自主可控道路上的重要节点。在数据敏感的行业领域,DeepSeek大模型的广泛部署促进了本地化部署的实践,这不仅有助于保护数据隐私,还能构建私有知识库,并且降低模型使用的成本。在本地化部署方面,人工智能大模型一体机相比人工智能服务器部署来说具有更高的定制化自由度,减少了企业成本和时间,近期多家企业陆续发布AI一体机产品。据浙商证券测算,20252027年智算一体机的市场需求将达1572万台,市场规模突破5200亿元。

展望未来,随着人工智能技术的不断进步和与实体经济的深度融合,对智能算力的需求将持续增长,而算力的供给也将朝着更加多样化和智能化的方向演进。

(作者单位:清华大学互联网产业研究院)

         责任编辑:何乐

【加入收藏】    【打印此文】     【关闭】
分享到:
无标题文档