DeepSeek掀起AI大模型热潮，国产算力厂商纷纷适配

期货要闻 2025-02-05 22:37:04 来源：每日经济新闻作者：网络

AI导读：

DeepSeek近期成为资本市场热议话题，其官方网页和App访问量飙升。多家国产AI算力厂商宣布适配DeepSeek，满足庞大推理算力需求，推动AI商业化落地进程提速。

近期，资本市场掀起了一股前所未有的热潮，焦点直指Deepseek（深度求索）。从美国硅谷的科技巨头到中国大街小巷的普通民众，DeepSeek已成为人们热议的话题，其对AI大模型行业所带来的深远影响不容忽视。

随着DeepSeek话题的持续升温，其官方网页和App的访问量也水涨船高。新用户如潮水般涌入，导致“深度思考”和“联网搜索”等功能在高峰期时常遭遇“服务器繁忙”的提示。然而，值得庆幸的是，目前已有包括华为昇腾、壁仞科技、天数智芯、摩尔线程、沐曦在内的多家国产AI算力厂商宣布成功适配DeepSeek，这无疑为DeepSeek用户带来了福音。

壁仞科技的工作人员在接受《每日经济新闻》采访时表示：“尽管DeepSeek在结构上有所创新，但它仍属于LLM（大语言模型）范畴，因此推理适配起来并不困难。”

DeepSeek的火爆也引发了庞大的推理算力需求。据中信建投研报显示，DeepSeek的网页端访问量从2024年10月的245万迅速增长至12月的1101万。而自2025年1月10日DeepSeek官方App上线以来，仅用了18天时间，其日活跃用户量便突破了1500万大关。

2月4日，天数智芯通过其官方微信号宣布，在AI技术日新月异的今天，芯片技术已成为推动行业发展的关键。DeepSeek R1的横空出世，犹如一道闪电划破了长空，不仅强势突破了长期以来的技术壁垒，更为中国AI行业注入了全新的活力。同日，天数智芯与Gitee AI携手发布消息，宣布在双方的高效协作下，仅用一天时间便成功完成了与DeepSeek R1的适配工作，并正式上线了多款大模型服务，如DeepSeek R1-Distill-Qwen-1.5B、DeepSeek R1-Distill-Qwen-7B、DeepSeek R1-Distill-Qwen-14B等。

天数智芯副总裁宋煜在2月5日接受《每日经济新闻》采访时透露：“天数智芯的产品是通用GPU，在芯片设计的技术路线上与国际主流路线相近。在软件生态层面，天数的IXUCA软件栈兼容国际主流生态，因此适配DeepSeek的V2、V3、R1、Janus等模型版本非常顺利。”他进一步介绍道：“目前天数已经完成了V3、R1、Janus等模型的推理适配工作，并在公开数据的精度测试上与论文结果相当。适配成功后，天数与Gitee AI、并行计算、算力互联等合作伙伴共同上线了多款大模型服务。”

无独有偶，华为计算也在2月4日宣布，潞晨科技与昇腾携手合作，联合发布了基于昇腾算力的DeepSeek R1系列推理API及云镜像服务。次日，华为官方微信号披露，DeepSeek-R1、DeepSeek-V3、DeepSeek-V2、Janus-Pro已正式上线昇腾社区，支持一键获取DeepSeek系列模型，并在昇腾硬件平台上实现开箱即用、推理快速部署，为用户带来更快、更高效、更便捷的AI开发和应用体验。

摩尔线程同样在2月4日宣布，作为国产全功能GPU的创新企业，摩尔线程已快速实现对DeepSeek蒸馏模型推理服务的高效部署，旨在赋能更多开发者基于摩尔线程全功能GPU进行AI应用创新。

从华为昇腾、天数智芯到摩尔线程，这些算力厂商均针对DeepSeek的推理服务进行了适配。随着DeepSeek带来大模型访问量的激增，推理芯片市场或将迎来爆发式增长。

浙商证券指出，DeepSeek训练和推理成本的大幅降低将降低大模型和用户侧的准入门槛，这不仅将加速模型侧的迭代速度，还将推动“低成本+高性能”的模型加速企业和个人用户对AI Agent、AI应用等的使用，从而显著推动AI商业化落地进程的提速。在此背景下，推理环节的算力需求将得到进一步激发。

壁仞科技等算力厂商以及优刻得等云服务厂商也强调了推理效率的重要性。壁仞科技认为，推理效率已成为当前行业各公司发展的核心竞争力。凭借壁仞科技自主研发的壁砺TM系列产品的出色兼容性能，仅用数小时便完成了对DeepSeek R1全系列蒸馏模型的支持，涵盖了从1.5B到70B各等级参数版本，包括LLaMA蒸馏模型和千问蒸馏模型。这为开发者提供了高性能、低成本的大模型部署与开发解决方案。

关于国产算力芯片适配DeepSeek的重要性，天数智芯副总裁宋煜表示：“目前，在大模型生态中，训练部分主要依赖CUDA+NVIDIA GPU，国产GPU的适配仍需取得突破。与DeepSeek的合作将加速国产GPU芯片的深度学习框架优化、算子优化、分布式训练适配，降低国产AI企业的迁移成本，从而打造‘国产算力+国产大模型’的闭环生态。”

宋煜认为：“DeepSeek等国产大模型厂商的成功离不开强大的算力支持。我们的目标是提供稳定、可扩展、性价比高的GPU解决方案，推动国产大模型更快迭代、更高效部署。未来，我们可以进一步深化合作，包括联合优化AI训练框架、开发定制化AI加速方案以及更高效的分布式推理引擎等。”

（文章来源：每日经济新闻）

郑重声明：以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息，本站对其观点、判断保持中立，不保证该内容（包括但不限于文字、数据及图表）全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议，据此操作，风险自担。股市有风险，投资需谨慎。如对该内容存在异议，或发现违法及不良信息，请发送邮件至yxiu_cn@foxmail.com，我们将安排核实处理。