AI导读:

德邦证券研报指出,DeepSeek系列模型发布提升现有模型效率,降低训练成本,为国产算力卡带来机遇。国内外云厂商普及DeepSeek服务,动摇传统行业定式,推动AIDC建设。我国AI发展路线注重垂直应用,更具商业价值。

财中社2月6日电德邦证券最新发布的通信行业研报深度剖析了DeepSeek系列模型的发布及其在全球范围内的领先优势。研报指出,DeepSeek系列模型的推出显著提升了现有模型的效率,预示着高端算力卡对于模型发展的重要性或将逐渐减弱,为国产算力卡及相关产业链条带来了前所未有的发展机遇。

据DeepSeek技术报告显示,DeepSeek-V3的总训练成本仅为557万美元,远低于Anthropic CEO所提及的GPT-4o等模型的高昂训练费用。这一成本优势不仅体现在DeepSeek-V3上,还体现在其快速部署和易用性上。例如,1月27日发布的DeepSeekJanus-Pro系列模型中的1B版本,仅需128颗英伟达A100训练一周即可完成。而随着英伟达最新GB200产品的推出,DeepSeek系列模型有望进一步提升性能。

2025年2月4日,DeepSeek系列多个模型正式上线昇腾社区,用户可一键获取模型,并在昇腾硬件平台上实现开箱即用和快速推理部署。这一举措极大地降低了模型应用的门槛,推动了AI技术的普及和发展。值得注意的是,DeepSeek系列模型均为开源模型,其技术优势有望迅速惠及整个行业,推动全球算力需求的持续增长。

国内外云厂商已经迅速响应,开始普及DeepSeek系列大模型的服务。这一趋势不仅动摇了通过增加算力密度和规模推动模型发展的传统行业“定式”,还有助于推动AIDC(人工智能数据中心)的建设。同时,DeepSeek系列中的“小模型”发布也为端侧应用带来了新机遇。

在性能评测方面,DeepSeek-V3多项成绩超越了其他开源模型,并与世界顶尖的闭源模型不分伯仲。其API服务定价也极具竞争力,使得更多企业和个人能够负担得起高质量的AI服务。此外,DeepSeek Janus-Pro系列模型在文本生图指令执行能力方面也表现出色,进一步彰显了DeepSeek系列模型的技术实力。

从大模型发展方向来看,我国与美国存在显著差异。美国更专注于通用大模型的发展,而我国则更加注重AI的垂直应用。这一发展路线不仅更符合市场需求,也更具商业价值。近年来,我国政府工作报告中多次提及“AI+”,并出台了一系列相关政策支持AI技术在金融、教育、医疗等领域的应用。同时,地方政府也在积极布局未来产业,深化“人工智能+”行动,加快布局人形机器人、量子信息、类脑智能等新产业新业态。

综上所述,DeepSeek系列模型的发布标志着AI技术又迈上了一个新的台阶。随着技术的不断进步和应用场景的不断拓展,AI技术将为人类社会带来更多的便利和价值。

DeepSeek系列模型相关图片