DeepSeek系列模型引领AI技术新潮流
AI导读:
德邦证券研报指出,DeepSeek系列模型发布提升现有模型效率,降低训练成本,为国产算力卡带来机遇。国内外云厂商普及DeepSeek服务,动摇传统行业定式,推动AIDC建设。我国AI发展路线注重垂直应用,更具商业价值。
财中社2月6日电德邦证券最新发布的通信行业研报深度剖析了DeepSeek系列模型的发布及其在全球范围内的领先优势。研报指出,DeepSeek系列模型的推出显著提升了现有模型的效率,预示着高端算力卡对于模型发展的重要性或将逐渐减弱,为国产算力卡及相关产业链条带来了前所未有的发展机遇。
据DeepSeek技术报告显示,DeepSeek-V3的总训练成本仅为557万美元,远低于Anthropic CEO所提及的GPT-4o等模型的高昂训练费用。这一成本优势不仅体现在DeepSeek-V3上,还体现在其快速部署和易用性上。例如,1月27日发布的DeepSeekJanus-Pro系列模型中的1B版本,仅需128颗英伟达A100训练一周即可完成。而随着英伟达最新GB200产品的推出,DeepSeek系列模型有望进一步提升性能。
2025年2月4日,DeepSeek系列多个模型正式上线昇腾社区,用户可一键获取模型,并在昇腾硬件平台上实现开箱即用和快速推理部署。这一举措极大地降低了模型应用的门槛,推动了AI技术的普及和发展。值得注意的是,DeepSeek系列模型均为开源模型,其技术优势有望迅速惠及整个行业,推动全球算力需求的持续增长。
国内外云厂商已经迅速响应,开始普及DeepSeek系列大模型的服务。这一趋势不仅动摇了通过增加算力密度和规模推动模型发展的传统行业“定式”,还有助于推动AIDC(人工智能数据中心)的建设。同时,DeepSeek系列中的“小模型”发布也为端侧应用带来了新机遇。
在性能评测方面,DeepSeek-V3多项成绩超越了其他开源模型,并与世界顶尖的闭源模型不分伯仲。其API服务定价也极具竞争力,使得更多企业和个人能够负担得起高质量的AI服务。此外,DeepSeek Janus-Pro系列模型在文本生图指令执行能力方面也表现出色,进一步彰显了DeepSeek系列模型的技术实力。
从大模型发展方向来看,我国与美国存在显著差异。美国更专注于通用大模型的发展,而我国则更加注重AI的垂直应用。这一发展路线不仅更符合市场需求,也更具商业价值。近年来,我国政府工作报告中多次提及“AI+”,并出台了一系列相关政策支持AI技术在金融、教育、医疗等领域的应用。同时,地方政府也在积极布局未来产业,深化“人工智能+”行动,加快布局人形机器人、量子信息、类脑智能等新产业新业态。
综上所述,DeepSeek系列模型的发布标志着AI技术又迈上了一个新的台阶。随着技术的不断进步和应用场景的不断拓展,AI技术将为人类社会带来更多的便利和价值。
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。