DeepSeek被称为AI界拼多多,训练2个月仅花费了557.6万美元!
- 发布于:2025-01-28 14:19:27
- 来源:360直播吧
1月28日讯 据钱江晚报报道,此次DeepSeek-V3在AI行业引发关注,关键的原因在于——超低的预训练成本。
“预训练”是AI大模型学习中的一种方法,指的是通过海量的数据,训练一个大模型。训练时需要大量的数据和算力支持,每次迭代可能耗资数百万至数亿美元。
官方技术论文披露,DeepSeek-V3在预训练阶段仅使用2048块GPU训练了2个月,且只花费557.6万美元。这个费用是什么概念?
据报道,GPT-4o的模型训练成本约为1亿美元。简单粗暴地说,这相当于DeepSeek-V3比同等性能的AI大模型,降了十几倍的成本。
早在2024年5月,深度求索发布DeepSeek-V2时,就曾因给模型的定价太过于便宜,开启了中国大模型的价格战,被称之为“AI界的拼多多”。
“相比于说它是‘拼多多’,它更像小米,贴近成本定价,并且自产自销。”马千里认为,训练成本比较低的原因,离不开深度求索团队自研的架构和算力,他们自身的算力储备可以与大厂比肩,并且更注重底层的模型。
“ChatGPT走的是大参数、大算力、大投入的路子,DeepSeek-V3的路径用了更多的巧思,依托数据与算法层面的优化创新,从而高效利用算力,实现较好的模型效果。”马千里说道。

- 体育战报 | 南昌马拉松赛事定档11月9日开跑,沿用“一江两岸”特色路线
- 体育战报 | 门票开售!开启一段难忘的黄埔网球之旅2025年广州黄埔国际网球公开赛暨国际男子职业网球挑战赛ATP100
- 体育战报 | 身边陈玺如:期待将羽毛球带进一百所学校
- 体育战报 | 巴黎世锦赛:安赛龙宣布退赛,国羽众将均获种子席位
- 体育战报 | “全民健身日”,一起健身动起来!
- 体育战报 | 勇者草原,驰骋天路!达因2025尚义草原天路越野跑盛大开跑
- 体育战报 | 一对破三夫妻跑者和他们共同坚守的长期主义
- 体育战报 | 法拉利前车手谈汉密尔顿:塞纳和舒马赫从来不会说出这样的话
- 体育战报 | 扎耶德慈善跑北京站启动报名,9月21日鸣枪
- 体育战报 | 2025中网公开赛开票,男单决赛将于国庆节当天日场进行

- 英超 | 加克波:我把英超冠军奖牌送给父亲新赛季红军要争欧冠冠军
- 欧冠 | 队报:夺欧冠后巴黎一改无球星集体原则,公开声援登贝莱夺金球
- 欧冠 | 弗兰克:拜仁能在欧冠争冠&热刺还缺乏能量麦迪逊重伤后需要引援
- 英超 | 阿兰希勒:利物浦新赛季能卫冕,曼联排名将低于切尔西难返欧冠
- 中超 | 中超还剩十轮要跟本赛季说再见球星海港有武磊成都也有人
- 中超 | 阿奇姆彭:这场比赛我们就想着拿三分,在精神层面上做得更好
- 中超 | 后防不设防深圳新鹏城近3轮共计失球11个,失球数全中超最高
- 中超 | 海港穆帅气势够足!“想象一下,如果明天申花队输球了”
- 中超 | 上海德比申花增开票啦!氛围又被拉满就看能否破北京国安记录
- 中超 | 家人遭辱骂!20岁国青红星心态崩了手指看台+与大连球迷激烈互喷