面临巨亏风险?有公司宣布暂停DeepSeek API服务,圈内在争什么?
专题:DeepSeek开源周来了
一篇DeepSeek披露利润率的文章却引来两家科技创业公司创始人“大打出手 ”。
3月1日,风头正劲的国产AI公司深度求索(DeepSeek)官方账号发布名为《DeepSeek-V3 / R1 推理系统概览》 ,在文章最后透露,“如果所有 tokens 全部按照 DeepSeek R1 的定价计算,理论上一天的总收入为56.2027万美元 ,成本利润率 545% 。当然我们实际上没有这么多收入,因为V3的定价更低,同时收费服务只占了一部分,另外夜间还会有折扣。”
这是DeepSeek官方首次公布成本利润率情况 ,此文一出,有网友在评论区@尤洋(编注:北京潞晨科技有限公司董事长)。
今年2月9日,尤洋曾在微博发文称 ,“MaaS (Model as a Service,编注:模型即服务,一种云计算服务模式)在中国短时间内可能是最差的商业模式 。阿里云/百度云/腾讯云等相互内卷低价和免费 ,满血版的DeepSeek R1每百万token官方也只能收到16元……如果满血版的DeepSeek R1每日输出1000亿token,那么每月的机器成本是4.5亿,亏损4亿!用户越多 ,亏损越多。现金流能撑住吗?除非有免费的机器,但没有长久免费的午餐。”
2月28日,尤洋在回应网友提问“伯克利尤洋计算后认为卖DeepSeek API (MaaS)月亏损4亿 ,计算是否正确?离低成本有多远? ”时再次强调,“结论:这个东西按照2025年2月初的状态不可能盈利。亏损来源:1. 测试速度和实际场景的差距 。2. 机器利用率峰值和波谷的巨大差距。3. 机器的不稳定性。”
DeepSeek成本和收益
在被多名网友@后,3月1日,尤洋发文称 ,文章中的数据对计算MaaS成本没有任何参考价值,把DeepSeek网页,APP和MaaS API的token数加在一起计算 ,“我春节期间用过几次,问一个问题,然后说繁忙 ,让我稍后尝试,我等了15分钟或者一个小时 。这本就不是一个合格的MaaS产品。”
3月1日下午,潞晨科技官微发文宣布将暂停DeepSeek API服务 ,“潞晨云将在一周后停止提供DeepSeek API服务,请尽快用完您的余额。如果没用完,我们全额退款 。”
不过尤洋在3月2日凌晨又重新编辑,并强调“DeepSeek出圈前,2025年1月2日我就在微博上说过DeepSeek是中国最好的模型。我对DeepSeek没有任何贬低。我最开始就是抨击那些倒卖DeepSeek API去赔本赚吆喝的中小云厂商,然后吹嘘自己推理快10倍 。现在我被友商引导到跟DeepSeek去对立。我说过 ,DeepSeek是很好很好的模型。 ”
根据潞晨科技微信公号,公司致力于解放AI生产力 ,通过高效多维并行、异构内存管理 、大规模优化库、自适应任务调度等自研技术,打造面向大模型时代的通用深度学习系统 Colossal-AI,高效促进AI大模型落地应用 ,助力企业低成本实现AI智能化产业升级 。潞晨两大产品Video Ocean和潞晨云已累计服务用户数超10万,公司付费客户总数突破2476家,其中包括4家世界500强企业和10家上市公司。公司2024年营收达7700万元。预计至2025年营收达1.5亿元 ,2026年预期增至3亿元。2月12日,潞晨科技宣布完成最新一轮融资,北京经济技术开发区产业升级股权投资基金参与本轮投资 。
不仅仅是尤洋 ,在前述DeepSeek文章下面,硅基流动创始人袁进辉回复写道,“DeepSeek 官方披露大规模部署成本和收益,又一次颠覆了很多人认知。现在很多供应商还做不到这个水平 ,主要是V3/R1架构和其它主流模型差别太大了,由大量小Expert 组成,导致瞄准其它主流模型结构开发的系统都不再有效 ,必须按照DeepSeek报告描述的方法才能达到最好的效率,而开发这样的系统难度很高,需要时间 ,幸好这周DeepSeek五连发已经把主要模块开源出来了,降低了社区复现的难度。”
3月1日早间,尤洋再次发文称 ,“本人昨天情绪太冲动,说了一些让人误解deepseek infrastructure团队的话 。deepseek infrastructure团队技术一流并给开源社区做出巨大贡献。本人诚挚道歉,已经删除不当表述 ,感谢大家提醒!”
值得注意的是,在2月初,袁进辉与尤洋两人就DeepSeek成本问题有过争论,袁进辉当时在朋友圈发文认为尤洋用了错误的架构进行估计 ,尤洋在微博写道,“回复一下袁进辉老师:我的测算已经考虑了很多很多用户把机器占满,单用户数字更难看。其实你就弄400台机器 ,看看每日能否输出1000亿满血DeepSeek R1 token,让我看看 。或者40台机器能否输出满血400亿DeepSeek R1 token。不能的话,都是巨亏。我们用事实说话 。 ”
这场原本还是围绕DeepSeek成本的讨论 ,在尤洋发出一篇名为《坑人的硅基流动》而“画风大转”,这篇已经被删除的文章提及,“这家公司疑似组织水军在网上长期黑我。今天DeepSeek有一篇文章指向我 ,他也在那里煽风点火。”
袁进辉随后对尤洋的多点问题进行回应,并在文末直言硅基流动被潞晨科技抄袭,只是为了给对方留个面子没有公开 。尤洋也在朋友圈回应称 ,“代码都是潞晨CTO负责的,抄袭代码事件后,璐晨CTO离职,加入了袁进辉老师的公司。你说可笑不可笑? ”
3月2日下午 ,被提及的原潞晨科技CTO方佳瑞也回应称,尤洋公司被袁进辉指出存在两次公开抄袭事件,尤洋想把第一次抄袭甩锅嫁祸于我 ,但铁证如山,本人身正不怕影子斜。
硅基流动官网显示 ,公司致力于打造规模化、标准化 、高效能的生成式AI计算基础设施平台,提供模型云服务平台SiliconCloud、大语言模型推理引擎SiliconLLM、高性能文生图/视频加速库OneDiff等产品,助力企业和个人用户高效、低成本部署AI模型。2月1日 ,硅基流动宣布,大模型云服务平台 SiliconCloud首发上线基于华为云昇腾云服务的 DeepSeek-V3 、DeepSeek-R1 。
两人在争什么?
两人这波争论源于DeepSeek公布的“成本利润率545%”。首先来看这个数字是怎么计算出来的 ,文中提到,“假定 GPU 租赁成本为 2 美金/小时,总成本为 $87072/天……理论上一天的总收入为 $562,027” ,即545%的成本利润率仅仅是基于GPU的租赁成本。
尤洋在此后一篇解释的文章中指出,“DeepSeek这篇文章的数据是建立在大量用户把DeepSeek的APP和网页完全超负荷占满的情况下,不是一个常规的MaaS 。阿里通义千问也很好 ,Kimi Chat也很好,豆包也很好,我不确定DeepSeek对他们是否有不可逾越的技术壁垒。 ”
尤洋认为 ,因为MaaS是ToB的,延迟和稳定性要求极高。要想留住客户,不能有任何疏忽 。要想每日稳定输出1000亿token ,需要准备输出5000亿token理论能力的机器。因为接的APP越多,机器利用率就越不可预测。
“时刻掉线或者延迟超过15分钟的MaaS哪个产品敢用?要不然为何各种大小云厂商全都要推出一体机吗?因为一体机是独占的,是最稳定的 。”
尤洋认为 ,MaaS是ToB的,是服务APP,最大的问题是机器利用率的不确定性以及自己没有模型壁垒而承受的低毛利负毛利价格战。
袁进辉在DeepSeek回复中也提到,现在很多供应商还做不到这个水平 ,主要是V3/R1架构和其它主流模型差别太大了,“必须按照DeepSeek报告描述的方法才能达到最好的效率,而开发这样的系统难度很高 ,需要时间,幸好这周DeepSeek五连发已经把主要模块开源出来了,降低了社区复现的难度。”
在两人讨论最集中的知乎平台上 ,有不少网友认为尤洋和袁进辉的说法都有一定道理,袁进辉点赞的一篇关于DeepSeek成本讨论文章中写道,“DeepSeek收入估计肯定是虚高非常多的 。因为这是所有业务的综合数据 ,官方并没有披露 API 的收费业务占了多少,其次,这里的价格是按R1计算的 ,官方也没有说V3/R1在真实业务中的比例。但是,考虑到他们至少有将近 6 倍的利润,如果 V3:R1 用量是 2:1,那么只要 API 业务是免费用户业务的六分之一 ,DeepSeek 就能收支平衡。 ”
值得注意的是,去年还在深度求索任职的罗福莉,在2024年5月曾在知乎发文提到 ,“大家不用担心模型断更,也不用担心API涨价(目前就是大规模服务的价格,不亏本 ,利润率超50%)。”