界面新闻记者 | 宋佳楠
2月26日 ,明星大模型公司DeepSeek宣布即日起在北京时间每日00:30至08:30的夜间空闲时段,大幅下调API调用价格,其中DeepSeek-V3降至原价的50% ,DeepSeek-R1更是低至25%,降幅最高达75% 。该公司称,这一举措旨在鼓励用户充分利用夜间时段,享受更经济 、更流畅的服务体验。
这并非DeepSeek首次调整API价格。去年8月 ,DeepSeek曾将API输入费用下调至0.1元/百万tokens,输出费用为2元/百万tokens,引发行业震动 。
然而在2月初 ,由于服务器资源紧张,DeepSeek一度暂停API服务充值,直至2月25日才重新开放 ,并调整了DeepSeek-chat模型的调用价格,为每百万输入tokens 2元,每百万输出tokens 8元。
如果与豆包和通义千问的调用价格进行对比 ,会发现正常时段下,豆包大模型的价格相对较低,通义千问不同模型价格有差异 ,而DeepSeek在标准时段价格相对较高,但在优惠时段价格有较大幅度下降,具有一定竞争力。
以豆包通用模型pro-32k为例,后付费模式下 ,推理输入0.0008元/千Tokens、推理输出0.002元/千Tokens,模型推理的综合价格为0.001元/千Tokens;预付费模式下,10K TPM的包月价格为2000元 ,平均价格为0.0046元/千Tokens。
通义千问的qwen1.5-110b-chat模型,输入价格为0.007元/千Tokens,输出价格为0.014元/千Tokens;qwen-72b-chat输入和输出价格均为0.02元/千Tokens;Qwen-VL-Plus输入价格为0.0015元/千Tokens;Qwen-VL-Max输入价格为0.003元/千Tokens 。
参考之前DeepSeek的调用价格 ,优惠时段内DeepSeek-V3百万Tokens输入(缓存命中)为0.25元,百万Tokens输入(缓存未命中)为1元,百万Tokens输出为4元;DeepSeek-R1百万Tokens输入(缓存命中)为0.25元 ,百万Tokens输入(缓存未命中)为1元,百万Tokens输出为4元。
DeepSeek的降价策略有助于进一步降低中小企业和个人开发者的使用门槛,推动AI技术的普及。此前 ,DeepSeek的降价曾引发行业连锁反应,包括阿里云、百度 、腾讯等头部企业纷纷跟进,宣布各自的降价措施 。此次夜间优惠是否会再次掀起价格战,还要看其他大模型公司的进一步动作。
DeepSeek推出优惠措施之时 ,正值其“开源周”。首个开源的代码库为针对Hopper GPU优化的FlashMLA,第二日是首个用于MoE模型训练和推理的开源EP通信库DeepEP,26日则开源了一个支持密集和MoE GEMM的FP8 GEMM 库 ,为V3/R1训练和推理提供支持 。
另据媒体报道,DeepSeek计划提前发布新一代AI模型R2,预计在编程能力、多语言推理等方面有所提升 ,还可能在图像生成、语音识别和合成等多模态方面有所升级。R2模型的发布或进一步巩固DeepSeek在AI领域的地位,并推动新一轮的技术革新。