AI基础设施厂商潞晨科技通过官微发布展望,表示公司将集中资源聚焦高创新业务,拒绝盲目跟风和低效投入,加速核心产品迭代。针对近期舆论热点,潞晨科技已与当事人建立友好沟通,并对任何未来可能的合作持开放态度。此前四天,潞晨科技突然宣布将停止提供DeepSeek API服务。
根据潞晨科技创始人尤洋之前的言论,停服的关键可能是成本问题。然而,在宣布停服当天,DeepSeek通过知乎官方账号发布了《DeepSeek-V3/R1推理系统概览》技术文章,透露在某种条件下,理论上的成本利润率高达545%。这一天本该是鼓舞人心的一天。
过去一个多月来,由于DeepSeek的引流作用和模型开源的优势,接入DeepSeek大模型的基础设施厂商持续增加。尽管DeepSeek可能具备盈利能力,但这些搭上算力接入DeepSeek的基础设施厂商是否面临成本压力,或者能否将流量转化为可持续现金流仍存疑问。
关于545%的成本利润率,DeepSeek在文章中详细解释了计算依据。假设GPU租赁成本为2美元/小时,总成本为87072美元/天。V3和R1模型使用H800 GPU,白天部署推理服务,晚上减少节点用于研究和训练。在24小时内,输入token总数为608B,其中342B tokens命中KVCache硬盘缓存,输出token总数为168B。收入方面,所有tokens按R1模型定价计算,理论上一天总收入为562027美元。但实际上,由于V3定价更低且夜间有折扣,实际收入会低于理论值。
R1于1月20日上线,定价为:输入费用每百万tokens 1元(缓存命中)或4元(未命中),输出费用每百万tokens 16元。自2月26日起,DeepSeek推出错峰优惠活动,夜间时段R1价格降至原价25%。V3于去年12月26日上线并同步开源,其输入费用为每百万tokens 0.5元(缓存命中)或2元(未命中),输出费用为每百万tokens 8元。在优惠期内,V3的价格进一步降低,夜间时段降至原价50%。