《南华早报》:中国深度求索公司推出夜间AI服务75折优惠,因需求激增致服务器承压
Wency Chen
总部位于杭州的中国人工智能(AI)明星企业深度求索(DeepSeek)宣布推出新的折扣计划,针对日间服务器资源因高需求承压的情况,在非高峰时段通过应用程序接口(API)访问其模型将享受价格优惠。深度求索于周三公布了新费率,将于周四午夜后生效。
北京时间凌晨0:30至上午8:30期间,V3模型的API访问费用将享受50%折扣。具体为:缓存命中每百万token收费0.035美元,缓存未命中每百万token收费0.135美元,输出内容每百万token收费0.55美元。
该初创公司的R1推理模型在同一时段将提供75%的折扣。目前两款模型在非高峰时段定价相同。
两款模型的上下文长度(模型单次可处理的token最大数量)均为64,000个token。在AI领域,token指算法处理的基本数据单元,可以是一个词、数字甚至标点符号。深度求索根据模型处理的输入和输出token总数向用户计费。
相比之下,OpenAI的o1推理模型定价为:输入token每百万15美元,缓存输入token每百万7.5美元,输出token每百万60美元,其上下文长度达200,000个token。