深度求索展示V3、R1模型实力,理论毛利率高达545% | 南华早报
Wency Chen
中国科技初创企业深度求索在"开源周"每日技术项目收官时大胆宣布:得益于先进的技术优化,其在线推理服务在24小时运行中实现了惊人的545%利润率。
该公司周六发文称,从北京时间2月27日中午开始,其V3和R1推理模型的平均节点占用率达到226.75。每个节点由八块英伟达H800 GPU(图形处理器)组成,租赁成本为每小时每块GPU 2美元,总运营成本达87,072美元。
同期,这些模型共处理了6080亿输入token和1680亿输出token,包括来自网页、移动应用和API接口的用户请求。若按深度求索R1的定价模型计算,相当于创造了562,027美元收入,理论收益达545%。
节点是处理任务的独立计算单元,节点占用率反映其在推理请求期间的使用效率。在人工智能领域,token指算法处理的基本数据单位。深度求索根据模型处理的输入输出token总量向用户收费。
这家总部位于浙江杭州的企业今年凭借以远低于美国巨头成本构建的先进AI模型震撼科技圈。其技术突破导致英伟达等美国科技股市值蒸发数百亿美元,并引发港股中概科技股牛市行情。
01:20
中国阿里巴巴发布新AI模型,据称性能超越竞争对手Deepseek和OpenAI的GPT-4o
中国阿里巴巴发布新AI模型,据称性能超越竞争对手Deepseek和OpenAI的GPT-4o
DeepSeek周六在GitHub和知乎平台发帖澄清,成本与收益数据"纯属理论推算"。由于V3模型定价更低、两款模型均提供大幅非高峰时段折扣以及免费聊天机器人服务,实际收益可能更低。