DeepSeek吹嘘其模型在智能代理领域超越旗舰产品——彭博社
bloomberg
DeepSeek在一月份凭借强大且低成本的R1震撼了硅谷。
摄影师:Andrey Rudakov/BloombergDeepSeek发布了一款旧模型的更新版本,该公司表示该版本在关键基准测试中超越了具有开创性的R1,使这家中国初创公司在业界等待其下一代旗舰产品时仍保持竞争力。
DeepSeek在周四的微信文章中表示,V3.1能够更快地回答查询,并标志着该公司在创建AI代理方面迈出了第一步。该公司本周早些时候首次概述了V3.1,但该平台刚刚才登陆Hugging Face门户网站。该公司在另一条消息中表示,该版本已针对下一代国产AI芯片进行了定制优化。
DeepSeek在一月份凭借强大且低成本的R1震撼了硅谷,此后一直处于中国AI发展浪潮的前沿。周四,该公司还概述了针对历史更悠久的V3模型更新的新定价方案,在某些情况下提高了价格并取消了夜间折扣费率。不过,该公司降低了特定使用场景的费用。这些变更将于9月6日生效。
深度求索的模型已对OpenAI等美国行业巨头发起挑战,展现了中国企业无需最尖端半导体仍能在人工智能领域取得重大突破的实力。
继续阅读:深度求索"科技狂人"正撼动美国在AI领域的主导地位
业界观察者正期待R1迭代产品的发布——该产品原定于年初面世。国内媒体将延期归因于创始人梁文锋精益求精的态度,尽管他同时仍在运营其盈利丰厚的高飞资产管理公司。亦有猜测认为训练或开发过程中存在技术障碍。
与此同时,从阿里巴巴集团到腾讯控股的竞争对手们正以疯狂节奏推进AI模型的开发与更新。其中阿里巴巴的通义千问模型尤其受到市场追捧。
继续阅读:中国量化奇才在基金暴跌阴影中创立深度求索