关于DeepSeek及其经济实惠的人工智能模型:QuickTake - 彭博社
Saritha Rai, Newley Purnell
仅成立一年的中国人工智能初创公司DeepSeek在硅谷引起了轰动和震惊。其开创性的人工智能模型展现出的性能可与世界上最好的聊天机器人相媲美——而且只需支付极少的成本。
DeepSeek可能为广泛认为人工智能的进一步发展将需要越来越多的计算能力和电力的观点提供了反驳。
考虑到这一点,DeepSeek的炒作在1月底导致全球科技股下跌。投资者担心模型之间的价格竞争加剧,以及对硬件供应商业务的压力。
DeepSeek应用程序的标志。照片:Lam Yik/Bloomberg### DeepSeek究竟是什么?
DeepSeek于2023年由量子对冲基金High-Flyer的创始人梁文峰创立。该公司在开源基础上开发其模型。程序代码因此可以由开发者社区进行审核并进一步开发。该公司的移动应用在1月初发布后迅速登上美国iPhone下载排行榜的榜首。
与OpenAI的 ChatGPT等聊天机器人不同,该应用程序在提供对输入的回答之前,会将其论证过程清晰地呈现给用户。根据DeepSeek的说法,模型R1的性能可与OpenAI的最新版本相媲美。该初创公司为对开发聊天机器人感兴趣的个人提供许可证。他们可以以远低于OpenAI对类似产品的收费的价格使用该技术。
DeepSeek R1 与 OpenAI 或 Meta AI 相比如何?
根据 DeepSeek 的说法,R1 在多个领先的基准测试中——如 2024 年数学测试 AIME、常识测试 MMLU 和 AlpacaEval 2.0 的问答测试——几乎与竞争模型一样好或更好。此外,该模型在 聊天机器人竞技场 的排行榜上也是顶尖表现者,该网站与 加州大学伯克利分校 合作,邀请使用 AI 模型。
尽管该公司没有提供确切的数字,但 DeepSeek 模型的训练和开发成本似乎仅占 OpenAI 或 Meta Platforms 最佳产品所需成本的一小部分。
显著更高的效率质疑了对像 Nvidia 等公司最新和最强大的 AI 加速器的高资本支出需求。关于美国对向中国出口最新芯片的限制也引发了疑问,这些限制应该会阻止 DeepSeek 这样的突破。
视频播放器正在加载。加载: 0%进度: 0%* 字幕设置,打开字幕设置对话框
- 关闭字幕,已选择
这是一个模态窗口。
对话窗口的开始。按Esc将取消并关闭窗口。
文本
颜色白色黑色红色绿色蓝色黄色品红青色透明度不透明半透明背景
颜色黑色白色红色绿色蓝色黄色品红青色透明度不透明半透明透明窗口
颜色黑色白色红色绿色蓝色黄色品红青色透明度透明半透明不透明字体大小
50%75%100%125%150%175%200%300%400%文本边缘样式
无凸起凹陷均匀阴影字体系列
比例无衬线等宽无衬线比例有衬线等宽有衬线休闲脚本小型大写字母对话窗口结束。
广告
中国的DeepSeek正在让人工智能界感到恐慌
1:11
视频:这家中国人工智能初创公司DeepSeek震动了硅谷。汤姆·麦肯齐解释了原因。
是什么在美国引发警报?
华盛顿禁止向中国出口高端技术,如GPU芯片,以遏制该国在人工智能领域的进展——这是美国与中国在技术主导权争夺战中最重要的领域。
然而,DeepSeek的进展表明,中国的人工智能工程师成功地绕过了这些限制,专注于在有限资源下提高效率。尽管仍不清楚DeepSeek在多大程度上获得了先进的人工智能训练硬件,但该公司已经展示了足够的能力,表明贸易限制并未完全阻止中国的进步。
DeepSeek何时引起全球关注?
自2023年发布首个模型以来,这家人工智能开发公司一直受到密切关注。11月,该公司向世界展示了其DeepSeek R1推理模型,旨在模仿人类思维。该模型是其移动聊天机器人应用程序的基础,该应用程序与网络界面一起在1月作为更便宜的OpenAI替代品获得了全球知名度。科技投资者马克·安德森称DeepSeek R1为“人工智能的斯普特尼克时刻。”
移动应用程序 DeepSeek 截至 1 月 25 日已被下载约 160 万次,并根据市场观察者 App Figures 的数据,在澳大利亚、加拿大、中国、新加坡、英国和美国的 iPhone 应用商店中排名第一。
DeepSeek 的创始人是谁?
1985 年出生于广东的梁在浙江大学获得了电气与信息工程的学士和硕士学位。根据企业数据库 Tianyancha 的信息,他以 1000 万元(130 万欧元)的注册资本创立了 DeepSeek。
梁在接受 中国平台 36kr 的采访 时表示,进一步发展的瓶颈不在于获取更多资金。问题在于美国对获取最佳芯片的限制。
梁表示,他的大多数顶尖研究人员都是中国顶尖大学的应届毕业生。他认为,中国必须发展一个本土生态系统,类似于围绕 Nvidia 及其 AI 芯片建立的生态系统。
“更多的投资不一定会带来更多的创新。否则,大公司将会接管所有的创新,”梁说。
DeepSeek 在中国 AI 领域处于什么位置?
中国的科技巨头——从 阿里巴巴 和 百度 到 腾讯——在争夺硬件和客户以推动其 AI 项目方面投入了大量资金和资源。除了李开复的初创公司 01.AI(“Yi”)外,DeepSeek 以其开源方法而闻名,旨在快速获得最大的用户群,然后基于这个庞大的受众开发货币化策略。
在中国,最大的人工智能参与者之间已经出现了一个 价格战。在过去的一年半里,价格多次被降低。
这对全球人工智能市场有什么影响?
DeepSeek的成功可能迫使OpenAI和其他美国供应商降低价格,以保持他们的既有优势。但这也质疑了像Meta和 微软这样的公司的巨额支出,因为更高效的模型可以以更少的成本进行竞争。这两家公司今年承诺投资至少 650亿美元 — 主要用于人工智能基础设施。
这一情况使全球股市动荡不安,因为投资者抛售了像Nvidia和ASML这样的公司,这些公司从蓬勃发展的人工智能服务需求中受益。与DeepSeek相关的中国公司的股票,例如 Iflytek,则上涨。
全球开发者已经开始使用DeepSeek的软件进行实验,并试图开发工具。这可能会加速先进人工智能推理模型的推出,同时也引发了对其使用需要设定界限的额外担忧。DeepSeek的进展可能会加速监管,以控制人工智能的发展。
DeepSeek的弱点是什么?
与其他中国的AI模型一样,DeepSeek在涉及中国认为敏感的话题时会自我审查。例如,它会回避关于1989年天安门广场抗议活动的请求,或关于中国可能入侵台湾等地缘政治敏感问题。在测试中,DeepSeek机器人能够对政治人物如印度总理纳伦德拉·莫迪提供详细回答,但却拒绝对中国主席习近平做同样的事情。
由于其突然的受欢迎程度,DeepSeek的云基础设施可能会受到考验。该公司在1月27日短暂经历了一次较大故障,并且随着新用户和回访用户向其聊天机器人发送更多请求,它将不得不处理更多的流量。
原文文章标题:关于DeepSeek及其低成本AI模型的所有信息:QuickTake