ChatGPT的神秘竞争对手DeepSeek创始人是谁?:播客 - 彭博社
K Oanh Ha, Yang Yang, Naomi Ng
深度求索创始人梁文峰
摄影师:VCG/Getty Images
精彩内容不容错过。立即订阅《亚洲大趋势》播客。
## 亚洲大趋势
中国AI革命的缔造者
18:32
尽管中国的深度求索在全球引发热议,但鲜有人了解其背后的男人——梁文峰。
在本期《亚洲大趋势》播客中,主持人K. Oanh Ha与彭博社的Saritha Rai对话,探讨这位带领深度求索站上AI技术前沿的科技创始人,以及该公司的崛起如何揭示AI霸主之争。
延伸收听:深度求索为何导致英伟达等科技股暴跌
原创视频:中国深度求索如何挑战AI巨头
立即通过苹果播客、Spotify或您获取播客的平台订阅《亚洲大趋势》。
*终端用户:点击此处订阅。*以下为经过简编辑的对话实录:
K. Oanh Ha: 今年早些时候,中国AI初创公司深度求索推出的新产品震惊全球,撼动了华尔街。
Tom Mackenzie: 中国的深度求索正在让AI界为之疯狂。随着其应用登顶下载榜,科技股应声下跌。
Ha: 但尽管引发全球关注,外界对深度求索背后的男人——中国企业家梁文峰知之甚少。
Saritha Rai: 梁文峰确实是个神秘人物。
Ha: 彭博社的Saritha Rai负责亚洲人工智能领域报道。
Rai: 他绝对是我见过最难以接近且最低调的科技企业家之一。为说明其低调程度——我们搜遍其官网都找不到任何照片,直到他在某次与习近平主席的高调会面中亮相,那张照片才让世人得以窥见其真容。
Ha: 这位神秘人物长什么样?
Rai: 身材清瘦,戴眼镜,但话不多
Ha: 娃娃脸?
Rai: 是的,可以这么形容。
Ha: 深度求索以隐私为由鲜少回应关于梁文峰的问题。但Saritha和同事们对这个用AI系统颠覆科技界的男人充满好奇,于是他们采访了数十位知情人士:从前员工、同行研究员到投资人和业内知情者。
**Rai:**我们发现他确实极其低调、非常害羞,但同时也异常执着、才华横溢且充满激情。我认为他将深度求索视为一种使命,致力于让中国在人工智能领域占据一席之地,确保中国成为AI领域不可忽视的力量。
**Ha:**欢迎收听彭博新闻社《亚洲大动向》节目,我是Oanh Ha。每周我们将带您深入全球最大最具活力的经济体,解析推动这个瞬息万变地区的市场、商业巨头与企业动态。 今天节目的焦点是:梁文峰是谁?我们将揭秘这位带领深度求索站上AI前沿的神秘科技创始人。此外,这家公司的快速崛起对中美人工智能竞赛意味着什么?
**Ha:**Saritha,感谢参与节目。我对AI非常着迷,你们这期报道做得太精彩了。我们能否先从梁文峰的背景谈起?关于他的出身我们了解多少?
**Rai:**梁文峰现年40岁左右,出生于广东省一个名为米粒岭的小村庄。父母都是小学教师。他天资聪颖,先后在浙江大学完成本科及硕士学业。
Ha: 在浙大期间,梁文峰与同学们醉心于各类技术领域:机器学习、信号处理、电子工程。他们甚至在金融危机期间开发过股票交易程序。毕业后,梁与两位同窗联手创立了名为高飞管理的量化对冲基金。
Rai: 量化基金本质上是通过数学模型和统计分析进行股票交易,决策过程无需人工干预。巅峰时期,高飞管理公司管理的资产规模高达140亿美元,堪称大型基金。在其最成功的运营阶段,该基金为投资者提供的年化回报率平均达到35%。可以说,它确实表现非常出色。
**Ha:**据前员工透露,高飞公司有着极客风格的初创企业文化。早期招聘启事自豪地宣称吸引了来自谷歌和脸书的顶尖人才,并表示正在寻找具有"古怪才华"的数学与编程"极客"。
**Rai:**早期招聘中还提到了谢尔顿——美国著名情景喜剧《生活大爆炸》中那个极度社恐的主角
谢尔顿·库珀: 比如我哭是因为别人太蠢,这让我难过。
Rai: 谢尔顿拥有大批粉丝,其无意间展现的幽默令人捧腹。可以说,DeepSeek早期的整个企业文化都在试图复刻这种极客文化。那里有免费零食、扑克游戏之夜,所有人都穿着T恤和拖鞋上班。
**Ha:**听起来是个很棒的工作环境
**Rai:**是的,那确实是一种非传统的初创企业文化。与中国阿里巴巴、腾讯等科技公司的氛围截然不同。
**哈:**梁是如何从量化金融领域转型到人工智能并创立深度求索的?
**雷:**梁一直对机器学习和人工智能抱有非凡的热情。在OpenAI推出ChatGPT这个一夜之间风靡的聊天机器人后几个月——那是2023年春天,ChatGPT发布已过去数月——梁随即成立了深度求索。在其早期宣言中,深度求索提出要拒绝平庸,攻克人工智能领域的重大挑战,并最终实现通用人工智能的突破。
**哈:**宣言还阐明了深度求索的雄心——让中国成为尖端技术的引领者。
**雷:**梁极少接受采访,但已知的两次访谈中,他都谈到要将中国人工智能生态推向世界前沿。中国常被指责为模仿者,而他希望打造一个走不同道路的AI中国。
**哈:**深度求索进展神速。自2023年起,它发布了超过六款AI模型,并率先应用了稀疏化技术——使模型训练和运行更高效。开发者开始关注这家公司。接着在今年早些时候——
***大卫·古拉:***现在回到头条新闻,深度求索震撼全球科技界…
**雷:**当他们发布推理模型R1时,引发了行业巨震,导致股市万亿美元市值蒸发。世界这才真正开始关注这位神秘的中国AI创业者。
**哈:**那么萨里塔,深度求索的R1模型究竟有何突破性意义?
**雷:**直到最近,AI行业始终围绕着数十亿美元的基础设施投入——建设数据中心、配置用于训练模型的图形处理器。但深度求索证明了,其模型在某些基准测试中能媲美甚至超越OpenAI或Anthropic的最新模型,却仅需极少的算力资源。据该公司宣称,资金消耗也远低于行业巨头。
**哈:**梁博士团队如何实现这种低成本的真创新?深度求索的成功对中美AI竞赛意味着什么?广告之后为您揭晓。
**哈:**过去十年间,美国持续限制中国获取半导体技术。2022年及次年,随着华盛顿对北京实施两轮芯片出口管制,紧张局势达到顶峰。
***乔恩·埃利希曼:***英伟达等半导体企业股价今日暴跌,此前拜登政府宣布将加强对华AI芯片出口限制。据英伟达向彭博社透露…
**哈:**这限制了英伟达等美企的销售,其尖端芯片本是科技公司训练AI模型的关键工具。虽然给开发者带来巨大挑战,但正如彭博社萨里塔·雷所言,这也倒逼中国科技企业另辟蹊径。
Rai: 需求永远是创新之母。中国AI团队已证明了这一点——尽管面临出口管制,他们依然开发出能与全球顶尖水平比肩的优秀模型。
Ha: 而深度求索最创新的突破之一,正是我们先前提到的稀疏化技术。
Rai: 稀疏化的核心在于无需高端算力即可构建模型。当大语言模型不必整体运作来响应查询时,梁博士团队尝试将模型能力拆解为多个专家小组,仅调用所需模块。这种方式大幅提升了计算效率和成本效益。
Ha: 这就像人脑运作原理——不需要动用整个大脑,只需激活特定脑区进行处理?
Rai: 完全正确。就像不必激活所有脑细胞,只需调动存储特定专业知识的神经元集群,就能应对编程指令或解答问题。
Ha: 这项突破令同行瞩目,但真正引发轰动的还是成本优势。深度求索透露其V3模型训练仅耗资560万美元,远低于OpenAI开发最先进ChatGPT版本预估的1亿美元投入。
Rai: 目前这个数字确实引发了大量质疑,因为仅基础设施、模型训练、人才投入和时间成本加起来就是一笔巨额开支。因此这种怀疑不无道理。业内人士估算,深度求索公司若想实现这一目标,至少需要10亿美元甚至更多资金支持。
Ha: 深度求索的优势还在于,中国政府与习近平主席始终坚定支持这类AI初创企业。Saritha指出,习主席将生成式AI、机器人等高科技领域视为国家战略的重要组成,是实现关键技术自主可控的关键一环。深度求索的成功也促使阿里巴巴、腾讯、字节跳动等巨头纷纷推出自研AI模型。
Ha: Saritha,深度求索当前已完全开源其模型,这意味着任何个人或企业都能将其算法整合到自有程序中。该公司为何选择这种策略?其重要性何在?
Rai: 从某种层面看,开源可视为AI技术的民主化进程,使其在全球范围普及。但必须注意的是,若中国AI模型采用闭源模式且定价与OpenAI等西方公司相当,其国际接受度将大打折扣。通过低价策略,中国让全球用户能快速接触并使用这些模型,使其在商业和AI生态中迅速普及,从而实现对OpenAI等企业的弯道超车。这不仅是技术民主化,更是通过极致性价比让产品快速成为全球主流,从战略层面扼杀竞争对手生存空间的精明之举。
**哈:**因此,微软和亚马逊都在其云服务中提供了DeepSeek。DeepSeek的模型已被整合到Perplexity中,这是一个由AI驱动的搜索引擎,同时也提供来自OpenAI和Anthropic的模型。
**雷:**确实存在一个问题,即AI的发展速度有多快,全世界都担心所有控制权仅掌握在一两家公司手中。我认为这正是DeepSeek和其他公司试图向世界传达的信息,即所有控制权不能仅由一两家公司及其构建的专有模型掌握,应该更加民主。因此,我认为开源哲学的核心在于降低风险、分散权力,并让更多人能够使用更易获取的技术进行开发。
**哈:**在构建AI时,西方的方法与中国的方法之间是否也可能存在文化或价值观的冲突?
**雷:**非常明显,因为如果你看看DeepSeek的早期模型,甚至是未经调整或微调的模型,它们很大程度上是在中国的审查规则范围内运作的。例如,你不能问它关于台湾或习近平的问题,否则它只会给出非常平淡的官方答案。然而,如果你使用相同的模型,并用其他数据训练它,使其在文化上适应不同的地区,这正是DeepSeek早期学到的一点:通过开源模型,让开发者和用户有机会根据自己的文化背景进行定制,DeepSeek可以在全球范围内更快地获得采用,而不是通过严格控制,使其只能在全球范围内给出对中国友好的答案。
**哈:**尽管有人称赞中国在人工智能领域的创新,但许多人对这种成功抱有更阴暗的怀疑。美国众议院委员会4月的一份报告声称深度求索与中国政府存在"重大"关联,并断言该公司非法窃取了OpenAI的数据。中国驻美使馆驳斥这些指控毫无根据。而深度求索和梁家恩均未就国会报告置评。
**哈:**萨里塔,当前中美之间的人工智能竞争看起来确实像某种军备竞赛。
**莱:**这确实是场竞赛,但现在判定赢家为时过早。一年前我绝不会认为这是场势均力敌的较量。这是场马拉松,却需要短跑的速度。我们刚站在起跑线上,对任何赢得竞赛的国家来说,潜在经济收益都不可估量。因此各国尤其是中美都不愿在AI领域松懈。
**哈:**你认为深度求索目前面临哪些挑战?
**莱:**关键挑战在于下一步行动——如何超越已有成就。同时在国内市场,阿里巴巴、字节跳动、腾讯等企业开发的模型已超越深度求索的上代旗舰产品,这种竞争压力迫使他们必须做得更好。此外还存在商业模式问题:这类企业如何盈利?深度求索是否以盈利为目标?若想盈利又将通过何种途径?目前都没有明确答案。
本期节目由杨洋、娜奥米·黄制作,罗希特·帕塔克协助;奥斯汀·卡尔、黄哲平提供补充报道;高级制作人:娜奥米·沙文;编辑:帕迪·赫希、约书亚·布鲁斯坦;高级编辑:伊丽莎白·庞索特;副执行制作人:朱莉娅·韦弗,执行制作人:妮可·比姆斯特伯;音效设计/工程师:安田隆;事实核查员:娜奥米·黄。