ChatGPT的神秘竞争对手DeepSeek创始人是谁？：播客 - 彭博社

K Oanh Ha, Yang Yang, Naomi Ng

2025-05-22

深度求索创始人梁文峰

摄影师：VCG/Getty Images

精彩内容不容错过。立即订阅《亚洲大趋势》播客。

## 亚洲大趋势

中国AI革命的缔造者

18:32

尽管中国的深度求索在全球引发热议，但鲜有人了解其背后的男人——梁文峰。

在本期《亚洲大趋势》播客中，主持人K. Oanh Ha与彭博社的Saritha Rai对话，探讨这位带领深度求索站上AI技术前沿的科技创始人，以及该公司的崛起如何揭示AI霸主之争。

延伸收听：深度求索为何导致英伟达等科技股暴跌

原创视频：中国深度求索如何挑战AI巨头

立即通过苹果播客、Spotify或您获取播客的平台订阅《亚洲大趋势》。

*终端用户：点击此处订阅。*以下为经过简编辑的对话实录：

K. Oanh Ha: 今年早些时候，中国AI初创公司深度求索推出的新产品震惊全球，撼动了华尔街。

Tom Mackenzie: 中国的深度求索正在让AI界为之疯狂。随着其应用登顶下载榜，科技股应声下跌。

Ha: 但尽管引发全球关注，外界对深度求索背后的男人——中国企业家梁文峰知之甚少。

Saritha Rai: 梁文峰确实是个神秘人物。

Ha: 彭博社的Saritha Rai负责亚洲人工智能领域报道。

Rai: 他绝对是我见过最难以接近且最低调的科技企业家之一。为说明其低调程度——我们搜遍其官网都找不到任何照片，直到他在某次与习近平主席的高调会面中亮相，那张照片才让世人得以窥见其真容。

Ha: 这位神秘人物长什么样？

Rai: 身材清瘦，戴眼镜，但话不多

Ha: 娃娃脸？

Rai: 是的，可以这么形容。

Ha: 深度求索以隐私为由鲜少回应关于梁文峰的问题。但Saritha和同事们对这个用AI系统颠覆科技界的男人充满好奇，于是他们采访了数十位知情人士：从前员工、同行研究员到投资人和业内知情者。

**Rai:**我们发现他确实极其低调、非常害羞，但同时也异常执着、才华横溢且充满激情。我认为他将深度求索视为一种使命，致力于让中国在人工智能领域占据一席之地，确保中国成为AI领域不可忽视的力量。

**Ha:**欢迎收听彭博新闻社《亚洲大动向》节目，我是Oanh Ha。每周我们将带您深入全球最大最具活力的经济体，解析推动这个瞬息万变地区的市场、商业巨头与企业动态。今天节目的焦点是：梁文峰是谁？我们将揭秘这位带领深度求索站上AI前沿的神秘科技创始人。此外，这家公司的快速崛起对中美人工智能竞赛意味着什么？

**Ha:**Saritha，感谢参与节目。我对AI非常着迷，你们这期报道做得太精彩了。我们能否先从梁文峰的背景谈起？关于他的出身我们了解多少？

**Rai:**梁文峰现年40岁左右，出生于广东省一个名为米粒岭的小村庄。父母都是小学教师。他天资聪颖，先后在浙江大学完成本科及硕士学业。

Ha: 在浙大期间，梁文峰与同学们醉心于各类技术领域：机器学习、信号处理、电子工程。他们甚至在金融危机期间开发过股票交易程序。毕业后，梁与两位同窗联手创立了名为高飞管理的量化对冲基金。

Rai: 量化基金本质上是通过数学模型和统计分析进行股票交易，决策过程无需人工干预。巅峰时期，高飞管理公司管理的资产规模高达140亿美元，堪称大型基金。在其最成功的运营阶段，该基金为投资者提供的年化回报率平均达到35%。可以说，它确实表现非常出色。

**Ha:**据前员工透露，高飞公司有着极客风格的初创企业文化。早期招聘启事自豪地宣称吸引了来自谷歌和脸书的顶尖人才，并表示正在寻找具有"古怪才华"的数学与编程"极客"。

**Rai:**早期招聘中还提到了谢尔顿——美国著名情景喜剧《生活大爆炸》中那个极度社恐的主角

谢尔顿·库珀: 比如我哭是因为别人太蠢，这让我难过。

Rai: 谢尔顿拥有大批粉丝，其无意间展现的幽默令人捧腹。可以说，DeepSeek早期的整个企业文化都在试图复刻这种极客文化。那里有免费零食、扑克游戏之夜，所有人都穿着T恤和拖鞋上班。

**Ha:**听起来是个很棒的工作环境

**Rai:**是的，那确实是一种非传统的初创企业文化。与中国阿里巴巴、腾讯等科技公司的氛围截然不同。

**哈：**梁是如何从量化金融领域转型到人工智能并创立深度求索的？

**雷：**梁一直对机器学习和人工智能抱有非凡的热情。在OpenAI推出ChatGPT这个一夜之间风靡的聊天机器人后几个月——那是2023年春天，ChatGPT发布已过去数月——梁随即成立了深度求索。在其早期宣言中，深度求索提出要拒绝平庸，攻克人工智能领域的重大挑战，并最终实现通用人工智能的突破。

**哈：**宣言还阐明了深度求索的雄心——让中国成为尖端技术的引领者。

**雷：**梁极少接受采访，但已知的两次访谈中，他都谈到要将中国人工智能生态推向世界前沿。中国常被指责为模仿者，而他希望打造一个走不同道路的AI中国。

**哈：**深度求索进展神速。自2023年起，它发布了超过六款AI模型，并率先应用了稀疏化技术——使模型训练和运行更高效。开发者开始关注这家公司。接着在今年早些时候——

***大卫·古拉：***现在回到头条新闻，深度求索震撼全球科技界…

**雷：**当他们发布推理模型R1时，引发了行业巨震，导致股市万亿美元市值蒸发。世界这才真正开始关注这位神秘的中国AI创业者。

**哈：**那么萨里塔，深度求索的R1模型究竟有何突破性意义？

**雷：**直到最近，AI行业始终围绕着数十亿美元的基础设施投入——建设数据中心、配置用于训练模型的图形处理器。但深度求索证明了，其模型在某些基准测试中能媲美甚至超越OpenAI或Anthropic的最新模型，却仅需极少的算力资源。据该公司宣称，资金消耗也远低于行业巨头。

**哈：**梁博士团队如何实现这种低成本的真创新？深度求索的成功对中美AI竞赛意味着什么？广告之后为您揭晓。

**哈：**过去十年间，美国持续限制中国获取半导体技术。2022年及次年，随着华盛顿对北京实施两轮芯片出口管制，紧张局势达到顶峰。

***乔恩·埃利希曼：***英伟达等半导体企业股价今日暴跌，此前拜登政府宣布将加强对华AI芯片出口限制。据英伟达向彭博社透露…

**哈：**这限制了英伟达等美企的销售，其尖端芯片本是科技公司训练AI模型的关键工具。虽然给开发者带来巨大挑战，但正如彭博社萨里塔·雷所言，这也倒逼中国科技企业另辟蹊径。

Rai: 需求永远是创新之母。中国AI团队已证明了这一点——尽管面临出口管制，他们依然开发出能与全球顶尖水平比肩的优秀模型。

Ha: 而深度求索最创新的突破之一，正是我们先前提到的稀疏化技术。

Rai: 稀疏化的核心在于无需高端算力即可构建模型。当大语言模型不必整体运作来响应查询时，梁博士团队尝试将模型能力拆解为多个专家小组，仅调用所需模块。这种方式大幅提升了计算效率和成本效益。

Ha: 这就像人脑运作原理——不需要动用整个大脑，只需激活特定脑区进行处理？

Rai: 完全正确。就像不必激活所有脑细胞，只需调动存储特定专业知识的神经元集群，就能应对编程指令或解答问题。

Ha: 这项突破令同行瞩目，但真正引发轰动的还是成本优势。深度求索透露其V3模型训练仅耗资560万美元，远低于OpenAI开发最先进ChatGPT版本预估的1亿美元投入。

Rai: 目前这个数字确实引发了大量质疑，因为仅基础设施、模型训练、人才投入和时间成本加起来就是一笔巨额开支。因此这种怀疑不无道理。业内人士估算，深度求索公司若想实现这一目标，至少需要10亿美元甚至更多资金支持。

Ha: 深度求索的优势还在于，中国政府与习近平主席始终坚定支持这类AI初创企业。Saritha指出，习主席将生成式AI、机器人等高科技领域视为国家战略的重要组成，是实现关键技术自主可控的关键一环。深度求索的成功也促使阿里巴巴、腾讯、字节跳动等巨头纷纷推出自研AI模型。

Ha: Saritha，深度求索当前已完全开源其模型，这意味着任何个人或企业都能将其算法整合到自有程序中。该公司为何选择这种策略？其重要性何在？

Rai: 从某种层面看，开源可视为AI技术的民主化进程，使其在全球范围普及。但必须注意的是，若中国AI模型采用闭源模式且定价与OpenAI等西方公司相当，其国际接受度将大打折扣。通过低价策略，中国让全球用户能快速接触并使用这些模型，使其在商业和AI生态中迅速普及，从而实现对OpenAI等企业的弯道超车。这不仅是技术民主化，更是通过极致性价比让产品快速成为全球主流，从战略层面扼杀竞争对手生存空间的精明之举。

**哈：**因此，微软和亚马逊都在其云服务中提供了DeepSeek。DeepSeek的模型已被整合到Perplexity中，这是一个由AI驱动的搜索引擎，同时也提供来自OpenAI和Anthropic的模型。

**雷：**确实存在一个问题，即AI的发展速度有多快，全世界都担心所有控制权仅掌握在一两家公司手中。我认为这正是DeepSeek和其他公司试图向世界传达的信息，即所有控制权不能仅由一两家公司及其构建的专有模型掌握，应该更加民主。因此，我认为开源哲学的核心在于降低风险、分散权力，并让更多人能够使用更易获取的技术进行开发。

**哈：**在构建AI时，西方的方法与中国的方法之间是否也可能存在文化或价值观的冲突？

**雷：**非常明显，因为如果你看看DeepSeek的早期模型，甚至是未经调整或微调的模型，它们很大程度上是在中国的审查规则范围内运作的。例如，你不能问它关于台湾或习近平的问题，否则它只会给出非常平淡的官方答案。然而，如果你使用相同的模型，并用其他数据训练它，使其在文化上适应不同的地区，这正是DeepSeek早期学到的一点：通过开源模型，让开发者和用户有机会根据自己的文化背景进行定制，DeepSeek可以在全球范围内更快地获得采用，而不是通过严格控制，使其只能在全球范围内给出对中国友好的答案。

**哈：**尽管有人称赞中国在人工智能领域的创新，但许多人对这种成功抱有更阴暗的怀疑。美国众议院委员会4月的一份报告声称深度求索与中国政府存在"重大"关联，并断言该公司非法窃取了OpenAI的数据。中国驻美使馆驳斥这些指控毫无根据。而深度求索和梁家恩均未就国会报告置评。

**哈：**萨里塔，当前中美之间的人工智能竞争看起来确实像某种军备竞赛。

**莱：**这确实是场竞赛，但现在判定赢家为时过早。一年前我绝不会认为这是场势均力敌的较量。这是场马拉松，却需要短跑的速度。我们刚站在起跑线上，对任何赢得竞赛的国家来说，潜在经济收益都不可估量。因此各国尤其是中美都不愿在AI领域松懈。

**哈：**你认为深度求索目前面临哪些挑战？

**莱：**关键挑战在于下一步行动——如何超越已有成就。同时在国内市场，阿里巴巴、字节跳动、腾讯等企业开发的模型已超越深度求索的上代旗舰产品，这种竞争压力迫使他们必须做得更好。此外还存在商业模式问题：这类企业如何盈利？深度求索是否以盈利为目标？若想盈利又将通过何种途径？目前都没有明确答案。

本期节目由杨洋、娜奥米·黄制作，罗希特·帕塔克协助；奥斯汀·卡尔、黄哲平提供补充报道；高级制作人：娜奥米·沙文；编辑：帕迪·赫希、约书亚·布鲁斯坦；高级编辑：伊丽莎白·庞索特；副执行制作人：朱莉娅·韦弗，执行制作人：妮可·比姆斯特伯；音效设计/工程师：安田隆；事实核查员：娜奥米·黄。