深度探索:中国AI公司深度求索推出新聊天机器人挑战ChatGPT——《南华早报·青年邮报》
scmp
深度剖析栏目深入探讨香港与内地的热点议题。我们以通俗易懂的文章提供背景解读,同时通过提问帮助您构建有见地的回应。页面末尾附有参考答案。
要闻:中国AI公司深度求索发布新聊天机器人引热议
- 该公司于一月推出聊天机器人,并向用户提供免费无限次使用
- 据报道,该AI模型的开发成本与能耗均显著低于ChatGPT
中国人工智能初创企业深度求索于1月20日发布聊天机器人应用,其表现对美国科技巨头OpenAI的统治地位形成挑战。
这款名为R1的大语言模型是该公司12月发布的V3模型的迭代版本。据企业披露,V3模型的研发成本与算力消耗仅为美国科技巨头开发同类产品的零头。
深度求索的低成本模式引发业界对美国科技公司耗资数十亿美元建设高能耗数据中心的质疑。部分观察者认为这对美国AI产业具有震撼性启示,尤其考虑到深度求索采用开源模式。
这家中国公司宣称,在数学运算和常识推理等多项行业基准测试中,其产品性能已超越美国头部开发商的同类产品。
美国昆西研究所非常驻研究员丹尼斯·西蒙指出,西方世界应汲取的关键经验在于"实现相同创新目标存在多元路径"。
他补充说,深度求索公司采取了一种创新方法,以推动"当前人工智能技术思考的前沿"。
应该禁止儿童使用Character.ai这样的聊天机器人吗?
“通过开发一条成本更低、效率更高、甚至可能更有效的实现’通用人工智能’的路径,深度求索证明了这不仅仅是规模和资金的问题,“西蒙说。
“事实上,关键在于培养人才,更多地思考软件整合,而不是积累成千上万的高级芯片。”
在深度求索创始人梁文锋的带领下,团队汇聚了一批新鲜人才。他们中许多是来自中国顶尖大学的年轻研究人员和博士。
美国总统唐纳德·特朗普称深度求索是一个"警钟”,此前美国股市受到影响,人们担心该模型可能威胁美国在技术领域的主导地位。
截至1月27日,深度求索是中国iOS应用商店上下载量最大的免费应用。它还取代了OpenAI的ChatGPT,登上了美国iOS应用商店的榜首。
深度求索已将该模型集成到其聊天机器人的网页版和应用程序版本中,供用户无限免费使用。
OpenAI每月收取200美元的费用,以无限使用其o1模型。一个有限访问的标准计划每月花费约20美元。
特约撰稿人
问题提示
1. 根据新闻报道,以下哪一项不是DeepSeek的特点?
(1) 它提供聊天机器人的无限免费使用。 (2) 它的开发成本比ChatGPT更高。 (3) 它是在美国开发的。 (4) 它是由中国研究人员设计的。
A. 仅(1)、(3) B. 仅(2)、(3) C. 仅(1)、(4) D. 仅(3)、(4)
2. 列出DeepSeek在人工智能行业引起轰动的两个原因。
3. 根据Denis Simon的观点,DeepSeek成功的一个原因是什么?美国科技公司可以从中学习什么?
图表
1. 图表如何与新闻报道中的信息相关联?
2. 结合新闻报道和图表,列出促进中国人工智能行业增长的两个因素。
议题:微软就DeepSeek涉嫌秘密复制数据展开调查
- OpenAI表示有证据表明该公司使用了行业内常见的做法窃取数据
- 意大利数据保护局因隐私问题已封锁对DeepSeek的访问
中国人工智能初创公司DeepSeek被指控通过行业内常见的做法进行数据窃取。
据《金融时报》报道,OpenAI表示有证据表明DeepSeek利用其GPT模型的蒸馏技术训练开源V3和R1模型,成本仅为西方科技巨头投入的一小部分。
据彭博社援引不愿透露姓名的知情人士报道,ChatGPT制造商的最大支持者OpenAI和微软已开始调查一个与深度求索(DeepSeek)有关的组织是否通过应用程序接口(API)窃取了大量数据。
“蒸馏技术通常会违反大多数服务条款,但讽刺的是——甚至可以说是虚伪的——大型科技公司现在却对此提出指责。用《福布斯》或《纽约时报》的内容训练ChatGPT同样违反了它们的服务条款,”康奈尔大学高级客座讲师卢茨·芬格在一份电子邮件声明中表示。芬格曾在谷歌和领英等科技公司从事人工智能工作。
深度求索拥有自己的蒸馏模型,这些模型使用了其他开源模型,如Meta Platforms的Llama和阿里巴巴集团的Qwen。阿里巴巴集团是《南华早报》的所有者。
然而,OpenAI指控深度求索通过API访问闭源的GPT模型,以未经授权的方式对其进行蒸馏。深度求索尚未承认在其主要模型V3和R1的训练中使用蒸馏技术。
AI蒸馏的概念已经存在多年。2015年,包括“AI教父”杰弗里·辛顿在内的三位研究人员发表了一篇题为《蒸馏神经网络中的知识》的论文,阐述了如何将大型模型的知识转移到更易于部署的小型模型中。
这一过程常被比作课堂场景,其中“学生”模型向“教师”模型学习。通过文本分类和问答等流程,学生模型学会对特定类型提示作出恰当回应。此类训练包含所有可能回答的概率计算。
与此同时,意大利数据保护局(GPDP)上月对深度求索公司展开调查,并禁止其处理意大利用户数据。
该机构表示,在关于企业使用个人数据的质询中收到"完全不足"的答复后决定采取行动。
去年12月,意大利监管机构就热门聊天机器人ChatGPT使用个人数据对OpenAI处以1500万欧元(约1.204亿港元或1560万美元)罚款,但这家美国科技公司表示将上诉。
调查始于2023年3月,当时GPDP因隐私问题暂时在意大利封禁了ChatGPT。
本报记者,法新社
问题提示
1. 深度求索公司被指控如何利用OpenAI的技术? (1) 从OpenAI获取用户数据 (2) 复制ChatGPT的数据 (3) 窃取OpenAI的计算机芯片 (4) 训练小型模型模仿ChatGPT行为
A. 仅(1)、(3) B. 仅(1)、(4) C. 仅(2)、(4) D. 仅(3)、(4)
2. 据称蒸馏技术在DeepSeek的发展中扮演了什么角色?列举该方法的1个潜在优势和1个潜在劣势。
3. 根据Issue内容,列出意大利数据保护局对DeepSeek采取行动的1个原因。
图片说明
中国人工智能公司DeepSeek(开发开源大语言模型)与OpenAI人工智能聊天机器人ChatGPT的对比图。图片来源:法新社1. 为什么将ChatGPT与DeepSeek进行比较?
2. DeepSeek争议可能对AI发展与监管的未来产生什么影响?请结合新闻、议题、术语表及个人知识说明。
术语表
大语言模型(LLM): 能理解并生成人类语言的人工智能类型,通过分析书籍、网站等海量文本数据进行学习。
数据中心: 容纳高性能计算机和网络设备的巨型仓库,负责存储和处理全球数据。
开源: 向公众免费提供的软件,允许任何人查看、修改和分发其代码。
先进芯片: 用于运行自然语言处理与生成所需的复杂AI算法的专用计算机芯片。
蒸馏:一种训练较小模型以模仿更大型、更精密模型行为的方法。许多公司内部普遍采用这种做法,旨在缩小模型规模的同时为用户提供相近的性能。
**数据渗出:**未经许可从计算机或网络秘密复制数据并发送至其他位置的行为。
深度求索的开源模式使其在竞争对手中脱颖而出。图片来源:路透社### 参考答案
新闻
1. B
2. 深度求索的开发者表示,相比OpenAI开发ChatGPT,他们花费更少的资金和能源创建了该聊天机器人。该软件还是开源的,意味着公众可免费使用,允许任何人查看、修改和分发其代码。(接受所有合理答案)
3. 西蒙指出深度求索注重人才战略,聘用年轻专业人士开发聊天机器人。美国公司往往优先获取先进芯片。美国企业可借鉴深度求索的经验,将重心转向招募优秀研究人员和软件集成,从而节省成本。(接受所有合理答案)
图表
1. 图表展示了中美人工智能产业格局。生长在美国的树代表ChatGPT和OpenAI,中国的树则象征深度求索。如图所示,与美国相比,中国人工智能产业规模仍较小但处于成长期。
2. 图表显示中国工业正以技术和资金形式获得支持。像深度求索这样的公司也在着力培养人才库以推进技术发展,而非将资金用于购买先进芯片。(接受所有合理答案)
议题
1. C
2. 深度求索通过蒸馏法在现有AI模型上训练其模型。潜在优势是可减少训练和改进AI模型所需的先进芯片和数据中心数量,但潜在弊端是蒸馏法引发的法律与伦理问题,据称深度求索未经许可就使用了该方法。
3. 意大利数据保护局对深度求索的聊天机器人展开调查,并禁止其处理意大利用户数据。该决定是在该机构未获深度求索关于个人信息收集、存储及使用方式的充分答复后作出的。
图片
1. OpenAI的ChatGPT正被与深度求索比较,因为后者高性价比的AI模型正在挑战ChatGPT的统治地位。有观点认为深度求索在数学任务和常识等领域表现优于OpenAI,而开发成本仅为后者一小部分。这两款产品问世时都引发了巨大轰动,其技术发展也体现了中美两国的竞争力。
2. DeepSeek争议凸显了人工智能发展中的关键挑战,包括数据使用的伦理问题、知识产权以及国际竞争。如果DeepSeek确实未经许可使用了OpenAI的模型,这将引发如何跨境执行AI服务条款的问题。此外,该案例强调了人工智能领域日益增长的监管需求,正如意大利对DeepSeek数据实践的调查所显示的那样。随着AI技术的快速发展,各国政府及科技公司可能面临更大压力,需要就数据隐私、公平竞争和AI模型伦理训练制定更清晰的准则。(接受所有合理答案)
要查看我们的内容,请关闭您的广告拦截器点击此处查看说明注册YP教师通讯
获取直接发送至邮箱的教师资讯更新
注册即表示您同意我们的条款与条件及隐私政策评论