苹果公司将分析设备端用户数据以强化人工智能技术——彭博社

Mark Gurman

2025-04-15

大语言模型是现代人工智能的核心技术，它们为苹果智能（Apple Intelligence）的各项功能提供动力。

摄影师：Victor J. Blue/彭博社苹果公司将开始分析用户设备上的数据，以改进其人工智能平台。这一举措旨在保护用户信息的同时，帮助公司追赶人工智能领域的竞争对手。

目前，苹果通常使用合成数据来训练AI模型——这些数据旨在模拟现实世界的输入，但不包含任何个人详细信息。然而，这些合成数据并不总能准确反映真实的用户数据，这使得其AI系统难以正常工作。

新方法将解决这个问题，同时确保用户数据保留在客户设备上，不会直接用于训练AI模型。此举旨在帮助苹果追赶OpenAI和Alphabet公司等竞争对手，这些公司在隐私限制方面面临较少约束。

该技术的工作原理如下：它将苹果创建的合成数据与iPhone、iPad和Mac邮件应用中最近用户邮件样本进行比较。通过使用真实邮件来检验模拟输入，苹果可以确定其合成数据集中哪些项目最符合现实世界的信息。

这些洞察将帮助公司改进其Apple Intelligence平台中与文本相关的功能，例如通知摘要、写作工具中的思维合成能力，以及用户消息的总结功能。

“在生成合成数据时，我们的目标是创建与真实数据在主题或风格上足够相似的合成句子或电子邮件，以帮助改进我们的摘要模型，同时避免苹果从设备收集真实邮件。”该公司在周一的机器学习博客文章中写道。

大语言模型是现代人工智能的核心技术，它们为苹果智能（Apple Intelligence）的功能提供支持。该公司去年发布了这一技术。除了使用合成数据外，苹果还通过从第三方授权获取的信息或扫描公开互联网找到的数据来训练其模型。

依赖合成数据也存在缺陷，该公司的工具曾在通知中错误表达某些概念，并在某些情况下无法提供准确的文本摘要。

阅读更多：苹果的人工智能努力到了成败攸关的时刻

理论上，新系统可以改进苹果的模型，这是成为火热人工智能领域真正竞争者的关键一步。该公司的人工智能团队发现其产品落后于竞争对手，这促使近期对Siri语音助手及相关工作进行了管理层调整。

该公司将在即将发布的iOS和iPadOS 18.5以及macOS 15.5的测试版中推出这一新系统。这些即将发布的版本的第二轮测试已于周一早些时候提供给开发者。

这家iPhone制造商还表示，正在引入以隐私为核心的方法来优化支撑其他苹果智能功能的模型，例如图像游乐场、图像魔杖、记忆创建和视觉智能。

该公司已采用差分隐私技术来改进其Genmoji功能（允许用户创建自定义表情符号）。在博客文章中，苹果表示该系统用于"识别热门提示词和提示模式，同时通过数学机制确保不会收集独特或罕见的提示"。

该技术的核心理念是追踪模型在多名用户提出相同请求（例如要求生成"提着公文包的恐龙"）时的响应表现，并针对这些场景优化输出质量。

这些功能仅面向选择加入设备分析与产品改进计划的用户。相关选项可在苹果设备设置应用的"隐私与安全性"板块中进行管理。

苹果表示：“基于我们在差分隐私等技术上的多年积累，以及合成数据生成等新方法，我们能在用户参与设备分析计划的同时，既提升苹果智能功能又保护用户隐私。”

苹果人工智能团队数月来一直处于动荡状态，彭博社先后报道了该部门面临的组织困境、领导力问题、产品延期以及高管变动。

3月，苹果重组了其人工智能部门的部分管理层，将Siri的职责从高管约翰·詹南德雷亚手中剥离，并将语音助手团队交给Vision Pro的创造者迈克·罗克韦尔和软件主管克雷格·费德里吉。公司计划在6月宣布苹果智能升级，但直到明年才会为Siri实施期待已久的功能。