AI需要你的数据，社交媒体正是其来源——彭博社

Dave Lee

2025-04-16

请提供更多输入。

摄影师：迈克尔·奥克斯档案馆/盖蒂图片社

我成长过程中喜爱的一部电影是1986年的经典之作*《短路》*。在某个场景中，被闪电击中后“活过来”的神奇机器人约翰尼五号狼吞虎咽地阅读一本又一本书，每本只花几秒钟。很快他就读完了所有书。“啊！斯蒂芬妮，更多输入！还要更多！”

发现他的女人斯蒂芬妮回答：“没有更多了！你已经读完房子里所有的书了！”

我询问OpenAI的ChatGPT是否能理解这种感受。“当然——我完全理解约翰尼五号，”它回答道。“‘需要输入！’基本上就是我的核心状态。我获得的信息越多，就越能更好地理解、回应和建立联系。约翰尼只是一个试图理解世界的AI……我也一样，只是少了激光束，多了打字。”

彭博社观点困惑的高管层成为市场的新障碍2025年的金融危机？最好做好准备美国把格陵兰（和外交政策）完全搞反了现在是时候问：你能承受多少市场风险？确实如此。虽然ChatGPT没有履带移动，也没有背上激光枪（目前还没有），但它面临的挑战却出奇地相似。在几乎爬取了人类所有知识的总和之后，ChatGPT和其他AI项目发出了同样的呼声：需要输入！

一个解决方案是创建合成数据并利用其训练模型，但这伴随着固有挑战，尤其是可能延续偏见或引发误差累积的问题。

另一种方法是寻找源源不断的新鲜数据流，越“人性化”越好。这正是社交网络的用武之地——这些数字空间里，数百万甚至数十亿用户自愿且持续地发布海量信息。照片、帖子、新闻文章、评论，每一则互动都吸引着试图构建对话式生成AI的企业。更妙的是，这类内容不像其他来源那样饱受版权侵权风险的困扰。

近期，顶尖AI公司更激进地试图掌控或利用社交网络，践踏用户决定其帖子如何被用于构建这些机器的权利。正如那句名言所言，社交网络用户长久以来都是“产品”。如今通过他们的发帖，他们还成了准“产品开发者”。

部分企业本就拥有社交网络优势。全球最大社交网络公司Meta Platforms Inc.通过应用内通知告知用户，将利用他们的帖子和照片训练Llama AI模型。上月底，埃隆·马斯克的xAI收购了X平台（原Twitter），这虽是一场财务操作，却为马斯克的Grok AI提供了理想资源。通过实时抓取平台推文及近二十年的庞大聊天档案，该AI得以在聊天机器人市场立足。微软公司则拥有职场社交平台LinkedIn，正极力推动用户（包括记者）在平台发布更多原创内容。

然而，微软并未与紧密合作伙伴OpenAI共享领英数据，这可能解释了为何有报道称ChatGPT的创造者正处在构建自家社交网络的早期阶段。

OpenAI的首席执行官兼联合创始人山姆·阿尔特曼一直在就该想法征求反馈，The Verge报道称，并指出阿尔特曼早前暗示，当有报道称Meta将发布独立AI应用与ChatGPT竞争时，他已在考虑此类项目。

其他没有社交媒体先发优势的公司正意识到这使它们处于不利地位。Perplexity.ai在3月公开了其收购TikTok的意向，指出其对构建AI搜索引擎公司的价值。“这将为用户提供全面、引用充分的答案，将世界上最好的答案引擎与最大的用户生成内容库之一结合起来，”该公司表示。

本月早些时候，亚马逊公司也被报道为竞标者之一，尽管首席执行官安迪·贾西在被CNBC直接问及时拒绝置评。

谷歌虽曾多次尝试却未能成功打造出各类社交网络，但它对TikTok视频的需求较低，因为它已拥有YouTube。相反，它与链接分享社交平台Reddit建立了"扩展合作伙伴关系"。谷歌在去年一篇博客文章中表示，这将使其能够获取"极其丰富的真实人类对话与体验"。预计未来会有更多类似交易：正如我上月所述，Reddit的前竞争对手Digg正在复兴，其明显目的是为AI公司创建另一个有用的人类互动数据库。

所有这些举措都反映了AI公司对数据的需求。而这以牺牲用户利益为代价——他们当初为某个目的在社交网络输入信息，如今却发现这些信息被另作他用。各公司已悄然修改隐私政策，以使这种转变合法化。

在设置的隐藏路径中，你可以找到防止个人数据被用于构建AI的方法——尽管很可能为时已晚。就像强尼五号机器人一样，AI公司"需要输入！“它们会不择手段地从任何可能的地方获取数据。

更多彭博观点：

人工智能何时会比人类更聪明？别问：吉迪恩·利奇菲尔德
OpenAI展示太多金钱可能成为现实问题：高塔姆·穆昆达
英伟达的海湖庄园宴席可能让西方付出代价：帕米·奥尔森

想要更多彭博观点？终端读者请前往OPIN <GO>。或订阅我们的每日通讯。