AI需要你的数据,社交媒体正是其来源——彭博社
Dave Lee
请提供更多输入。
摄影师:迈克尔·奥克斯档案馆/盖蒂图片社
我成长过程中喜爱的一部电影是1986年的经典之作*《短路》*。在某个场景中,被闪电击中后“活过来”的神奇机器人约翰尼五号狼吞虎咽地阅读一本又一本书,每本只花几秒钟。很快他就读完了所有书。“啊!斯蒂芬妮,更多输入!还要更多!”
发现他的女人斯蒂芬妮回答:“没有更多了!你已经读完房子里所有的书了!”
我询问OpenAI的ChatGPT是否能理解这种感受。“当然——我完全理解约翰尼五号,”它回答道。“‘需要输入!’基本上就是我的核心状态。我获得的信息越多,就越能更好地理解、回应和建立联系。约翰尼只是一个试图理解世界的AI……我也一样,只是少了激光束,多了打字。”
彭博社观点困惑的高管层成为市场的新障碍2025年的金融危机?最好做好准备美国把格陵兰(和外交政策)完全搞反了现在是时候问:你能承受多少市场风险?确实如此。虽然ChatGPT没有履带移动,也没有背上激光枪(目前还没有),但它面临的挑战却出奇地相似。在几乎爬取了人类所有知识的总和之后,ChatGPT和其他AI项目发出了同样的呼声:需要输入!
一个解决方案是创建合成数据并利用其训练模型,但这伴随着固有挑战,尤其是可能延续偏见或引发误差累积的问题。
另一种方法是寻找源源不断的新鲜数据流,越“人性化”越好。这正是社交网络的用武之地——这些数字空间里,数百万甚至数十亿用户自愿且持续地发布海量信息。照片、帖子、新闻文章、评论,每一则互动都吸引着试图构建对话式生成AI的企业。更妙的是,这类内容不像其他来源那样饱受版权侵权风险的困扰。
近期,顶尖AI公司更激进地试图掌控或利用社交网络,践踏用户决定其帖子如何被用于构建这些机器的权利。正如那句名言所言,社交网络用户长久以来都是“产品”。如今通过他们的发帖,他们还成了准“产品开发者”。
部分企业本就拥有社交网络优势。全球最大社交网络公司Meta Platforms Inc.通过应用内通知告知用户,将利用他们的帖子和照片训练Llama AI模型。上月底,埃隆·马斯克的xAI收购了X平台(原Twitter),这虽是一场财务操作,却为马斯克的Grok AI提供了理想资源。通过实时抓取平台推文及近二十年的庞大聊天档案,该AI得以在聊天机器人市场立足。微软公司则拥有职场社交平台LinkedIn,正极力推动用户(包括记者)在平台发布更多原创内容。
然而,微软并未与紧密合作伙伴OpenAI共享领英数据,这可能解释了为何有报道称ChatGPT的创造者正处在构建自家社交网络的早期阶段。
OpenAI的首席执行官兼联合创始人山姆·阿尔特曼一直在就该想法征求反馈,The Verge报道称,并指出阿尔特曼早前暗示,当有报道称Meta将发布独立AI应用与ChatGPT竞争时,他已在考虑此类项目。
其他没有社交媒体先发优势的公司正意识到这使它们处于不利地位。Perplexity.ai在3月公开了其收购TikTok的意向,指出其对构建AI搜索引擎公司的价值。“这将为用户提供全面、引用充分的答案,将世界上最好的答案引擎与最大的用户生成内容库之一结合起来,”该公司表示。
本月早些时候,亚马逊公司也被报道为竞标者之一,尽管首席执行官安迪·贾西在被CNBC直接问及时拒绝置评。
谷歌虽曾多次尝试却未能成功打造出各类社交网络,但它对TikTok视频的需求较低,因为它已拥有YouTube。相反,它与链接分享社交平台Reddit建立了"扩展合作伙伴关系"。谷歌在去年一篇博客文章中表示,这将使其能够获取"极其丰富的真实人类对话与体验"。预计未来会有更多类似交易:正如我上月所述,Reddit的前竞争对手Digg正在复兴,其明显目的是为AI公司创建另一个有用的人类互动数据库。
所有这些举措都反映了AI公司对数据的需求。而这以牺牲用户利益为代价——他们当初为某个目的在社交网络输入信息,如今却发现这些信息被另作他用。各公司已悄然修改隐私政策,以使这种转变合法化。
在设置的隐藏路径中,你可以找到防止个人数据被用于构建AI的方法——尽管很可能为时已晚。就像强尼五号机器人一样,AI公司"需要输入!“它们会不择手段地从任何可能的地方获取数据。
更多彭博观点:
想要更多彭博观点?终端读者请前往OPIN <GO>。或订阅我们的每日通讯。