埃隆·马斯克的xAI接触了初创公司CharacterAI,有意收购 - 彭博报道
Aisha Counts
Reddit公司一直在阻止搜索引擎访问该网站的帖子和评论,包括微软公司的必应(Bing),除非它们签订商业协议,这是根据Reddit上个月生效的政策变更。
“我们不能再完全开放,因为我们必须非常考虑我们的数据最终流向何处以及它被用于什么目的,”首席执行官史蒂夫·哈夫曼在接受采访时说。“我们现在正在阻止任何我们没有正式协议的网络爬虫。”
上个月,这家社交媒体公司改变了其政策,防止公司和个人未经授权爬取Reddit网站。这一变更要求公司与Reddit签订协议才能使用该网站的数据,包括在网页搜索中显示Reddit的帖子和评论。
由于这一变更,Alphabet公司的谷歌目前是唯一可以访问Reddit内容的主要搜索引擎。这家搜索巨头在二月份与Reddit签署了$60百万的协议。Reddit与谷歌的合作并非独家,也不会阻止Reddit内容出现在竞争对手的搜索引擎中,该公司表示。
谷歌和其他搜索引擎长期以来一直是Reddit的重要流量来源。人们经常通过在搜索结尾添加“r/Reddit”来搜索Reddit的帖子和评论。在过去两年中,谷歌在单日中占Reddit流量的比例高达40%至50%,哈夫曼说。
Reddit曾免费允许搜索引擎访问其网站,因为他们向Reddit发送了大量的流量。
“当它被用于简单搜索,创建简单链接以从搜索引擎发送流量给我们时,那是可以的,” Huffman说。“但现在人们正在使用Reddit数据进行训练,他们在转售数据,他们在做搜索摘要而不是链接到我们。”
Reddit一直在与其他搜索引擎,包括必应,以及人工智能公司Anthropic和Perplexity进行商业协议的谈判,但表示这些公司不愿意遵守网站的内容政策。
微软表示公司尊重“不希望我们的生成式人工智能模型使用其页面上的内容的网站提供的指示。”必应在公司实施更新的robots.txt文件后于7月1日停止了对Reddit的抓取,该文件禁止了对其网站的所有抓取,一位公司发言人表示。
Perplexity表示,他们不会为训练人工智能而许可内容,而是使用新闻网站和其他网页的信息来回答用户的问题。该公司目前与时代周刊、财富杂志、WordPress.com和其他网站建立了合作关系。“Perplexity之前曾邀请Reddit加入我们的出版商计划,邀请仍然有效,”一位Perplexity发言人表示。
Anthropic表示,公司尊重Reddit阻止网络抓取的信号。“自5月中旬以来,Reddit一直在我们的封锁名单上,我们自那时起没有向我们的爬虫程序添加任何Reddit的URL,”Anthropic的一位发言人表示。
微软支持的OpenAI确实与Reddit签署了合作伙伴关系,允许Reddit的结果出现在聊天机器人ChatGPT中。截至五月,Reddit已经签署了总价值2.03亿美元的数据许可协议,将在未来两到三年内生效。
埃隆·马斯克的xAI已经与人熟悉此事的人讨论收购人工智能聊天机器人初创公司Character.AI。
据一位知情人士透露,马斯克的xAI已经接触了这家初创公司,但目前尚不清楚谈判是否有进展,或者是否已经认真讨论过交易。