推特分享其运作背后的部分秘密配方 - 《华尔街日报》
Sarah E. Needleman and Alexa Corse
推特公司公开了其大部分源代码,这对大型社交媒体企业来说实属罕见之举,其所有者埃隆·马斯克表示这将提升平台可信度。
这些于周五发布在代码共享网站GitHub的代码,揭示了推特如何推荐帖文及识别仇恨言论等问题。该代码不包含用户隐私数据,也未提供复制该平台的路线图。有专家将此策略比作厨师公开独家配方。
“我们正努力成为互联网上最值得信赖的平台,“马斯克在代码发布后不久通过Twitter Spaces讨论时表示,“这可能会暴露许多令人尴尬的错误。”
科罗拉多大学博尔德分校信息科学教授罗宾·伯克指出,虽然普通人难以理解这些代码,但程序员可以借此分析推特是否如指控所言区别对待特定用户群体。
“他们可以声称’我们并未实施被指控的歧视行为’,“他谈及推特时表示,“但另一方面,歧视性操作仍可能无意间发生。”
前推特总监鲁曼·乔杜里表示,这些代码可能被利用来操纵推特的推文系统、识别违规者等。她曾负责机器学习伦理与透明度团队,去年11月被裁。她举例说,虽然推特设有仇恨言论规则,但此前外界并不清楚其如何主动识别这类推文。
“你可以阅读这些代码,从中提取出支配决策制定的规则,”乔杜里女士说。“现在,恶意行为者可能有办法绕过推特建立的各种防护措施。”
她表示,反过来看,这些泄露的代码也展示了平台的复杂性。“人们以为复制一家社交媒体公司的功能非常简单,其实并非如此,”乔杜里女士说道。她补充称,研究人员和学者现在也能审核推特的推荐算法了。“有整个学术会议专门研究推荐系统及其影响,”她说。
根据加州大学伯克利分校人类兼容人工智能中心的高级科学家乔纳森·斯特雷的说法,代码显示推特的推文推荐流程建立在标准架构之上。“这里没有意外发现,”他说。
但他指出,代码确实展示了该公司对推文进行排序的公式,并表示其中最大的影响因素是预测一个人是否会回复某条推文。
“他们试图促成的是来回对话,但这也会激励人们发布煽动性或分裂性内容,”斯特雷先生说。
推特所有者表示,公司将根据用户建议每24至48小时更新一次推荐算法。图片来源:Jeff Chiu/Associated Press针对置评请求,推特新闻邮箱回复了一个大便表情符号——马斯克近期发推文称,该表情将是公司对媒体问询的自动回复。
周五的Twitter Spaces讨论中,有人向马斯克先生询问了一段似乎用于追踪他本人发推时间的代码。根据周五公布的材料,Twitter表示该代码用于收集数据指标。
他回应道:“我觉得这很奇怪。这是我第一次听说这件事。”
马斯克随后发推表示,Twitter将根据用户建议每24至48小时更新一次推荐算法。
近年来,社交媒体公司因其通过推荐算法影响用户所见内容的能力而受到审查。去年马斯克收购Twitter时,曾承诺公开平台用于决定是否推广特定推文的代码。
在收购Twitter前,马斯克曾指控该公司在内容审核上存在"强烈左翼偏见”。而Twitter研究人员在2021年报告中指出,其算法在美国等多个国家放大了政治右翼账号的声量,程度超过左翼。
尽管马斯克承诺提高Twitter透明度,但自他接管以来,公司在某些方面减少了运营信息的披露。作为私有企业,Twitter不再公开财务报告。马斯克经常通过个人推特账号发布公司动态。
另外,根据上周提交给加州北部联邦地区法院的诉讼文件,推特公司近期表示其部分源代码被不明身份的个人或团体泄露至网络。与马斯克支持下周五公开的代码不同,此次泄露显然未经授权。
尽管公司在法庭文件中将泄露内容描述为"推特平台及内部工具的专有源代码”,但具体哪些代码遭泄露尚不明确。
应推特要求,法院本周已向GitHub发出传票,要求查明信息泄露者及下载者身份。
联系记者莎拉·E·尼德尔曼,邮箱:[email protected]
本文发表于2023年4月1日印刷版,标题为《推特公开平台大部分源代码》。