查理·贾维斯的沃顿商学院同窗称其曾为摩根大通交易伪造数据 - 彭博社
Bob Van Voris, Jazper Lu
查理·贾维斯抵达纽约联邦法院。摄影师:迈克尔·纳格尔/彭博社数据科学家查理·贾维斯在宾夕法尼亚大学沃顿商学院就读时结识的一位证人作证称,她曾要求他伪造数据,显示其公司在被摩根大通集团收购前一个月拥有超过400万用户。
亚当·卡佩尔纳周二在曼哈顿联邦法院贾维斯欺诈案审理中出庭作证。作为针对32岁贾维斯的主要控方证人之一,检方指控其通过大幅虚报学生金融初创公司Frank的用户数量,诱使摩根大通于2021年9月以1.75亿美元收购该公司。
卡佩尔纳表示贾维斯从未说明需要"合成数据"的原因,但强调她需求紧迫且愿意支付溢价。
“我急需帮助,想知道你是否还接咨询工作并有空档”,2021年8月2日的庭审短信显示她这样联系卡佩尔纳。当对方告知时薪为300美元时,她主动将报酬提高至600美元。
统计学博士
检方在2023年起诉书中指控贾维斯雇佣数据科学家伪造用户信息。斯坦福大学毕业的卡佩尔纳在沃顿攻读统计学博士学位时结识本科在读的贾维斯,现任皇后学院数学教授。据其网站显示,他曾在2019年夏季为对冲基金公司Coatue Management构建数据模型。
陪审团上周获悉,就在贾维斯给卡佩尔纳发短信的同一天早些时候,弗兰克的首席工程师在与她和弗兰克前首席增长官奥利维尔·阿马尔(正与她一同受审)的Zoom通话中,拒绝创建虚假客户数据。帕特里克·沃沃尔作证称,他认为这样做可能违法。
贾维斯和阿马尔均表示不认罪,坚称无意欺诈摩根大通。他们辩称该银行并未关注用户数量,且因担心竞争对手收购弗兰克而仓促完成了尽职调查。
卡佩尔纳表示同意帮助贾维斯,并于次日与她通话。贾维斯发送给他的电脑文件显示弗兰克用户数不足30万。卡佩尔纳作证称,随后几天他根据贾维斯提供的规范要求生成了4,265,085行数据,每行代表一个真实或虚构的弗兰克用户。
“相似数据”
卡佩尔纳在证词中向法官和陪审团详细说明:他以贾维斯的数据为"种子"模拟"相似数据",将用户数量虚增十倍以上。他表示这些姓名是通过重组弗兰克数据库中的姓氏和名字生成,但不存在完全相同的全名。他还指出数据集经过编程处理,能近似原始数据中名字的比例,并向陪审团说明扩大后的数据集会保持相同比例的"迈克尔"同名者。
法庭特别询问了关于"凯瑟琳·戈迪"的记录,该条数据包含地址、电话号码、电子邮件及其他个人财务信息。
“戈迪女士并不存在,”卡佩尔纳向陪审团表示。
在他们第一次通话后不久,“我询问了这个项目的目的是什么,她说她不能谈论这个,”卡佩尔纳说。
卡佩尔纳表示,在项目上花费了大约22小时后,他向贾维斯发送了一份13,300美元的发票,详细列出了已完成任务的类别。他作证说,贾维斯让他用一张仅有一行说明付款用于“数据分析”的新账单替换,并将总额提高到18,000美元。
此案为美国诉贾维斯案,案号23-cr-00251,美国纽约南区地方法院(曼哈顿)。