一场关于因子投资的争论考验了现代金融的支柱-彭博社
Mary Childs, Justina Lee
插图:Rune Fisker for Bloomberg Markets
在11月,一篇引人注目的论文在SSRN上发布,这是一个经济学家广泛使用的在线平台,用来传播他们的研究成果。这篇论文的作者是学术金融领域中最重要的两位人物:肯尼斯·弗伦奇,来自达特茅斯学院塔克商学院,以及尤金·法玛,来自芝加哥大学的诺贝尔奖获得者 经济学家。这篇文章本身似乎很谦逊,读起来像是这对二人30年前发表的关于股市回报的技术注释。
没有背景信息,“在法玛-弗伦奇数据库中生产美国Rm-Rf、SMB和HML” 有点令人费解。这篇论文似乎在回答关于法玛和弗伦奇数据的问题,但没有明确说明这些问题是什么,或者是谁在提出这些问题。要理解这18页的内容,可能需要一个金融博士学位。要阅读其中的潜台词,你必须认识几十个拥有这种学位的人。这篇论文是学术经济学领域一个角落里一场安静但激烈的辩论的最终结果,这场辩论关于一个对教授、研究生以及专业交易员、投资者、证券诉讼律师和公司高管都至关重要的数据集的可靠性。
在论文登陆SSRN之前的两天,它的PDF版本已经出现在一些国内顶尖经济学家和法律学者的电子邮箱中。法马发来的附带消息清楚地解释了他和弗伦奇写这篇文章的原因,也表明他感到恼火。“你们大多数人都在两篇论文的致谢中,”他写道。“这些论文中有很多关于Fama-French因子更新效应的强烈言论。…我们认为,对于在资产定价研究方面有经验的人来说,这些结果并不令人惊讶。”法马补充道:“对我们来说,整个经历都是一个很好的例子:好心没好报。”
即使是对法马和弗伦奇研究的最小争论,也具有很高的风险。他们的工作关乎的不仅仅是我们如何知道公司价值,以及资金管理人员的工作表现如何,还有如何在市场上赚钱。例如,他们发现具有某些特征的公司,比如规模较小或股价相对便宜,往往在长期内表现更好。这些特殊特征被称为“因子”。已知为“因子”。
2005年的法马和弗伦奇。摄影师:吉姆·赖斯/费尔法克斯传媒/盖蒂图片社数万亿美元的资产依赖于法马和弗伦奇研究所提供的策略。基于因子的指数基金和交易所交易基金使投资者能够通过利用他们的学术研究获利。这些基金包括由法马的一位前学生创立的,管理着6770亿美元资产的尺寸基金顾问提供的基金。法马和弗伦奇都担任董事和顾问。
法国人免费提供他们的数据集在他的达特茅斯大学主页上——这种善举使其他人能够使用和测试这些数据集,并放大了这些模型的影响。从1926年开始的每个月,任何人都可以查看市场的回报以及按因素分类的投资组合的盈亏情况。
2021年,三位当时在多伦多大学任职的教授注意到了一些奇怪且可能令人不安的事情。这些数字是“嘈杂的”—也就是说,它们在不同时间从网站下载时会发生显著变化。帕特·阿基、阿德里安娜·罗伯逊和米哈伊尔·西姆廷在两篇工作论文中记录了他们令人困惑的发现——这些论文是法马在电子邮件中引用的。作者们指出,数字的变化似乎改善了价值投资策略的历史记录——也就是购买便宜股票的策略,并写道“缺乏透明度”使人无法理解其中的含义。
法马和法国的11月文章证实了数字的变化并阐明了原因。其中包括:历史股市记录的更正以及与会计准则变化相关的调整,这些调整影响了某些股票的分类方式。法国的达特茅斯大学网站现在包含了数据的早期版本存档,以便研究人员进行比较。
这就是科学:多伦多的研究人员指出了一些奇怪的事情,法马和法国则用更多的数据和信息回答了这些问题。但这个交流的故事很有启发性。关于学术金融的等级世界,期刊文章可以成为数十亿美元交易策略的基础。以及塑造投资者对市场理解的数字固有混乱。
罗伯逊。摄影师:Akilah Townsend for Bloomberg Markets知识有一个工厂。了解金融市场和经济的过程不仅发生在交易台上,还发生在大学里,在一个协作的全球装配线上。有人在市场的大量数字中发现了一个想法。他们将其发送到生产部门进行测试,塑造它,将其转化为研究。随着时间的推移,它被发送出去供广泛消费,世界就会了解更多并根据所知行事。
这个过程依赖于一些假设:即了解像市场这样不断变化的东西是可能的;建立只能近似现实的模型是有用的;每一份研究都是我们可以从中学到更多的起点。关于因子数据的争论始于研究人员试图更多地了解,特别是关于指数。在新冠疫情进入后期时,阿基、罗伯逊和西姆廷一起在那个时代伟大的研讨室——一个Zoom会议中工作。他们正在更新一篇使用法玛-法伦奇数据库的论文。
作为这个过程的一部分,他们重新运行了他们草稿中的代码——基本上,他们刷新了页面。当西姆廷按下按钮时,数字发生了变化。“使它变得超级、超级奇怪的是,只有一半的数字发生了变化,”罗伯逊说。只有从法玛-法伦奇股票回报数据集生成的数字。
“然后兔子洞打开了,我们就跳下去了”
Simutin记得在攻读博士学位时曾遇到过这个问题,当时他在不列颠哥伦比亚大学攻读金融学博士学位。他打开了带有原始数据的Excel文件,并制作了一个简单的折线图,比较了数字的差值,旧数据减去新数据。在一个完美的世界里,这条线本应是平的。“但是,相反,它在摇摆不定,”罗伯逊说,他教授商法,拥有耶鲁大学的法学学位和金融博士学位。“然后兔子洞打开了,我们就跌进去了。”
像许多现代的兔子洞一样,这个兔子洞深入到了网络的最深处。团队去了一个名为互联网档案馆的网站,看看它的Wayback Machine——一个存储旧网页的库——是否抓取了Fama-French数据集的先前版本。它抓取了:他们能够整理出多组数字,追溯到2005年。他们称每一组数据为“数据的年份”。
当然,随着时间的推移和新的月份被添加到库中,数字会发生变化。但这不是问题所在。相同月份的数据在不同版本之间也会发生变化。“你的历史数据被反复更改,”罗伯逊说。“你绝对想不到,相当于1989年1月27日的气温,取决于你何时下载,如果你是今年查看还是去年查看。这就是我们发现的等同物。”
该网站已经披露承认了一些修订,比如来自提供商Compustat和Center for Research in Security Prices(CRSP),芝加哥大学的附属机构,跟踪价格并创建市场指数,被基金公司包括Vanguard Group许可使用。(拥有彭博新闻的彭博有限合伙公司向机构客户出售数据和指数,包括基于因子的指数。)CRSP已经进行了一个更新数据的大项目,以及在发现错误时进行修正,合并数据,整理流通股数量。团队发现这些操作只能解释部分变化。法国的网站还指出了与会计准则变化相关的调整,但没有量化影响。
回报的差异以基点为单位进行衡量,即每月的百分之一。但Akey,Robertson和Simutin在他们的主要论文“嘈杂因素”中写道,这些差异是普遍存在的并且会累积。例如,根据去年更新的版本以及在SSRN上发布的他们的论文的一个版本,该模型价值组合的77%的月度数字在2005年和2022年之间的不同超过了1%的年化率。他们说,这令人担忧,因为法玛和法国的模型已经深深融入现代金融领域。
学者们至少引用了法玛和弗伦奇1993年的论文35000次。这是量化金融革命的一个重大成就,该革命始于四十年前的芝加哥大学博士候选人哈里·马科维茨。在那之前,选股主要是一种工匠式的事务,基于交易员所谓的技能和良好判断。马科维茨提出了另一种方式:不是试图预测和挑选赢家,而是应该进行多样化。选择几家风险互相平衡的不同公司,你可以使用数学来创建一个更稳定且仍然提供良好回报的投资组合。马科维茨在1990年获得了诺贝尔经济学奖。更多经济学家,包括约翰·林特纳和未来的诺贝尔得主威廉·夏普,基于马科维茨的洞察。他们不是考虑如何使投资组合在孤立情况下更好,而是考虑它相对于整体市场的表现。一些股票在市场上涨时可靠地起飞,而在市场下跌时则崩盘,而其他股票对市场的波动反应较小。你可以根据你想要投资组合比整体市场更不易波动,还是更易波动以换取更高的潜在回报来构建你的投资组合。“很长一段时间,金融学者们认为有这么一个重要因素,即整体股市,这就是一切的衡量标准。一切都是根据这个因素来衡量的,”麻省理工学院斯隆管理学院金融学教授、研究资产定价的安德鲁·罗说。“然后法玛和弗伦奇出现了。”
法玛在1960年代奠定了基础,提出了一个不同的重要观点:市场是有效的。交易员迅速“定价”了关于股票的所有可用信息,无论是关于盈利下滑的新闻,产品成功还是即将袭击公司主要工厂的飓风。因此,即使是专业人士也很难击败市场,尤其是在扣除费用之后。法玛的有效市场假说是如今许多投资者拥有指数基金的重要原因。 这也是他在2013年获得诺贝尔奖的原因。
“50多年来,学者们一直在努力解释为什么一只股票的预期回报率比另一只高”
但在试图解释为什么一些股票表现比其他股票更好时,法玛和弗伦奇发现了一种可以绕过“你无法击败市场”的规则的漏洞,或者至少是重新定义了“市场”意味着什么的修改。某些类型的股票为投资者提供了额外的回报。即,小公司股票和便宜的价值股,根据股价相对于公司资产价值的比率来衡量,也被称为它们的账面价值。现在有三个因素可以解释股票的回报。
这个“三因子模型”在很大程度上塑造了专业人士如何谈论绩效。它有助于确定基金经理是否真正有技能。如果你把钱放在共同基金中,它提供了15%的回报,你可能会感到很高兴因为变得更富有了15%,但你不知道基金经理是否增加了任何价值。“在任何时间段,你可能会有一个很棒的回报,因为你承担了很大的风险,而风险得到了回报,”现在是法国商学院Insead的访问教授Akey说。“查看原始回报并不是正确的度量标准。那是运气。”
法玛-法伦三因子模型增加了更多的复杂性。您可以衡量一个基金相对于市场风险所取得的表现——当年市场也上涨了15%吗?——以及相对于其对小盘股和价值股的暴露。在剔除这些因素之后,您可能会发现15%的表现有点令人失望。
这些因素已经衍生出其他用途。在第二篇论文中,“法律中的噪音因素”,作者们研究了数据可能在诉讼中的应用方式。假设一家公司正在受到股东的起诉,他们声称管理人员犯了一个错误导致股价下跌。因素可以提供一个更精细的估计,即如果没有错误,股票将会表现如何。
当然,这些因素指向了赚钱的方法:与其购买标普500指数基金,您可以投资于一个多元化的小盘股或价值股基金,希望获得更高的回报。或者投资于一个向较小或更便宜的股票倾斜的类似指数的投资组合。这些是奥斯汀总部的Dimensional专门从事的基金类型。David Booth于1981年共同创立了这家公司,并邀请他的前任老师法玛成为股东。该公司今天将自己定位为一种维恩和智囊团的混合体,旗下有一批顶尖学者。在Dimensional网站上的一个视频中,法玛说:“他们觉得应该让我们做研究,如果有什么可以用的,他们就会采纳。”2008年,Booth捐赠了3亿美元给芝加哥的商学项目—他的导师的学术归属现在被称为布斯商学院。
同一股票市场的两种观点
在假设价值策略中$10,000的增长
来源:Pat Akey,Adriana Robertson和Mikhail Simutin,基于Fama-French数据库的数据
因此,因子是一个非常重要的业务和一个非常重要的问题。但是多伦多小组为投资者发现的数据差异有多重要?如果你是共同基金经理,你可能会在于你的业绩是否超过了根据数据的年代而变化。但对于投资者来说,显而易见的问题是,无论数据何时被提取,这些因子是否仍然成立。
多伦多的作者发现这些因子确实存在,问题在于规模。最明显的变化是价值因子。考虑一个假设的投资组合,从1926年开始在价值股上押注$10,000,同时押注成长股。从1926年到2005年,如果你看的是2005年的数据,它的平均每月增长率为0.41%。这个$10,000的投资组合在2005年会增长到大约$250,000。然而,在2022年版本的数据中,价值优势增长到0.45%。现在同一时期内的投资组合将增长到大约$400,000。
“嘈杂因素”论文指出的不仅仅是移动的数字。法国数据库网站的底层源代码—mba.tuck.dartmouth.edu—显示:“网站由Dimensional基金顾问网站开发团队开发。”众所周知,法马和法伦奇与Dimensional合作,并且在法伦奇的主页上披露了这一点。一些学者,特别是那些与基金公司合作或咨询的学者,说他们一直认为Dimensional进行数据处理。但是,公司与因子数据之间的关系并不清楚,多伦多小组写道。
法玛和弗伦奇在他们最新的论文中更详细地阐述了这种关系,该论文现在链接在弗伦奇的数据页面的顶部。它说,根据法玛和弗伦奇的指导,Dimensional的员工制作并发布每月更新。
因子溢价是Dimensional向客户推销的一部分。但是价值投资在最近几年里一直是一次坎坷的旅程。在全球金融危机之后,一位价值投资者押注反对当时的大赢家——尽管估值高昂,但仍在持续上涨的科技宠儿。根据弗伦奇的百年数据,2020年是价值回报的有史以来最糟糕的一年,紧随其后的是连续三年的亏损。最近,在2021年和2022年,价值投资又卷土重来;更近一步来看,它又再次表现不佳。
2005年至2022年数据的变化使得历史上的价值溢价看起来比以往更大。对此应该怎么看?《嘈杂的因素》的作者们对Dimensional与许多学者依赖的数据的关系提出了一个反问的眉毛挑起。他们写道:“我们不去猜测,”“我们只是指出,这种缺乏透明度,再加上因素变化的模式,可能会让依赖这些因素进行实证分析的研究人员感到担忧。”
《嘈杂的因素》中缺乏具体结论和潜台词让一些阅读过的学者感到困扰。作者们说这也让他们感到担忧。“总会有这样的想法——我是真心这么说的——你会想,‘也许我们需要放手了,’”罗伯逊说。“‘也许这是…’”她话锋一转。“但你不能就这么放手,因为你需要了解你的数据发生了什么。”
罗伯逊和她的合著者们可能在宪法上不适合放手。阿基是一名前竞技击剑手,在伦敦商学院攻读金融研究生学位,他说他喜欢解决难题:“我喜欢综合思想,将它们放在一起,看看其他人可能忽略了什么。” 罗伯逊则是“更像一个乐高积木的人。” 她在Zoom上说,她的客厅里现在有“四个巨大的乐高套装。它们都超过6000块。” 西姆廷有一级黑带,但他说他更专注于网球——这是法马年轻时的爱好。
西姆廷。摄影师:彭博市场的露西·卢法马和弗伦奇似乎不急于回应三人的发球。对于法马来说,“嘈杂的因素”论文基本上是关于无关紧要的事情。“我认为你在浪费时间,”他在被问及这些变化之前说道,在与弗伦奇合作发表11月论文之前。人们总是试图干扰他的工作;他们有一种倾向,即用研究制造轰动。数据会不断更新,因此因子也会改变。“学者们习惯了这一点,并赞赏这种努力。这让行业人士发疯。不幸的是,所有数据库都存在这个问题的一个版本。” 弗伦奇拒绝置评,Dimensional的发言人泰勒·史密斯也是如此。
在法马最终与弗伦奇合作发表的论文中,他们得出结论,自2002年以来基础数据和方法论的变化使价值溢价平均每月提高了0.03个百分点,或者说3个基点。这比多伦多小组发现的要小,但法马和弗伦奇考虑的样本与“嘈杂的因素”小组不同。根据法马和弗伦奇的说法,大部分变化是由于CRSP在1947年之前纠正了公司流通股份的数据,这影响了他们的计算。2021年9月,法马和弗伦奇还决定停止使用专有方法连接Compustat和CRSP的数据,并开始使用CRSP提供的标准链接。这产生了部分抵消效果,使价值溢价略微下降。法马和弗伦奇还写道,数据的变化使小市值效应看起来较弱,每月下降不到0.01个百分点。Dimensional还经营着倾向于小公司的基金——因此,如果有什么变化,那对公司是不利的。
在“噪音因素”开始流传后,法国网站上出现了一些变化。它开始发布旧的葡萄酒年份——从2005年开始的每月和每年收益文件——(多伦多小组使用这些数据更新了论文,并得到了类似的结果。)法国“没有告诉我们,没有人告诉我们,他们只是有一天这样做了,”罗伯逊说,他后来在离法马办公室不远的芝加哥大学法学院找到了一份工作。“我不能证明有意图,但时间安排很有趣。”
Fama和French如何说因素移动了
由于数据修订、方法论和其他变化,平均每月表现的变化,以基点计
来源:尤金·法马和肯尼斯·法国
从1926年7月到2023年7月小市值股票减去大市值股票,以及价值股票减去成长股票的表现变化。
经济研究人员和从业者知道他们的数据是脆弱的。输入、参数和样本的微小调整可能会破坏一切。在各个科学领域,研究人员越来越敏感于数据挖掘的问题——当你对任何大型数据集进行足够深入的研究时,你肯定会发现一些模式,即使其中许多只是巧合。研究人员越多,每个人以不同方式调整其测试的旋钮和设置,就会发现越多的巧合。
在法马和法国的发现之后,寻找更多因素成为了一种小型产业。2019年,杜克大学的坎贝尔·哈维和普渡大学的延刘发表了一篇名为“因子动物园普查”的论文,在其中列出了在顶级期刊中发现的400多个因子。“当然,其中许多是虚假的,”他们写道。他们认为,发现的数量之多意味着数据正在被挖掘以产生因子。试图基于其中一个进行投资,你很可能会发现它站不住脚。该论文指出,价值因子仍然足够强大,可以经受住他们最严格的统计测试。
“你来找国王,最好不要错过”
“吵闹因素”作者认为他们的工作没有揭示错误的发现。但在这种背景下,它注定会引起一些轰动。其他研究人员开始努力弄清楚这些差异到底有多令人担忧。在阿尔伯塔省班夫的北部金融协会会议上,莱斯大学的罗伯特·迪特马警告说,不要暗示法玛和弗伦奇在做什么可疑的事情。他引用了《火线》中的奥马·利特的话:“你来找国王,最好不要错过。” 从那时起,迪特马看到这篇论文在学术金融会议上被多次展示,到了一种有点像团体疗法的程度。“我们这个领域的几乎所有人都尝试过重新创建肯·法玛在他的网站上发布的法玛-弗伦奇数据,你会非常接近,但永远也达不到那个水平,”他说。
Akey在2023年6月的西部金融协会会议上展示了“吵闹因素”。之后,当时在肯塔基大学的查理·克拉克提出了怀疑的分析。克拉克使用不同的统计方法进行测试,发现CRSP的更新可以在很大程度上解释法玛-弗伦奇数据前半部分的变化,而与上世纪90年代初企业会计规则变化有关的调整则占剩余变化的很大比例。这与法玛和弗伦奇后来提出的解释类似。“我没有看到任何看起来不正当、不当的东西,我认为我们可以在这方面取得进展。或者我希望我们可以,”克拉克说。
在会议上,Akey说他很欣赏Clarke的细致工作,并且他们之所以能够讨论数据可能发生变化的原因,是因为他和他的合著者们已经表明数据确实发生了变化。仍然有一些未解之谜:即使对两个特定会计准则的反应可以解释许多变化,Fama和French可能做出了其他完全合理的调整,这些调整可能会使数字朝不同的方向发展?“我们并不一定知道可能发生的事情,”Akey说。他提到了统计学中一个被称为“分叉路径花园”的概念,这个概念源自豪尔赫·路易斯·博尔赫斯的一个幻想短篇小说。一个善意的研究人员可以选择许多种方式来查看数据,即使不是为了找到一个预设答案,也很容易做出看似符合他们手头信息的选择。
Akey。摄影师:Bloomberg Markets的Lucy Lu波士顿学院客座金融教授Mathias Hasler进行了与多伦多研究无关的Fama-French因子的研究。他喜欢研究当一个现象出现在一篇论文的样本中时——在某些数字的切片中——但如果你从稍微不同的角度看事物,这种现象会消失或缩小。他深入研究了Fama和French如何决定什么构成价值。他说:“他们在论文中做出的构建价值溢价的决策导致了额外的回报,相对于他们可能通过其他合理决策获得的回报。”他考虑的备选决策似乎微不足道——例如,关于在哪些日子获取市场数据的时间选择。
Hasler表示,他的研究并不意味着法玛和弗伦奇在寻找一个好结果。“他们非常聪明,他们知道数据挖掘的危险,”他说,并补充说他们以真正追求知识而闻名。“另一个解释可能是,也许他们只是做了一系列决策,假设这些决策并不重要,然后,也许仅仅是偶然,他们做出了导致高回报的决策。”
Hasler的文章即将发表在有些持不同意见的*《关键金融评论》中。法玛和弗伦奇做出了回应,在《CFR》*网站上发表了一页内容,称很难评估他对价值的不同定义:“对我们的[价值因子]来说,其平均回报高于大多数其他替代方案,这是好消息还是坏消息?”
法玛表示,因子模型并非完美。“我们使用‘模型’这个词是因为它不是现实——它是一种近似,它会有问题,”他在2021年接受旧金山大学金融教授Ludwig Chincarini的采访中说。“我对因子模型有点消极,因为它打开了一个潘多拉魔盒。”他说,人们会寻找因子并“试图不一定开发模型,而是开发他们想要出售的投资产品。”他承认价值溢价似乎在最近几年有所降低。但他说,绩效如此波动,需要几十年才能得出确切结论。
过去的表现,就像共同基金广告上所说的那样,不能保证未来的结果。即使你能获得完美的历史数据,它只告诉你历史。为什么小盘股和价值因子有效?一个可能性是,某种东西——也许是非理性的恐惧或市场结构上的缺陷——导致投资者不合理地避开这些股票,以至于买家得到了便宜货。如果投资者在过去是非理性的,这些影响可能会在现在消失,因为每个人都读过法玛和弗伦奇。
另一种可能性是,更高的回报是对某种风险的理性回报。在这种情况下,也许这些因子会继续存在。“50多年来,学者们一直在努力解释为什么一只股票的预期回报比另一只高,” 杜克大学的哈维说。法玛和弗伦奇领导的研究人员取得了很大进展。“然而,我们只是触及了表面。下一代金融研究人员还有很多工作要做。”
对旧因子的审查凸显了学术研究向更多数据透明度的转变。一些金融期刊现在要求或者在新论文旁边发布研究代码。最基本的数据和代码曾经是几个小时和几个小时的手工和脑力劳动的产物,钢笔和纸张和栏和笨拙的软件。即使技术进步了,法玛和弗伦奇分享数据被视为慷慨的,甚至是激进的。但期望值不断上升,部分原因是因为更好、更快的计算,弗吉尼亚大学麦金泰尔商学院的教授迈克尔·加尔迈尔说。“现在你找到一个优秀的博士生,让他们在一个周末里研究,他们可能能够复制别人在一整篇论文中所做的事情,” 他说。
“吵闹因素”三人组认为法玛和弗伦奇的11月论文在一定程度上回答了他们的问题,提供了变化的“如何”,尽管并非完全解释了“为什么”。至少,他们希望法玛和弗伦奇在发表他们的答辩时承认了“吵闹因素”。Simutin说:“在引用你所建立的工作时,这是良好的学术实践。”
法玛和弗伦奇的论点是,复杂数据的变化不应该让人感到震惊。在他们的注释结尾,他们指出了其中心的混淆问题。“因子构建的细节是有争议的,没有什么神奇之处,”他们写道。“适当的警告是:自担风险。”Childs是Planet Money的联合主持人,是NPR的经济播客的作者,也是Flatiron Books的《债券之王:一个人如何创造市场、建立帝国并最终失去一切》的作者。Lee在伦敦为彭博新闻报道量化投资。