相信数据?并非总是,但你仍应该使用它 - 彭博社
Allison Schrager
这是大量的数据。
摄影师:Jonathan Nackstrand/AFP
我被金融吸引是因为它承诺在混乱中带来一些秩序。这里有一个市场,每天有数十亿笔交易 —— 但它设定了每个资产的价格,这个价格将未来风险的价值放在了一个字面上的数字上,或者更准确地说,人们在当今时代评估这些风险的价值有多高。世界充斥着信息 —— 关于个别公司,关于宏观经济,关于地缘政治风险,关于(不要太元)价格本身 —— 而这个价格几乎瞬间就将所有这些信息都融合了进去。这就是市场效率的定义。
Bloomberg观点拜登的住房议程需要翻新最高法院仍然存在伦理问题这是拜登的繁荣经济,蠢货!特朗普主义正在清空教堂除了一件小事:这个数字,这个价格,一直都有点错误。事实证明,数据存在问题。
金融界的激烈争议提醒人们,任何人曾经拥有的任何确定性都是一种幻觉。这涉及一篇学术论文,质疑因子投资的好处,投资者根据“因子”(如公司规模或其股价与资产价值的比较)做出决策。理论上,这种投资可以带来比整个市场更好的回报。
这篇论文认为,因子投资之父肯尼斯·弗伦奇和尤金·法玛公开收集的数据随时间变化 — 当数据发生变化时,因子和它们对投资组合的价值估计也会发生变化。确实,新旧数据都表明因子投资有益,但具体效益取决于使用哪些数据。
数据变化时,预期回报也会变化
1926年投资于价值股票的1万美元在将近八十年后会值多少?这取决于你使用哪些数字
来源:帕特·阿基、阿德里安娜·罗伯逊和米哈伊尔·西姆廷,基于法玛-弗伦奇数据库的数据
这不仅仅是一场学术争论。因子模型在商学院中被教授,并经常用于评估市场表现和资本价格。法玛和弗伦奇还与一家名为Dimensional Fund Advisors(DFA)的共同基金公司有关,该公司提供过度配重因子的基金。DFA员工以一种对外人不透明的方式协助处理法玛/弗伦奇数据。
完全披露:我在10多年前曾与法玛和弗伦奇在DFA一起从事另一个与此无关的数据项目。一个让我印象深刻的教训是,无论数据来源如何,所有金融数据都非常嘈杂。通过金融数据做出的大多数估计对所选择的时间范围和所做的任何假设都非常敏感(并且必须始终做出假设)。没有人应该将金融变量的估计视为实际事实。
构建数据集需要做出许多判断,数据通常会随着更多信息的获得而进行修订,无论是通过法规变化还是测量实践的变化。因子数据尤其嘈杂,因为它们需要对应该进行哪些计算以定义“价值股票”或小公司做出假设。这是一个非常容易受到解释的过程。
噪音不仅是金融数据生活中的一个事实,它也存在于经济数据,健康数据甚至Reddit评论数据。正如伟大的Fischer Black在他几乎40年前发表的关于数据噪音的有远见的文章中所说:“我认为几乎所有市场几乎所有时候都是有效的。‘几乎所有’意味着至少90%。”
即使90%也会产生很多噪音。
数据不仅描绘了过去的模糊图景,也模糊了我们对未来的视野。数据无法掩盖价值投资近年来表现糟糕,或者小型公司的前景可能并不乐观,因为大型科技公司继续主导市场。
这可能只是这些因素偶尔经历的困难时期,正如它们有时会经历的那样。或者这可能表明更深层次的变化。一个重视无形资本——知识产权而不是机器——的市场可能意味着价值股将获得较低的回报。一个更重视规模化和主导市场能力的经济可能意味着小公司的价值会降低。一个不断变化的世界意味着更不可靠和更具波动性的估计。
随着社会科学中的复制危机持续发展,重要的是要注意,很少有学者被发现不诚实。许多差异只是反映了使用数据的任意性,以及研究人员不得不做出的任何假设。大数据时代应该带来更一致和可靠的工作 — 但大量数据也可能包含大量噪音。
金融领域的这种争议具有启发性。数据量令人震惊,不仅涉及市场交易,还涉及诸如医疗干预等事物。数据通常充满噪音,甚至最新的工具 — 我在谈论你,人工智能 — 也无法使其完全可靠。随着我们进入一个数据更加易于获取的世界,我们应该更加意识到其局限性。
我这里并不是在提倡后现代主义。数据仍然是一种非常有价值的工具,可以帮助人们做出更理性和知情的选择。布莱克的90%估计大致正确 — 而90%要比没有好得多。即使有很多噪音,数据仍然显示因子投资可以是一种稳健的策略和了解市场的好方法。但在大数据的世界中,我们都需要为一些大噪音做好准备。这意味着永远不要假设精确性,并用我们自己的老式人类判断来调和数据告诉我们的内容。
在彭博观点的其他地方:
- 宁可将那些就业数据扔到墙上:约翰·奥瑟斯
- 忘记你在过去20年中学到的有关投资的知识:梅琳·萨默塞特·韦伯
- 糟糕的大数据研究可能动摇你对科学的信仰:加里·史密斯
欲了解更多彭博见解,请订阅我们的新闻简报。