人工智能初创公司希望帮助你识别工作中何时有人在撒谎 - 彭博社
Tracy Alloway
一台计算机化的测谎机正在模拟情况下使用。
摄影师:迪玛·科罗塔耶夫/盖蒂图片社欧洲菲尔·休斯顿知道如何识别谎言。这位前中央情报局官员,有时被称为人类测谎仪,他实际上写了关于识别欺骗的书。他的技术被美国情报机构、企业和亿万富翁使用。
现在,他正在寻求利用人工智能的力量来增强他的系统——并将其推向倾听财报电话会议的对冲基金、采访嫌疑人的调查员、考虑潜在新雇员的雇主,或任何其他试图发现虚伪的人。
关于承诺将测谎技术从艺术转变为科学的技术,历史上有过很长的炒作,但这些技术往往远未达到预期。而且对于人工智能是否会像一些人相信的那样具有变革性也存在很多疑虑。
但休斯顿是少数几家初创公司中的一员,他们表示这项技术即将为法医学领域带来重大突破。他的新公司CyberQ使用生成性人工智能来解析记录和分析陈述,以寻找欺骗的明显迹象。他表示,仅需几秒钟,就可以以92%的准确率检测误导性陈述。
“任何处理人类的组织,包括他们的员工和其他人,并且面临欺骗对其商业模式、商业运营等产生负面影响的情况,都可以使用这个,”他说。
## 奇怪的交易
一位前CIA官员解释如何在商业中识别谎言
43:21
CyberQ只是众多新公司中的一员,旨在构建基于AI的谎言探测器。其他公司包括Arche AI、Coyote AI和Deceptio.AI也在尝试类似的事情,并声称能取得相似的结果。
CyberQ的突出之处在于其高管背景。休斯顿在CIA工作了25年,担任调查员和测谎师,开发了至今仍被政府机构使用的谎言检测方法。他的联合创始人兼首席运营官苏珊·卡尼切罗在CIA工作了超过三十年,教授他的系统。CyberQ的首席执行官西蒙·弗雷切特曾与两人在休斯顿的早期创业公司QVerity合作,该公司提供欺骗检测服务和咨询。
他们一起训练了“Q”——这个聊天机器人被称为——使用了数百个经过验证的真相和谎言的例子。训练材料包括与OJ·辛普森的警方采访、恩龙公司首席执行官杰弗里·斯基林臭名昭著的国会作证,以及德国公司Wirecard管理层的声明,该公司 因丑闻而崩溃。
Frechette说,最大的挑战之一是消除假阳性,即Q标记为谎言的真实陈述。
这部分是因为找到看似欺骗行为但最终被证明是真实的例子很困难。亚伦·奎因(Aaron Quinn)的女友在2015年从他们位于加利福尼亚的家中被绑架,他提供了一个看似可疑但最终被证明是真实的言论的罕见例子。
从表面上看,软件的操作似乎相当简单:CyberQ的工程师输入一个提示——休斯顿不会透露具体是什么(“那是秘密配方,”他说)——并上传要审核的文本。客户会收到一份标记过的转录本,包含三种潜在结果:没有指示欺骗行为,指示欺骗行为,或需要后续跟进。
要理解这些判断背后的驱动因素,了解构成Q训练基础的谎言检测系统的情况是有帮助的。虽然许多人认为这项技术涉及专注于一系列身体行为——比如回避的目光或紧张的动作——但这并不是专家们通常采取的方法。
“对我们来说,眼神接触不是一种欺骗行为,”卡尼塞罗(Carnicero)说。“我们都知道要看着某人的眼睛才能显得真实。而坏人也知道这一点。所以他们会利用这一点来对付你。”
相反,Q寻找的是更为可靠的特定语言模式。这些模式包括引用性陈述(“正如我对最后一个家伙说的……”)、限定词(“老实说……”)和影响谎言(“你不知道我是谁吗?”)。其他标志包括未能回答问题、提供过于具体的答案、缺乏具体的否认等等。
人类行为当然不是完全可预测的,这使得之前创造技术真相血清的努力失败。
测谎仪测量心率、血压和出汗等生理反应,正是一个例子。它们在流行文化中变得无处不在,并被广泛使用。但在1988年,联邦法律限制了它们在私营部门的使用,十年后,美国最高法院维持了将其排除在军事程序之外的决定,引用研究得出的结论是,结果“几乎和抛硬币一样好”。
在中央情报局教授测谎术的休斯顿承认这项技术的局限性。虽然目前在法庭或就业过程中尚无限制使用人工智能测谎的规则,但他认为Q是一个可以帮助调查人员聚焦于正确方向的工具——而不一定是得出结果的方法。
对于测谎仪,他说:“你必须对每个问题回答,是或否。这是一个单词的回答。现在,它在识别某人是否在对这个单词的回答说真话方面具有很大的价值。而且它也可以作为一种心理上的楔子,因为[然后]你告诉某人‘好吧,现在我知道你在说谎。’”
理论上,Q可以比测谎仪更进一步——不仅为面试官提供压力点,还可以识别值得进一步追踪的具体陈述。
“这为审讯者打开了一个全新的世界,”休斯顿说。
“例如,如果有人说‘哦,我是一个诚实的人,我绝对不会那样做。’那么,这就是一种欺骗行为,但它也向我们传达了这个人可能和其他事情一样担心自己的声誉。因此,我们可以将其纳入我们的面试模型,以帮助提供额外的信息,”休斯顿补充道。
重要的是,休斯顿声称Q可以仅根据其受访者所说的话来评估真实性,这使其在潜意识偏见方面可能比人类审讯者更不容易受到影响。
虽然Q在早期发展阶段显示出一些偏见的初步迹象,但休斯顿表示,在九个月的训练过程中,它变得更加公平和准确。对于这种技术的支持者来说,使用一个无面孔的机器人来分析口头表达,而对说话者的真实身份没有任何了解,是一个特性,而不是缺陷。
“该机构的原始模型旨在具有全球适用性,”休斯顿说。“它旨在超越文化和年龄等任何因素,使其尽可能客观。话虽如此,它的客观性远不及Q,因为我们是人类。你知道,当我们提问时,我们会带着一些先入之见。作为人类,我们对与我们交谈的人都有偏见。”
**相关链接:**菲尔·休斯顿关于识别商业谎言的技巧 — Odd Lots