语音转文字错误频出 用户尴尬不已 - 《华尔街日报》
Sarah E. Needleman
米歇尔·尼维斯不再用键盘打字,而是用嘴撰写社交媒体帖子——无论效果好坏。米歇尔·尼维斯用嘴撰写社交媒体帖子——无论效果好坏。
这位纽约市联邦惩教署退休官员利用手机上的一个功能,将自己的语音即时转换为文字。这种快捷方式节省了她的时间和精力,但也让她对准确性失去了兴趣。
在Twitter和Facebook上,她朋友珍妮的名字被识别为“精灵”。另一位绰号McSlothy的朋友名字则变成了“邋遢鬼”。
厌倦了纠正这些错误后,尼维斯女士现在用这些新绰号称呼她的朋友们。“他们都接受了,”她说。
实时语音转写技术越来越受欢迎——我们出错的概率也随之增加。这些错误变得如此普遍,以至于像尼维斯女士这样的人已将常见错误纳入了日常词汇,而其他人则学会了破译家人和朋友发送的胡言乱语。
根据Insider Intelligence的数据,去年在美国,约有8200万人每月至少使用一次Alphabet公司旗下Google Assistant,约7700万人使用苹果公司的Siri来处理口头指令,包括编写短信、电子邮件和社交媒体帖子。这两个数字较2020年增长了12%以上,而且该机构并未统计手机或笔记本电脑上手动触发语音转写的情况。
这项技术让人们避免了在狭小智能手机屏幕上打字的痛苦。其他人则依赖它来解放双手撰写文案,比如在开车时。
风险在于它容易将话语变成晦涩难懂的胡言乱语,捕捉到无关的语音并插入令人不快的词汇。社交媒体上,用户们互相提醒避免说出某些词语——比如"caulk(填缝剂)“和缩写"P & S”——以免语音转文字应用误听成男性生殖器的指代。
去年夏天,保险代理人马特·谢尔顿在给前老板口述一条关于高尔夫球赛的短信时说了句"好球!“然后点击发送。当这位堪萨斯州温菲尔德市的保险经纪人等待回复时,他发现自己惊恐地发现转录文本中"shot(击球)“拼错了一个字母,变成了一个粗俗词汇。
“我简直无地自容,“谢尔顿先生回忆道,因为他的前老板从不说脏话,“要是他平时满嘴脏话倒还好些。”
家庭对话中的误译同样令人窘迫。巴尔的摩医院单身员工莉莉·考夫曼本想发信息告诉母亲自己和猫咪安妮在一起,结果母亲收到的却是女儿正和安迪依偎在被窝里相互取暖——安迪碰巧是她叔叔的名字。
“你只是想发条普通信息,可它们连这都搞不对,“考夫曼女士无奈道。
有些人则学会了破译错误的转录文本。去年春天劳伦·阿泽维多出国公干时,发短信让父亲转播波士顿棕熊队的冰球赛况。
父亲回复道:“德里斯舔它出来林恩洞在”(注:原文为无意义的乱码)
劳伦·阿泽维多与父亲托尼·阿泽维多在波士顿棕熊队比赛现场。照片:劳伦·阿泽维多翻译:马特·格热尔奇克已离开冰场,汉普斯·林霍尔姆正在比赛。阿泽维多女士立刻明白了情况。“我连眼睛都没眨一下,“她说。
研究语音转录的学者表示,期待零错误的文本是不现实的。俚语、缩略词和背景噪音会影响结果,大多数语音转文字程序仅适用于北美常见口音的英语。
来自中国的Sam Liang深有体会。在开发语音转录工具Otter.ai公司时,该程序最初将其名称听写为"other”。
这位居住在加州山景城的公司创始人将错误归咎于自己的中国口音。此后他训练Otter识别自己的名字。他补充说,用户可以通过选择软件的个人词汇功能对特定词汇进行类似训练。
得益于机器学习的兴起,语音转文字程序近年来有所改进。这项人工智能技术通过研究大量语言模式来预测用户将要说的内容,从而提高了语音转录效率。
“我们的行为相当可预测,“安大略省滑铁卢的人机交互学者Cosmin Munteanu说。
“一旦脱离常规,事情就会变得混乱,“他补充道。“即兴喜剧就不太适用。”
数字也可能是个挑战。圣诞节前不久,佛罗里达州塔拉哈西的零售员工Arthur Vascherault无意中听到父亲对着智能手机应用程序口述一道辣豆菜的食谱,结果被转写成文字发送给了朋友。
假日混合调料配方中包含了碎红辣椒片,要求加入三到四汤匙。瓦舍罗先生收到父亲发来的满是错误的短信时,忍不住瞥了一眼,发现信息写着要加34汤匙。“这简直离谱到天际,“他说。
关于这项技术还有一点要记住:它有个开关。
安大略省的护士安吉拉·伍德曼在双车道公路上行驶时,给老板发了一条语音转文字短信。发完后,她开始咒骂前面开得太慢的司机。然后她点击了发送。
她没做的是关闭麦克风。几分钟后,当她意识到短信会向老板发送什么内容时,赶紧发了一条道歉信息。
去年,塞巴斯蒂安·奥多用传统方式给老板打字发短信时,甚至没意识到自己打开了手机麦克风,中途还停下来对儿子说了句"我爱你”。
“我们也爱你,“他的老板回复道。
塞巴斯蒂安·奥多和他的儿子马克西姆斯·奥多。图片来源:查理-安·奥多"我当时就想,‘天哪,我刚刚干了什么?’“纽约州布里亚克利夫庄园的营销专业人士奥多先生说。
伊莱恩·艾尔斯在12月摔断右手腕后开始使用语音转文字技术。由于受伤,她放任了拼写错误,但其他人可没那么宽容。
“人们总是揪着我的错别字不放,“这位大学历史教授艾尔斯女士说。于是她又回归了键盘输入。
“这种挫败感让我忍无可忍,”她说。“我暂时只能用左手打字了。”
致信 Sarah E. Needleman,邮箱:[email protected]
刊登于2023年2月1日印刷版,标题为《语音转文字错误频出令用户尴尬不已》。