2022年互联网无法处理什么?撇号——《华尔街日报》
Katie Deighton
西布伦·斯图维尔(Sybren Stüvel)是一位居住在阿姆斯特丹的软件开发员,他的名字相当罕见,却面临着出人意料普遍存在的困境。
当他处理日常事务时,电脑系统总是不接受他的姓名,认为其无效或完全扭曲。信用卡公司拒绝承认他的名字,温哥华一家酒店在他刚经历九小时飞行疲惫不堪时,无法找到他的预订记录,航空公司甚至不允许他办理登机手续。“你能想象我的压力有多大,“他说。
“无效”字母他提到购买保险时,“他们让我确认我的姓氏确实是Stüvel。”
互联网已进入第四个十年,几乎所有事情都在线完成。然而,某些名字仍让机器束手无策。计算机能在国际象棋中击败加里·卡斯帕罗夫,但一些系统却对包含撇号、数字、连字符或英语文本中不常见字母的名字处理不当。
对于过时的技术来说,名字可能太长或太短,或者像斯图维尔先生的情况,包含一个变音符号——即元音上方的两点符号,表示不同的发音。
在航班事件中,他致电航空公司,对方发现问题所在:一个系统将他记录为"Stuvel”(网站强制他预订时使用的名字),而另一个系统则将他登记为"Stuevel”,即护照机器可读部分的拼写。这一部分通常位于护照身份页底部,撇号被删除,连字符变为"<",带重音符号的字母被转写为无重音形式:例如,“ñ"变为"n”,“ü"变为"ue”。
西布伦·斯图维尔展示着祖先在加拿大不列颠哥伦比亚省温哥华旅行时绘制的地图,他表示电脑常因变音符号拒绝识别他的名字。图片来源:西布伦·斯图维尔最终,斯图维尔先生以"Stuevel"这个他并不想要的第二身份登上了航班。
“我每周至少转发五次投诉,“维也纳软件工程师、名为”你的名字无效“的推特账号管理员米罗斯拉夫·谢迪维说。
在德国生活期间,当地公司常将其姓氏"Šedivý"中的"Š"和"ý"字母丢失,这促使他关注该话题。他曾追踪到一封收件人写着"米罗斯拉夫·埃迪夫"的邮件。
“邮递员从未将它投进我的信箱,“他说,“他无法匹配姓名。”
电脑常把莱莎·齐恩的名字弄得一团糟。图中外卖袋上被错误拼写的名字来自网络订单。图片来源:莱莎·齐恩该账号收集整理了类似的遭遇故事。
“嘿迪士尼,咱们聊聊名字问题,“用户莉娅·德安德烈-李最近在推特上向华特迪士尼公司喊话,称她在续订迪士尼主题乐园魔术钥匙通行证时,公司多次拒绝接受她的名字。“怎么回事?”
安德烈娅-李女士和丈夫克里斯·李是迪士尼的常客和铁杆粉丝,他们曾在迪士尼官方粉丝俱乐部2022年博览会的"鼠装大赛"中凭借角色扮演获得最佳表演奖。
这位洛杉矶演员兼戏服制作人表示,当全球最大媒体公司之一用"LEAH DANDREALEE”、“Leah D&andrea"或她收到的魔法钥匙通行证上通用的"魔法钥匙持有者"来称呼她时,令人沮丧(而她丈夫的通行证上写的是他的名字)。迪士尼未回应置评请求。
感到不满的还包括爱尔兰国家航空公司Aer Lingus的一些爱尔兰客户——具有讽刺意味的是,该公司预订系统不接受"奥尼尔"“奥布莱恩"等含撇号的姓名。
该航空公司发言人表示,其名为Astral的预订系统已有近60年历史,不支持特殊字符。
“我们认识到系统在接收特殊字符方面的局限性,对给客户带来的不便深表歉意。作为未来系统开发的一部分,我们将考虑采取合理措施解决此问题。”
Aer Lingus表示其预订系统不接受特殊字符,例如奥布莱恩等姓名中的撇号。图片来源:Clodagh Kilcoyne/REUTERS据Šedivý先生表示,企业已不再有技术理由在网页表单中拒绝特殊姓名。他指出,当今通过Unicode国际文本标准组织制定的UTF-8编码方案,软件能处理几乎所有语言的字符。万维网联盟(制定网络国际标准的机构)还针对不同方言的表单设计提供了指导规范。
部分企业因仍在使用ASCII码(美国信息交换标准代码)系统而导致姓名处理错误,该编码支持的字符数量远少于UTF-8。万维网联盟国际化工作组主席Addison Phillips指出,网页设计师也是问题根源之一。
Phillips先生解释道,设计师通常为防范垃圾信息或错误数据入库,会默认设置表单规则(如姓名须含3-10个字符)。但他们往往忽略了某些姓名无法满足这些预设条件。
“人们容易深陷自身文化认知,从而忽视世界其他文化的真实多样性,“他补充道。
Noëmi Aepli表示,系统常无法正确处理她名字中字母"ë"上方的分音符(与变音符号形似但功能不同)。这位瑞士苏黎世大学的博士生在不同数据库中被记录为Noëmi、No??mi和Noë«mi等多种版本。
上个月她赴加州大学伯克利分校进行为期六个月的访问研究时,新学生证上的名字显示为"No?mi”。
诺埃米·艾普利的大学学生证错误拼写了她的名字。照片:诺埃米·艾普利英格兰贝德福德郡的社交媒体经理阿什莉-杰恩·奥康奈尔表示,网络表单也经常拒绝她的名字。
“我的名字是阿什莉和杰恩——都是苏格兰拼写,中间有连字符——然后奥康奈尔还有个撇号,“她说。被拒绝后,她有时会尝试用昵称AJ,但可能因为太短又被否决。
“如果注册的东西很重要,我会忍气吞声,抱怨……然后改名字,“奥康奈尔女士说。“但如果是网上商店之类的,如果他们不能接受我的名字,我就不会用那家公司。”
莱莎·钱恩的父母在她小学时开始把她的名字拼写为"Chien”,因为医生总是找不到她的医疗记录。
钱恩博士是一位艺术史副教授,华裔,她在获得博士学位时重新使用了撇号。
“没有撇号让我越来越不舒服,“她说。“就像我通过电脑系统默许了某种种族抹杀或强制同化。”
钱恩博士在洛杉矶盖蒂中心。她父母在她小学时去掉了名字中的撇号,以简化拼写。照片:里德·约翰森尽管如此,一些网站仍对撇号报错,显示“无效”错误信息。她维护了一个列表,记录着不同账户中自己名字的各种拼写方式。
一些公司表示正在进行调整以避免此类麻烦。联邦快递(FedEx)公司表示,预计将在其在线表格中添加更多字符。
TurboTax和QuickBooks的母公司Intuit的一位发言人表示,公司已意识到某些字符在其在线字段中不被接受,并正在努力修复。该公司今年早些时候更新了错误提示,不再将带有特殊字符的名称称为“无效”。现在,提示信息改为“不允许使用特殊字符”。
用户体验研究员、咨询公司HmntyCntrd合伙人阿尔巴·比利亚米尔(Alba Villamil)表示,这样的微调可能会产生善意。“错误信息应该是一个机会,向用户传达是产品出了问题,”她说,“而不是他们的问题。”
致信凯蒂·戴顿(Katie Deighton),邮箱:[email protected]
本文发表于2022年9月30日的印刷版,标题为《为什么网络仍然会搞错名字?问问施蒂韦尔先生(Mr. Stüvel)》。