携程网站宕机12小时损失7923万 系员工误操作
5月29日,携程回应其官方网站及APP大面积瘫痪时间,表示经技术排查,确认此次事件是由于员工错误操作导致。
昨日上午,携程官方网站及APP大面积瘫痪,无法正常使用。直到晚间23:29,携程官方网站及APP才恢复正常。对于恢复时间较长,携程回应称,因涉及的业务、应用及服务繁多,验证应用与服务之间的功能是否正常运行,花了较长时间。

去年3月,携程就遭遇过一次安全事故。当时,业界颇具影响力的乌云漏洞平台发布消息称,携程系统存技术漏洞,可导致用户个人信息、银行卡信息等泄露。报告指出,漏洞泄露信息包括用户姓名、身份证号、银行卡类别、银行卡卡号、银行卡CVV码等,这类信息可能被黑客读取。消息曝出后,携程回应称已立即展开技术排查,并在两小时内修复了漏洞。
携程本次宕机时间前后总计约12小时,按照携程一季度财报公布的数据,以宕机损失平均每小时106.48万美元来计算,其直接损失已经超过1277.76万美元(约合人民币7923万)。
事发后首个交易日,携程股价在美股盘前交易下跌了5.27美元,较前收盘价下跌10.65%,最终收跌3.44%。
以下为携程对相关问题的说明:
1、事件发生原因
经携程技术排查,确认此次事件是由于员工错误操作,删除了生产服务器上的执行代码导致。
2、为什么恢复时间那么长
一般来说,类似携程这样的大型网站承载着繁多业务,其后台是一个由SOA(面向服务)架构组成的庞大服务器集群,看似简单的一个页面背后由上千个应用子系统以及上千个Web Service组成,而每个应用子系统和每个Web Service之间都存在着相互调用的依赖关系。
发生事件后,携程的技术人员除了需要恢复生产服务器上的执行代码以外,还需要做的是恢复并确保每个应用子系统以及每个Web Service的功能正常,同时确保应用子系统与Web Service间的调用关系得以正常执行。
这种验证性的操作需要携程的工程师及运维人员通力合作,尽快恢复生产代码并通过反复地、持续性地调试以确保应用子系统与Web Service功能的正常运行。
携程再次保证,数据和数据库并未受到此次事件的影响,用户订单数据也完整无损,请用户放心并继续使用携程网站及App。
3、如何杜绝此类事件的再次发生?
携程在系统上做了改进,规范并杜绝技术人员错误删除生产服务器上代码的操作。