本篇文章2197字,读完约5分钟

业内资深人士:新浪微博的机房最有可能因为人为因素而关闭 新浪微博机房的停电可能是由于设计问题,但更大的可能性是由于运行和维护过程中的人为因素。 小编辑:唐霞 6月17日下午16: 30左右,新浪微博几乎所有平台都瘫痪了,故障持续了大约一个小时。微博首席信息官王伟事后回应称,故障是由于外部机房整层停电造成的。作为业内人士,很难想象支持数亿用户的新浪微博会因为供电问题而发生事故。

业内资深人士:新浪微博的机房最有可能因为人为因素而关闭

对此,中国国际数据中心立即联系了在数据中心建设、运营和维修方面拥有20多年经验的资深专家张洋,请他分析新浪微博机房断电的可能原因。

人性因素

联锁机制过程顺利吗?待确认的职责状态

武装到牙齿的现代军队在管理上也可能有漏洞,在某些情况下,很容易被敌人俘虏。高度自动化的数据中心运行和维护中的一个小缺陷可能会导致整个数据中心停机。新浪微博机房的停电可能是由于设计问题,但更大的可能性是由于运行和维护过程中的人为因素。在电话中,张洋开门见山,认为最有可能的是人为原因。

张洋在中国国际数据中心对记者表示,尽管数据中心由双向商业电力保障,但如果一种商业电力丧失,配电系统的连锁机制出现问题,那么所谓的双向商业电力就毫无用处。在正常情况下,当一条市电线路被切断时,不间断电源会自动启动,然后另一条市电线路会及时接通。所谓联锁机制,是防止两个商业电力线路之间因人为误操作造成短路的保障机制。

业内资深人士:新浪微博的机房最有可能因为人为因素而关闭

新浪微博的电脑室是一种电脑室。一般来说,只有当两条市电电源被切断时,发电机才会启动。如果当班人员或电源操作和维护工程师在一条电源线路被切断时技术能力有限,或者由于其他原因,他们可能无法切断另一条电源线路,直到不间断电源耗尽,最终导致数据中心断电。

张洋说,在正常情况下,不间断电源将在切断电源后自动启动,这通常可以让数据中心运行10分钟以上。在此期间,系统将发出警报警告。如果技术人员未能及时注意到系统警报,可能会导致另一个电源未能及时切断,或者发电机未能及时启动,从而导致断电和停机。是否存在这样的情况以及数据中心下一次披露的结果。

计算机房设计

办公区是一个普通的商业区吗?双向商业力量的真实性还有待检验。

张洋认为还有另一种可能性,那就是设计缺陷。如果机房得到操作和维护,办公区也将由普通商用电源供电。当电源切断时,计算机和办公系统都出现故障,工作人员无法相互沟通和控制,数据中心将完全瘫痪,报警信息无法及时处理,值班抢修人员无法及时值班进行应急工作,最终导致数据中心停电和停机。

在设计方面,大型数据中心对每年停电的时间和频率有非常严格的要求,高于一般工业用电的要求。此外,需要将两个以上的通道(最高级别需要四个通道)连接到来自不同地区和变电站的商用电源。较高一级要求上两级电源接入不允许是同一个变电站或电源电路。

如果在数据中心现场的高压开关室和周围区域不是事故,通常不会有两个电源同时断电。然而,如果两条线路的商业电力属于同一上级电站,当变电站出现问题时,所谓的双线商业电力将同时中断,这就是业内所谓的伪双线商业电力。张洋向中国IDC圈强调。

回应网民的猜测

发电机发生故障的可能性很低,在高温天气下不需要带锅。

针对一些网民提出的为了降低成本而导致发电机故障或机舱延迟的猜测,张洋认为这不太可能。

张洋告诉中国国际数据中心,对于像新浪微博这样的高层机房,许多发电机通常是并联运行的,发电机配置为N+1。即使一台发电机发生故障,也能完全满足系统的正常运行。在正常情况下,发动机可以在启动和运行的1分钟内正常供电,从而确保数据中心的运行。启动发动机的成本不高,只需要燃料成本。即使电源正常,数据中心也应每月至少启动一次发电机,每次发电机加载运行不少于15分钟,使发电机内部润滑及其他部件保持良好状态,并可随时投入应急使用。

业内资深人士:新浪微博的机房最有可能因为人为因素而关闭

一些网民猜测北京最近的气温上升太高,达到了历史同期的最高水平。炎热的天气将增加数据中心的负载,导致停机的可能性增加。张洋认为,这种猜测也是不正确的。

张洋说,由于天气炎热,室外温度上升,信息技术负荷不会有变化。变化是空调节部分的冷却效率。随着温度的升高,室外冷凝器的换热温差减小,从而降低了冷凝器的热转换效率,提高了数据中心的PUE值。

一般数据中心的PUE值在1.5到2.0之间,主要是冬夏季气温引起的冷却电源功率的变化。数据中心的功耗设计将保持最大功耗负载的冗余设计,因此高温只会影响功耗成本的增加,不会造成停机。

发电机启动一分钟后,就可以发电,供数据中心机房使用。为什么这次新浪微博中断了一个多小时?

张洋解释说,停电后一分钟内发电机发电和供电不成问题。但是,如果数据中心中的路由器和核心交换机在机柜中没有配备备份不间断电源,则电源故障恢复时间可能会达到3到5分钟,甚至超过10分钟,或者可能需要手动恢复数据,以便从根本上重新运行。一般服务器将设置为在断电时重启,重启时间从35分钟到10分钟以上。如果一些服务器因断电而丢失或损坏,需要通过其他方式恢复才能运行,这将需要更长的时间。

业内资深人士:新浪微博的机房最有可能因为人为因素而关闭

[本文最初由中国国际数据中心撰写。转载时必须注明出处。】

2017-09-26 14:15:51 在接受采访后,微信上的百度贴吧因违反规定被罚款。 最近,新浪微博和百度贴吧因未履行管理义务和违反《人民网络安全法》被北京市互联网信息办公室给予行政处罚。微信还因未能履行管理义务而受到广东省互联网信息办公室的行政处罚。

标题:业内资深人士:新浪微博的机房最有可能因为人为因素而关闭

地址:http://www.yunqingbao.cn/yqbxx/1750.html