本篇文章3034字,读完约8分钟

张春阳:解读《数据中心测试与验证技术规范》 测试和验证的背景是,随着近年来数据中心的快速发展,今年我们估计全国新的数据中心机架数量约为20万个,其中50%将进行测试和验证,也就是说,今年将测试和验证约10万个新的数据中心,这一需求正在增加。

我来自创意银河,主要做测试验证。我已经完成了大约150个数据中心测试验证,其中大约40个超过10,000平方米。测试和验证的背景是,随着近年来数据中心的快速发展,今年我们估计全国新的数据中心机架数量约为20万个,其中50%将进行测试和验证,也就是说,今年将测试和验证约10万个新的数据中心,这一需求正在增加。刚才阿里延和施耐德的专家提到,在实际的数据中心运营和维护过程中,会出现这样或那样的问题。如何在数据中心业务系统上线之前发现并尽可能消除这些问题?事实上,测试和验证让每个人都有机会在业务上线前发现问题并纠正它们。然而,目前中国缺乏相关的测试和验证标准和规范,也就是说,每个单位将推出自己的标准。从中国用户的角度来看,ODCC开放数据中心委员会的主要成员单位,如百度、腾讯和阿里,也是近年来测试和验证的主要用户。在此基础上,我们逐步规范测试和验证的内容,无论是测试方法、测试工具,还是要实现的相应目标。

张春阳:解读《数据中心测试与验证技术规范》

在此基础上,2016年开始编制测试和验证技术规范。三项主要任务已经完成。一是发现数据中心的各种潜在风险。这不仅包括设备级产品缺陷,还包括施工技术和安装技术问题。二是验证数据中心是否满足设计目标,无论是空调度系统、配电系统还是网络,建设和施工是否满足设计要求。三是站在系统的层面上,在每台设备都正常的情况下,整个系统能否很好的配合运行,满足安全稳定运行的要求。它简要显示了数据中心中一些常见的故障风险点,包括不正确的自动测试系统状态、不准确的仪器、无电流显示、不平衡的发电机并联测试等。电池放电几乎是测试大型数据中心的常见问题。

张春阳:解读《数据中心测试与验证技术规范》

技术规范的编制,随着近年来越来越多的数据中心投入使用,用户也可能意识到测试验证是数据中心交付运行前的最后一道关口。如何确保交付的数据中心能够安全运行?对于一个有1000个机柜的典型计算机房,在测试阶段通常会发现300多个问题。如果直接交付运行,这300个问题有可能在接下来的三年和五年的运行和维护过程中陆续被发现。如果在此期间发现并解决了这个问题,那么绝大多数问题都有可能在胚胎阶段得到解决。多年来,百度、阿里、腾讯、CICC、京东、移动、电信、领英、华为、中兴和创意银河都经历了多次测试和验证。在编写过程中,我们还进行了许多讨论和演示,包括现场讨论和电子邮件修改,可以说吸收了一些在测试和验证中积累的经验。

张春阳:解读《数据中心测试与验证技术规范》

该规范的框架包括参考规范、环境构建、故障模拟、仪器和仪表的使用,以及特定的单个设备和单个系统测试程序,所有这些都将详细介绍。目前,市场上有很多测试和验证单位,但测试报告也是多种多样,有1200页和3400页。在制定规范后,典型的1000帧数据中心测试报告将为11500页,这最大程度地量化了以前由经验完成的一些工作。适用单位包括建设单位、经营单位、业主和检验检测机构,并可作为参考资料。

张春阳:解读《数据中心测试与验证技术规范》

测试验证的两个主要因素是压力、方法和为什么是压力?如果你想在测试阶段而不是在业务阶段暴露各种问题,无论是空调度系统还是电力系统,你都应该尽可能地展示各种工况,通过它你可以实现单设备、单系统和全系统的满负荷压力测试。配电系统从高压到配电装置、整个配电线路以及整个线路的压力测试可以通过拉网来检查。对于空空调系统也是如此,包括其风量设计,包括相同的每千瓦散热流量,包括大约99.5%的功率转换效率,这最大限度地再现了未来实际运行下的最大负载。方法的规定,一般做测试的过程中,会先做安装检查,然后是功能检查,单系统检查,全系统压力联合调试,为什么要按这个顺序做呢?因为当发现一些问题时,可以进行一些改进,以避免在下一个测试过程中出现故障。功能测试指的是先现场测试,但无负载,然后系统测试,包括电能质量,冷却能力,满负荷,热量,配电系统,空调节系统要求不是抽水测试的概念,每个系统100%测试。对于测试和验证环境的构建,负载采用机架测量,满足单个模块的最大复合,满足群控和添加冷机的条件,在常规验收阶段测试不易达到或不易出现问题的情况下也能得到很好的满足。此外,整体电阻虚拟负载可以补充变压器和母线的最大负载。根据发电机功率因数配置的整体容性虚拟负载。如果发电机不考虑相应的特性,它可能出现在某一负载和开关设备的水平之上。因此,测试和验证环境做出了相对定量的规定。

张春阳:解读《数据中心测试与验证技术规范》

就关键基础设施的完全覆盖而言,它基本上实现了内容的完全覆盖。从内容上看,它具有很强的直接操作指导作用。以不间断电源为例,包括安装检查、功能测试、单机负载性能测试等。该规范的颁布和实施将对数据中心和从事数据中心测试的机构的建设和运行提供一定的指导,从而进一步规范国内数据中心市场的健康发展。也希望该规范的发布能把国内数据中心的建设水平提高到一个新的水平。让我们看看你对刚才演讲的内容有什么问题。

张春阳:解读《数据中心测试与验证技术规范》

Q1:你有什么样的电力负荷?

张春阳:当我们测试配电系统和空调度系统时,其功率转换效率为99.5%,与实际服务器相当一致。无论不间断电源是交流不间断电源还是高压直流电源,其特点是不怕电感、电容和阻容,发电机不怕电感、电容和阻容。从安全性能的角度来看,在测试不间断电源时,我们发现电容和阻容测试对性能影响很小,但对发电机测试影响很大。

张春阳:解读《数据中心测试与验证技术规范》

Q2:刚才提到的数据可能会在今年进行10万台的测试和验证。这些数据来自哪里?

张春阳:我们公司有自己的市场部。今年上半年,我们已经完成了10,000个测试项目,我们估计今年大约有25,000个。对于国家数据中心,我们去年跟踪了15万个,今年跟踪了20万个,这些都是基于中国的实际建设项目。会有错误,但不会太大。

Q3:我们是一个测试组织。该标准已经等待了很长时间,对类似企业有很好的指导作用。在我们的标准中,我们的消防系统标准是基于国家验收标准,还是从我们实际应用的角度来编制和定义?

张春阳:目前中国的消防非常特殊。它有一个专门的消防部门来检查和接受它。在这一部分,协议实际上有两个内容。一个是当有消防信号时如何切换电器。另一个是安全的角度,它是否能保证人员的安全,这包括几个方面,一个是门是否能被打开,包括打开的方向,以及人是否能安全地出去。此外,还有那些配合灭火的人。关闭时如何打开天花板?至于专业消防验收,仍由专业机构进行。

张春阳:解读《数据中心测试与验证技术规范》

Q4:关于测试发电机时的容性负载问题,我通常知道几家大型IDC公司都有这个问题。发电机直接绕过不间断电源。当发生器处于镜像操作模式时,会出现此问题。对于这个指导值有什么建议吗?

张春阳:目前,电阻和电容没有定量要求。随着不间断电源技术的不断发展,信息技术侧的电源得到了不断的优化和提高。在最初的两三年里,我们测量了大量数据中心的功耗,相对较大的数字约为0.7和0.8。然而,在过去两年中,新建数据中心的实际用电量可以达到0.9以上。在主动测试期间,我们还建议您实现0.8或0.85和0.9的值,不仅考虑原始设备的特性,还考虑未来的业务发展。

张春阳:解读《数据中心测试与验证技术规范》

Iaas阿里巴巴亮相ODCC2017应对基础设施建设挑战的三大策略 近日,2017年开放数据中心峰会(ODCC)在北京国际会议中心隆重举行。阿里巴巴基础设施集团总经理周明发表主旨演讲,与与会者分享阿里巴巴在基础设施领域面临的机遇。

标题:张春阳:解读《数据中心测试与验证技术规范》

地址:http://www.yunqingbao.cn/yqbxx/1369.html