机房电源常见故障处理方法
发布时间:1321855035 作者:Reton技术部.Lu如今,在大型的和比较重要的计算机机房,由于市电电网的供电质量达不到服务器类设备的要求,因此供电基本上都是双路电源加UPS供电,以计算机系统的正常运行。因此,我们对计算机等负载设备供电系统的管理主要是针对双电路和UPS系统的管理。 在对双电路和UPS系统的管理过程中,常常会出现一些意外的故障,影响机房设备的正常运转。因而,本文将对机房中电源几种常见的故障原因进行分析,并提出相应的解决方法,以供参考。
UPS意外跳转
故障原因:地线干扰
一次市电正常,大家都能正常上网,可UPS总是跳转到电池组供电模式。在此模式下,蜂鸣总是不断地鸣叫提示。我们马上组织人员检查电路,分析故障原因。最后和机房的立式空调联系起来了,每次启动空调不一会,就自动转为电池组供电。显然这是市电输出受到大功率空调机影响所致。但是他们是分开两路单独供电的,是从不同的配电室里面的配电盘接来的,怎么会产生互相干扰呢?
带着这样的疑问,电工就顺着电线打开天花板、地板、接线盒等逐点进行排查。看是不是什么地方电路虚接到一起了,最后发现它们的零线和地线接到了一块。如此模糊的干扰,对UPS的影响都能被体现到,果然是个精密设备,不能有一点的含糊。
我们决定对空调的地线进行分开处理。分开零线和地线后,再启动空调,发现没有再出现UPS跳转电池组的情况。那么以前怎么没有表现出来呢?我们分析认为是2007年夏天太热了,空调满负荷运转,加大了功率消耗。
电源的质量对企业网络能否稳定、安全至关重要。但网络电源安全实际上还有很多属性,如高性能、可扩展性、可靠性、功能性、准确性和可用性等。为了使企业网络电源能持续稳定地运行下去,除了平常的规范使用外,周期性地利用各种测试工具,对网络电源环境实施维护测试也是必须的。整个机房供电安全系统,需要技术人员认真维护,并要做好日常排查工作,及时发现问题,分析处理非计划停机造成的影响等。
突然掉电
故障原因:UPS过载
双电源固然好,但如果UPS坏了,设备照样可能断电,因为由布线图可以看出,它们是串联的。有一次,UPS电源中断输出,指示灯全不亮了,信息中心机房的所有设备全部停止运行,网络随即全部瘫痪。总经理亲自打电话到机房,要求以最快的速度恢复正常。
突然掉电会造成机器硬件很大的损伤,还对企业运营产生影响。庆幸的是,当时管理员都在上班。为了尽快恢复设备运行,我们首先试着重新启动 UPS,居然启动成功并正常运行了。但是伴有不间断的鸣叫声,于是查看UPS维护说明,对应找到此类蜂鸣表示的故障原因——UPS过载。
大家很快想起在不久前刚增加一台功率500W左右的服务器,可能是它使得UPS负载超出警戒上限,最后导致自动停机保护。那为什么超载了,又没有蜂鸣报警呢?原来有人无意识地关闭了蜂鸣,没有考虑到它已经超负荷,反正能供电就把蜂鸣当作误报处理给关了。
根据分析出的原因,我们立刻停运了几台不重要的设备,让UPS的负载指示率低于90%,UPS又开始安静地工作了。看来使用UPS也要量力而行,我们下一步就只能增加UPS容量来解决问题。
双电源跳转失败
故障原因:金属生锈
我公司以前旧的机房空间狭小,屋内的配套设施不完备,导致问题百出,给正常的业务办理带来很多麻烦,其中的供电系统就是维护重点。在公司季度停电检修中,双电源自动转换开关在正常的转换中失败了,没有能自动跳转,静静地一点反应也没有。同时,备用的电源就没有起到应有作用,UPS上的市电显示灯没有输入电显示。、
看到这种情况,部门所有的人员都齐聚来查找故障原因。我们断开电源,使用工具打开转换开关,发现里面所有的接触开关上的金属触点都生锈了,金属生锈导致自动跳转失灵。幸运的是,开关绝缘做得不错,没有发生短路。我们估计生锈有两个原因:长时间没有使用该功能,化工企业环境条件比较差。经过一番清理除锈工作,我们重新安装好了开关,然后手动转换恢复供电。
经过这件事情,我们总结的经验是,双电源转换开关一定要有专人维护,定期查看组件损坏情况,及时更新。值得注意的是,由于转换开关上面的接线比较多、比较紧凑,拆卸和使用的时候一定要小心谨慎。我们就曾经经历一次双电源开关损坏的情况。当时是在一次机房改造搬迁中,旧的开关在拆卸时因用力过猛而导致里面固定座脱落,跳转功能丧失,最后只能更换一个新的。
双电源自动转换开关具有过载、短路等保护功能。当电源出现故障时,转换开关能自动完成常用电源到备用电源的转换,以机房的持续供电,这是第一层保护。当然,前提是这个常备电源必须是从不同原点接入的。
【在百度搜索更多 机房电源常见故障处理方法】