首页 > 代码库 > 我们的机房更环保,数据更安全?

我们的机房更环保,数据更安全?


       技术分享

                     我们的机房更环保,数据更安全?


     如何让我们辛苦建立起来的机房重地,数据更安全?设备维保,除尘为先。

                                             机房智能除尘预案【成都地衣科技】

                                              Science Sechnology Cleaning

概述

   保护客户中心机房的信息系统基础设施、设备、媒介免受环境的危害。通过对设备从维护直至最后报废的全过程进行安全相关的防护和相应的规范,防止客户的信息系统的的资产的损坏、丢失。从而进一步保障客户信息系统的持续工作,我们采用世界上最先进的工艺和科学的技术,保障机房设备的安全,维护客户的信息数据的安全。

第一章 机房情况介绍

一.客户的机房除尘需求:

根据到客户的中心机房的实际勘测,我们得到如下的数据:


二.机房建设标准和用途

1. 标准机房建设的国家标准(摘选):

电子计算机机房设计除应执行本规范外,应符合现行国家有关标准规范的规定《电子计算机机房设计规范GB50174-93》参考。中心数据机房电子计算机机房设计规范GB50174-93》参考

第3.1.5条 主机房内的空气含尘浓度,在静态条件下测试,每升空气中大于或等于0.5μM的尘粒数,应少于18000粒。

第二节 噪声、电磁干扰、振动及静电

  第3.2.1条 主机房内的噪声,在计算机系统停机条件下,在主操作员位置测量应小于68dB(A)。

 第3.2.2条 主机房内无线电干扰场强,在频率为0.15~1000MHz时,不应大于126dB。

  第3.2.3条 主机房内磁场干扰环境场强不应大于800A/m。

  第3.2.4条 在计算机系统停机条件下主机房地板表面垂直及水平向的振动加速度值,不应大于500mm/ 。

  第3.2.5条 主机房地面及工作台面的静电泄漏电阻,应符合现行国家标准《计算机机房用活动地板技术条件》的规定。

  第3.2.6条 主机房内绝缘体的静电电位不应大于1KV。

2.机房作用:


一、 计算机机房

计算机机房内放置重要地数据处理设备、存储设备、网络传输设备及机房保障设备。 

二、电信机房

※设备机房是用于安装某一类通信设备,实现某一种特定通信功能的建筑空间,便于完成相应专业内的操作、维护和生产,一般由传输机房、交换机房、网络机房等组成。

※配套机房是用于安装保证通信设施正常、安全和稳定运行设备的建筑空间,一般由计费中心、网管监控室、电力电池室、变配电室和油机室等组成。

※辅助机房是除通信设施机房以外,保障生产、办公、生活需要的用房,一般由运维办公室、运维值班室、资料室、备品备件库、消防保安室、新风机房、钢瓶间和卫生间等组成。

三、控制机房

控制机房包括楼宇智能控制机房、保安监控机房、消防控制室、卫星接收机房、视频会议控制机房等。

四、屏蔽机房

为了有效地防止电磁干扰式噪声、辐射对电子设备和测量仪器的影响,并严防电子信号泄漏从而威胁到机密信息的安全,国家机关、军队、公安、银行、铁路等单位需要建立屏蔽机房。

有保密要求的数据机房应建设屏蔽机房,确保数据在处理过程中,其信号不泄漏,从而满足数据保密的要求。

一. 机房的实际情况

第一节 机房检测报告

我们对机房的各种环境指标,进行测试,详见(附录一)

二. 机房情况分析

通常,由于空气污染站、机房环境条件的限制,设备送风系统(空调)的运行,改造及装修等原因,会普遍使长期连续运行下的通信设备受到严重的污染。灰尘、油污、潮气、盐份、氧化、腐蚀性气体等造成对设备的“综合污染”,形成对设备的附加“微电路”效应和“缓腐蚀”作用;通信设备正常工作中的电磁场分布,送风系统长时间的摩擦累积等造成“累积静电”,共同形成了通信设备产生“软性故障”的两大根源,不同程度地造成设备的误码率、障碍率、坏板率增加,被严重污染的设备还会使其散热能力下降,影响话务接通率和通信质量。

采用性能优良的通信设备专用清洁剂和与之配套的智能清洗维护技术,可以有效地解决上述问题。公司现已形成了从清洁剂到智能清洗工艺和方法,以及智能清洗设备和测试手段,智能清洗安全监控,智能清洗技术标准和规范等较为成熟的技术,保证对智能清洗全过程的质量和智能清洗安全实施有效的控制。

机房中灰尘和静电的产生:

1.机房灰尘来源

《电子计算机机房设计规范》(GB 50174-93)第3.1.5条要求:主机房内的空气含尘浓度,在静态条件下测试,每升空气中大于或等于0.5μm的尘粒数,应小于18000粒。

①新风系统在给机房内输送新鲜空气时,过滤装置精度不足,使灰尘进入机房内。

②工作人员进入机房时,从外界带入灰尘。

③工作人员在机房内工作时产生尘埃。

④设备的移动、更换、搬运、维修、维护产生的灰尘。

⑤机房围护结构不严实,灰尘通过缝隙进入。    

⑥机房的墙壁、顶棚、地面等部位起尘,涂层脱落产生灰尘。

机房中服务器灰尘、静电的数据关系图:

电子探针是电镜、波谱与能谱的总称。这种方法对分析固体颗粒状污染物的大小与成分是十分有效的手段。

现在已经知道,无论精密电子设备的密封程度有多好,在我国目前的环境条件下,被密封保护的印制模块仍然会受到污染,而且,有时为了散热的需要,不能做到完全密封,因而设备受到污染是不可避免的。

我们以机房环境较好的通信设备作为例子。可以从运行的通信设备上收集到一些非常细微的粉尘污染物。那么,这些污染物到底有多大呢?其成分又是什么呢?它们到底对设备有没有影响以及有什么影响?针对这种情况,我们探讨了以电子探针的方法进行评估。

我们对从通信设备上收集到的一些粉尘作了扫描电镜观测,所收集到的粉尘是一些大小不等的颗粒状或丝状污染物,最大的直径可达1mm,小的也有0.1mm。对于微电技术,其模状在生产线上时,对其残留物的直径要小于0.1mm。即使超精密工业智能清洗对洁净度要求很高,但产品交付使用一段时间后,或多或少受到污染。

还有一个关键问题是,这些固体污染物到底是些什么?它们的存在对电子设备有没有影响?对此,我们又作了能谱分析。在这些污染物中存在铁与锡等可导电的金属粉尘及盐污。有些粉尘明显来源于建筑材料。在元器件与线路越来越细微化的今天,若它们大量的堆积在电路板表面,会对电子元器件的散热造成如下影响:

(1) 使元器件表面的温度升高。数据表明,当温度升高10`C,设备的可靠性将下降25%;当温度继续上升,可能会将温度性较差的元件或者接线烧坏。

(2) 产生静电。当静电积累到一定程度,防碍它中和的绝缘体再也阻挡不住时,即发生剧烈放电,即静电放电(ESD),这时的最高电压可达几千乃至几万伏,势必对静电敏感组件造成损害;静电放电(ESD)及电气过载(EOS)对电子元器件造成损害的主要机理有热二次击穿、金属镀层熔融、介质击穿、气弧放电、表面击穿等等。

服务器等设备对清洁度要求较高,定期智能清洗可以提高散热能力,延缓设备老化、降低障碍率,保证通信质量;可以为日常的设备清洁营造良好的基础;可以改善机房环境,激发维护人员的工作热情,降低潜在和偶发障碍的发生率,提高运维管理水平和运营服务质量。设备智能清洗将会给客户的信息系统的安全带来远期的利益。所以,维护智能清洗是长远利益和现实利益兼收并蓄。

2. 静电对机房的设备影响:

2.1机房静电--来源

1.人体静电

2.仪器和设备的静电

仪器和设备也会由于摩擦或静电感应而带上静电。

3.器件本身的静电。

4.除上述三种静电来源外,在电子元器件的制造、安装、传递、运输、试验、储存、测量和调试等过程中,会遇到各种各样的由绝缘材料制成的物品,这些物品相互摩擦或与人体摩擦都会产生很高的静电势。

2.2累积静电对服务器和通讯设备的影响

静电对各种电子设备的危害是极大的,通讯设备因其采用了许多新型的敏感器件,此危害则显得尤其突出。但由于人们对静电的危害往往重视程度不够,尤其是对“累积静电”产生的原因和特点不甚清楚,又无方便而有效的对策,常使得许多“不明原因”的“软性故障”困扰着我们。

静电是附在介质表面相对稳定的电荷,摩擦、紧密接触或迅速分开都会使物体带电。对于各类通讯设备,一方面由于机房结构、工作人员衣着、家具和工具的移动,灰尘的积累会产生上述过程,使物体带电,温度和湿度变化还将影响静电的产生和积累;另一方面,某些厂家生产的通讯设备中一些绝缘材料的表面阻抗过高(尤其是设备的面板),经机房送风气流的长时间摩擦产生累积静电,加上有的机房相对湿度偏低,静电接地不良,若不及时消除则会累积很高的静电电压。无论何种情况,静电累积到一定程度则会自行放电,低则数百伏到数千伏,高则上万伏,造成通讯设备的敏感器件损坏,逻辑元件击穿,CPU工作滞后,数据传输和处理功能紊乱。可表现为对设备的操作不灵,显示器的指示和键盘不一致,误码率增加,输入、输出设备工作异常,误报警,来话、去话接通率,呼损等软指标下降,既找不到原因又难以处理,有时会使人们误认为是软件故障,从而造成工作混乱。

运用“全程数据监控带电智能清洗技术”,可从通讯设备的机房环境参数(温度、湿度、静电分布、设备局部工作温度、表面阻抗等)到被智能清洗设备的工作状态,进行测试、监控、记录和分析。其中成都的通讯设备专用清洁剂与 “环境电位平衡技术”和相应的智能清洗工艺及方法,不仅可有效地迅速清除“综合污染”和“累积静电”这两大根源入手,实施对通讯设备快捷而有效的“健康维护”。

3.综合污染对服务器等设备的影响

大家知道,各类通讯设备均使用了大量易受环境条件影响的电子元器件,机械构件及各种材料。如果机房环境条件不能很好地满足这些设备对环境的使用要求,加之设备长期连续运转,就会降低设备的可靠性,加速元器件及某些材料的老化,缩短设备的使用寿命,甚至丢失重要的数据,产生误码和出现误动作等软性故障,进而导致相应的硬件故障。

首先,灰尘是首当其充的污染物,不论机房采用何种建筑结构,机房内的灰尘都是不可能避免的。由于通讯设备在工作中,其各种电路自然形成相应的电磁场、静电场分布,产生对灰尘较强的吸附作用,日积月累,沉积在集成电路和其它电子元器件上,明显降低其散热性能。此时,尽管机房的环境温度可能在正常范围内,但某些电路却处在高温状态下工作(尤其是电源部分,大规模集成电路和大电流工作的电源部分),致使半导体器件的结温过高,反向穿透电流和电流倍数增大,又促使结温进一步升高,轻则引起设备工作不稳定,重则导致热击穿;电阻器、电容器的参数发生不同程度的变化;一些绝缘材料的高温损耗(即漏电损耗)增加;加速某些印制插头和金属簧片的腐蚀,使其接触电阻增加。

第二,空气中的水份、盐份、油烟和各种有害气体等,逐渐与灰尘结合,形成导电型的微电路,使设备的工作性能发生变化;而某些地方形成不同程度的绝缘,使其接触不良,氧化和腐蚀程度进一步增加。

第三,对于通讯系统的输入输出设备,灰尘的介入不仅污染了磁头、磁带和磁盘,造成机械损伤,丢失或毁坏信息,而且使磁带、软盘、磁头和磁盘持续工作在高温之下,其磁介质的磁导率增加乃至失去磁性,严重影响数据的传输、处理和存取。

所以这些情形的发生,我们称其为通讯设备的“综合污染”,其结果是各种“软性故障”频频发生,并且令人难以分析和处理。

第二章 机房设备智能清洗维护技术简介

一. 机房定期除尘的必要性

1. 技术介绍(对系统正常运行的保障,降低故障的发生几率。)

    1.1综合污染形成“微电路效应”对设备的影响:

粘附在电路板元件脚间的综合污染物,与电路本身形成“微电路”,引起漏电、旁路、错误触发,甚至短路、击穿精密电子元器件。

1.2综合污染物对设备散热能力的影响:

环境中的油污、二氧化硫气体、氮氧化物与空气中的灰尘及其它悬浮粒子,在电器元件和电路板上形成一层污染膜,使得设备运行产生的热量不能正常散发,严重影响设备运行的稳定性,加速元器件的老化,甚至使元器件烧坏。

1.3通信设备智能清洗维护周期表

(《精密电子设备智能清洗标准》) (供参考)

2. 节能减排的实际意义

通过对机房设备的除尘,维护了设备的安全,减少机房设备的故障率,延缓了灰尘和静电对机房设备的损害,延长了设备的使用周期。对客户的生产是一种促进,达到了事实上的节能减排,低碳经济的效果。符合国家的大的政策和号召。

一. 定制智能清洗工艺

针对客户的具体情况定制清洗工艺如下:

1、静电平衡机物理智能清洗

静电平衡物理智能清洗,就是采用电脑集成程序化控制设备,在施工过程中根据机房勘察的数据将电晕放电所发生的离子气体喷向带有静电的设备电路板、精密电子仪器等元件,通过中和电路板、精密电子仪器表面所带静电的电场,使灰尘剥落。有效的清除设备内外部的累积静电及静电吸附的尘埃,使设备处于最佳运作状态。

2、无干扰式喷枪气流智能清洗

使用无干扰喷枪,通过电脑自动化离子平衡机向无干扰喷枪加入离子风和压力,然后根据设备的结构,无干扰式喷枪调节各种枪头对精密电子进行横喷、直喷、针式喷、多角度智能清洗。如果设备结构比较严密,还可以使用雾状喷枪智能清洗或离子气流智能清洗,使带电智能清洗真正做到即能保证电子设备的安全运行,又能保证智能清洗的质量。

3.针对客户的要求,我们对如下的清洗目标,阐述除尘的流程和除尘内容:

一. 智能除尘作业质量控制

1. 机房达到什么效果

机房除尘项目验收,遵循《通信设备智能清洗验收准则》:

1)、基本要求:智能清洗过程安全,对设备无腐蚀、无损伤;

2)、洗净度达到A级(脱机智能清洗)或B级(带电智能清洗);

3)、累积静电消除率K≥95%;

4)、软性故障(非硬件或软件故障)消除率R>50%;

5)、坏板率(参考,需客户配合统计);障碍率、误码率、话务接通率(为参考软指标,需客户配合测试和统计)。

2.客户---机房设备除尘的验收效果:

3.达到那些机房指标(参照机房建设指标设定)

备注:关于机房的建设要求和机房的环境标准,摘选部分国家有关的条例和标准:

序号除尘后要达到的标准 


1.★《通讯机房静电防护通则》YD/T754-9

2.★计算机机房建设标准:

机房环境、电源及防雷接地应满足《建筑与建筑群综合布线系统工程设计规范》(CECS 72:97)的要求。计算机机房的设计应符合下列规定:

设备间的地面面层材料应能防静电。

洁 净 度: 符合标准ASHRAE52-76,粒度≥0.5mm,个数≤18000粒/dm

3 .第6.3.7条 静电接地可以经限流电阻及自己的连接线与接地装置相连,限流电阻的阻值宜为1MΩ。

4.第6.3.3条 主机房内的工作台面及坐椅垫套材料应是导静电的,其体积电阻率应为1.0×107 ~1.0×1010Ωcm。

5.第3.2.5条 主机房地面及工作台面的静电泄漏电阻,应符合现行国家标准《计算机机房用活动地板技术条件》的规定。

6.第3.2.6条 主机房内绝缘体的静电电位不应大于1kV。

7.第3.1.5条 主机房内的空气含尘浓度,在表态条件下测试,每升空气中大于或等于0.5μm的尘粒数,应少于18,000粒。

第三章、机房智能清洗维护安全保障措施及体系

1.安全保障措施及体系

1)、专业的施工队伍:我公司拥有一支有专业、懂技术、守纪律的高素质施工队伍。在长期和大量的工作实践中总结和积累了丰富的通信设备在线带电维护智能清洗经验,施工人员熟悉各类机房的管理条例,服从机务人员的管理和指挥。

2)、优质产品:使用带电智能清洗产品在国内外处于先进水平。

3)、专用智能清洗设备:精密电子设备智能清洗专用设备,可根据各类精密电子设备的不同结构、机房环境条件、污染物特性等因素,设定智能清洗程序,调节智能清洗技术参数,使带电智能清洗做到了程序化、智能化。并配有多种附属工具,可对各种不同类型的设备进行深度带电智能清洗。这些精密电子设备智能清洗专用设备符合机房的噪声、电磁波的干扰要求。

4)、与网管中心的沟通:在线带电维护智能清洗作业前应向网管中心通报准备作业的机房的地点及施工时间,请网管中心做好实时监控。

2、安全技术措施

1)、建立施工现场安全管理体系:

指定专人担任现场安全员,在施工过程中专职巡查,随时观察与智能清洗相关的数据变化及设备的运行状况,发现异常立即通知停工,并向客户局方随工工程师详细汇报,待问题查清并得到解决后方可继续施工。

2)、安全、技术、质量讲话:

现场工程负责人在每天开工前要向全体施工人员讲解任务内容、职责分工、安全要点及注意事项,做到任务到人、责任到人,安全要点人人皆知。

3)、甲方应安排一名对本次智能清洗的设备有一定维护经验的工程师随工指导作业。

4)、甲方配合工程师向智能清洗施工人员详细介绍被智能清洗通信设备的运行状况。如该设备有故障或告警,应先排除故障消除告警后再进行施工。

5)、施工负责人要认真检查核对智能清洗剂是否与施工要求相符,如有异常或与施工要求不符不可使用。

6)、安全监督员负责检查设备工具是否完好,并检查每个施工人员是否按规定穿戴好防静电工作服、防静电工作鞋、佩带好静电环、防尘口罩、工作手套、工作鞋套等安全装备。

7)、在智能清洗施工前,客户局方需准备一些备品备件:电源板、控制板等,对准备智能清洗的设备做好必要的数据备份。

8)、每天的施工情况由双方现场负责人共同填写作业单,做好原始记录。

9)、在机房增加空气置换机,保证机房的良好的空气。

3.机房智能清洗项目的应急措施:

 1)服务器设备应急处理流程及预案

对服务器、网络要进行事故分类;

如服务器可分为硬件故障、软件故障、电力断电故障、人为故障、不可抗力等。

针对每类故障我们的处理流程。必须有对所有故障的预警机制;事故处理后的备案;应急组织架构;服务器故障应急流程。

2)服务器设备应急处理的目的及总的原则

在智能清洗服务器的实施过程中,为保证公司业务的正常运行,避免和减少公司各服务器出现严重问题,在出现问题时,能根据本方案及以前的备份资料迅速及时恢复系统的正常运行;保证公司数据的完整性,并可随时恢复;减少故障对客户的损失。

3)电力断电故障的应急方案:

l 当发生电力故障时,第一时间保证重要服务器、路由器及交换机的电源,关掉业务不是很重要的服务器。

l 这样可以在断电时保证网络的基本运行,确保公司正常连接办公网、相关业务系统基本不受影响。

l 询问人事部故障处理时间,如果断电时间超出UPS使用时间,可通知各部UPS电源可待机时间。

l 在UPS电源只够支撑半个小时的时候,电话通知各部做好文档保存工作,一线营业部门做好手工记帐准备。

l  服务将在15分钟后中断。确定各部做好保存工作后将各组服务器关机,等待电力恢复。电力恢复后,将各服务器和网络设备开机,检查各组服务器和网络运行情况,发现故障及时跟进处理,确认运行正常后,电话各部通知服务已恢复正常运行。恢复后将结果报知部门经理并做好相关记录。

4)硬件故障应急流程:

当发生硬件故障时第一时间分析故障原因,用排除法找到故障原因.

l 如果是内存、硬盘、电源故障可及时使用备用零件替换.

l 如果是CPU、主板可用备用服务器顶替,以确保服务不中断。

l 如果当值人员无法排除故障,可向本部同事请求技术支持并向本部经理汇报情况,由经理统一协调。

l 发生故障同时电话通知相关业务部门,告知故障原因、处理时间,故障处理结束后电话通知使用部门和部门经理告知处理结果。并将处理结果在《服务器重大事件处理登记表》做好记录.

5)软件故障应急流程:

l 当发生软件故障时第一时间分析故障原因,当系统出现崩溃时,可通过系统GHOST备份还原系统。(系统GHOST在本机与文件服务器都做了备份)。

l 当系统中病毒时,可进入安全模式查杀病毒和木马,安全模式无法进入的话可将硬盘外挂到另一台电脑进行查杀。当服务器数据库损坏后,可及时通过SQL恢复本机的备份数据。(数据库在本机与磁带机都有备份)。

l 如果当值人员无法排除故障,可向本部同事请求技术支持并向本部经理汇报情况,由经理统一协调。发生故障同时电话通知相关业务部门,告知故障原因、处理时间,故障处理结束后电话通知使用部门和部门经理告知处理结果。并将处理结果在《服务器重大事件处理登记表》做好记录.

6)人为及自然损坏应急方案:

l 当发生人为及自然损坏时,第一时间通知部门经理由经理统一协调,发生服务器暴力破坏服务器时,可选择报警,追究破坏者刑事责任。

l 从公司备用服务器中借调服务器,重新恢复相关数据。

l 当发生数据被盗时,查看监控录像或服务器日志。

发生不可抗力服务器自然损坏时,从公司借调服务器,重新恢复相关数据。并将处理结果在《服务器重大事件处理登记表》做好记录.


本文出自 “地衣除尘” 博客,谢绝转载!

我们的机房更环保,数据更安全?