运维策略决定了运维的质量,直接体现经济价值。可以提前发现问题、解决问题,把事故扼杀在萌芽状态。可以继续发挥旧设备的作用,创造新价值。设备管理系统运维策略需要注意几点。
(1)运维应有侧重点,对管辖的设备划分重要等级,根据重要性确定具体设备的运维点、运维措施、运维方法、运维周期。核心机房设备最重要,其次是普通机房设备。
核心机房设备根据重要性排序:供电系统,消防系统,温、湿度控制系统,存储设备,核心交换机,重要服务器,汇聚交换机,普通服务器,边界设备。尘土、静电是机房设备最大的敌人,大功率设备的散热系统最容易产生故障被破坏。散热系统发生故障后就直接导致温度过高,从而毁坏设备,严重时会造成火灾。因此大功率设备的散热部位是维护的重点部位。
机房的散热、防尘、除湿、保湿就显得更重要。再次是数据库的重要,主要体现在数据库平台的入侵检测、安全监控,数据文件、日志文件的安全备份,异地容灾。
(2)重要设备的故障记录,每台重要设备的每次故障及故障处理过程都要有记录。这可以建一个小系统,录入重要设备的台账,记录所关心的重要参数。重要设备的维护策略、故障及处理记录在系统中体现,可供查询,建立动态台帐和历史档案。当新故障发生时,可以利用历时故障及处理过程加以分析,可以帮助新故障的处理。也能为以后维护该类设备提供经验。调整相应的维护策略
(3)运维方法不当,容易毁坏设备,严重时会造成灾害,因此必须了解一些注意事项。
运维时重点注意两方面:一是防静电。设备管理系统设备根据设备所处的重要等级不同,部分设备的板卡可以热插拔。热插拔板卡时一定要注意防止身体上的静电传到设备上,避免毁坏设备。因此必须带上防静电腕带并接地。平时操作机房设备时也应该带上防静电腕带。这一点很多人都容易被忽视。二是跳线。有些设备的跳线很多,特别是新换板卡,跳线颜色、插头都是一样的。容易跳错。一定注意不能按经验跳线,要看说明书或图纸。否则容易烧毁板卡或设备。跳完线后,最好是请另一个同事根据图纸核实跳线,确认无误再对设备上电。
(4)每台重要设备、系统、平台的常规维护都应编写一个可行的、容易理解的、简单的操作流程,指导每次常规操作维护。
每个人对自己管辖的重要设备的操作流程要烂熟于心,并能指导协作的人员一起处理故障。以机房UPS每半年进行一次的充、放电为例,所有开关的开或关是有顺序的,且开机或关机的顺序是不同的,若关错一个都会烧坏UPS主机。另外,还有一组开关在正常情况是不能开的,但在关闭某些开关后又是可以开的,而这个功能又是需要的,若开错顺序或开了不该开的开关都会损坏设备,严重时会造成主机或电池爆炸,酿成火灾。因此必须应有一个可行的操作流程做指导。
对数据库的数据备份也同样存在顺序的问题或操作漏项问题。如果数据库没有完全停下,就不能做完全恢复的数据备份。另外只有数据文件的备份,无日志文件的备份。也不能做完全恢复的数据备份。因此如果没有数据备份和数据恢复的操作流程指导。数据备份和恢复就容易失误。造成数据丢失。
(5)重要设备降级使用,修旧利废。某些设备到了报废年限。但由于平时保养措施到位,状况良好的可以降级使用,提高旧设备的利用率。降级的原则是,主设备降为从设备,核心设备降为汇聚设备,存储设备降为备份设备,服务器降为实验平台或监控电脑。多台旧设备拼装使用,但这种情况通常在重要程度较低的末端使用。
(6)操作系统不要轻易重装。如果数据备份不全,重装系统时容易造成用户数据丢失,另外由于重装操作系统的时间太长,升级打补丁需要很长的时间,同时目前需要安装的安全软件和应用软件也越来越多。这将会影响用户办公。许多操作系统问题可以通过修复系统解决,除非中了系统类的病毒,必须重装系统。
4、设备管理系统信息安全设备管理系统信息安全需从建设和运维两方面控制风险。从运维的角度就降低信息风险应注意几点事项。
(1)要有必要的网络安全监控措施,比如端点准人、入侵监测、网上行为管理、网络流量监控。
(2)掌控核心网络设备及出口网络设备的权限和密码、数据库及数据库平台的权限和密码、安装数据库平台的操作系统权限和密码、业务管理系统的权限和密码。以上四类权限和密码如果有一项掌控不了,或互相串通,都保证不了业务系统的数据安全。
(3)数据库安全是信息安全的根。数据库安全的监控手段很多,比如数据库日志监测、非法用户监测、数据库平台的非法访问监测、防火墙监测。
(4)网路设备、出口设备的安全策略设置优化直接影响网络安全。
(5)网络拓扑结构一定要保密,只能在有限的范围内公开。这是网络攻击需要的重要资料。
本文来自互联网,仅供参考
信息发布:广州名易软件有限公司 http://www.myidp.net