来源:名易软件 IT系统运行无忧,这是如今每一个企业进行信息化建设是都希望达到的目的。但由于人力、技术、资源、管理等方面的限制,让“IT业务系统运行无忧”成为不可遇也难求的终极目标。即便是像电信、金融等信息化工作遥遥领先的行业,也难以保证自己的信息业务可以高枕无忧。也许大家会问:“这样说来,我们所提倡的业务永续,运行无忧不就成了镜花水月,渴望而不可及的事情了么?那你们还把这句话作为自己的企业宣传口号?”看官莫急,且听我们一一道来。“IT业务系统运行无忧”向用户表达了一种服务管理理念,而如何无限接近和达到这种个目标正是IT运维厂商不断驱动力,正式这种驱动力不断帮助用户提升运行管理水平,持续逼近“IT业务系统运行无忧”的境界。根据IDG统计结果,信息系统故障20%来自于系统原因,70%来自于管理原因。所以在建立了合理的IT基础架构后(如冗余和灾备体系),如何从技术层面对IT基础设施进行有效监控,及时发现与规避故障,降低系统原因引起的系统停机时间;同时在管理层面下功夫,持续提高日常运维管理管理能力,降低人为原因引起的服务中断,是我们努力实现“IT系统运行无忧”的两大主要途径。(1)面向基础设施的管理,降低系统原因引起的停机时间随着系统规模的不断扩大,业务应用的持续增加,IT基础架构已经变得越来越复杂。仅仅依靠某个工具或个人,已经不能胜任如此巨大的工作量并满足业务紧迫性的要求。因此,必须有一个完整的、全面的IT基础架构监控解决方案,帮助信息部门实时掌握IT基础设施的运行状况。面向基础设施的管理主要包括以下内容:全面管理系统资源:提供对网络、主机、存储设备、安全设备、数据库、中间件及应用软件等IT资源的全面管理。智能化故障管理:自动收集各种管理功能产生的故障事件。完成故障事件收集、过滤、关联和处理等工作,以实现对故障的快速定位、处理。性能管理与优化:对网络和应用等性能进行监控,定期提供性能报表和趋势表,为网络和应用性能优化提供科学依据。有的企业已经逐渐建立的数据网管、桌面管理等管理工具,但这样的管理工具之间缺乏整合,割裂了网络、应用、安全等基础平台之间的关系,不能实现全面的、统一的、集中的和主动的对IT基础设施进行集中运行监控,既浪费了人力资源,也难以做到快速发现故障。(2)面向运维服务管理,降低管理原因引起的服务中断时间我们很多企业信息部门的IT系统日常运行管理条块分割,网络、应用、安全、IT基础环境等基本上是各管一摊,这样增加了不少重复和冗余工作,也不能有效利用人力资源。在IT基础设施集中监控平台的技术上建立运维服务管理,将能够实现以上优势:提高IT员工的专业素质,提高员工的服务能力和工作效率;规范IT部门的服务水平,规范工作流程,降低由人事变动导致的风险;提高IT服务的可用性、可靠性和安全性,为业务用户提供高质量的服务;有效控制IT部门的开支,降低IT运营成本,减少运营风险;从总体上提高企业IT投资的回报,提高企业的综合竞争力。很多企业已经理解到规范化运维服务的重要性,并目纷纷建立了各项运维流程化管理制度,但这些流程只能以文件的形式进行规范,没有相应的技术设施予以支持与保证。同时对日常运维服务的工作量和服务质量也缺乏量化的工具面向运维服务的管理主要包括以下内容:运维服务管理:运维服务管理基于人与流程的结合,提供方便,灵活工作流程的管理功能,使工作人员维护管理工作的自动化和信息化,其中包括帮助台、事件管理、问题管理以及值班管理等根据客户量身定制的功能;智能总控中心:通过实时动态视图一目了然地展现当前IT系统的运行状态及趋势。可以综合监控IT系统中各种资源的实时状态和性能信息等所有运行情况,帮助管理人员快速发现问题,分析和确定问题所在;知识库:使工程师在处理系统故障的时候,能够参考相关故障处理的方法,让有较低技术水平的工程师也能够进行系统维护,从而降低系统管理对个人的依赖。综合报表:对系统运行状况信息进行汇总,并以图表的方式为管理人员提供直观的分析结果,帮助领导更全面的了解网络、主机、数据库、应用系统的运行状况和运行趋势,为领导决策提供支持信息。绩效评估:通过运维平台的工单处理数据,领导可以对系统维护人员的工作绩效有一个直观的了解。从而通过预定的关键绩效指标对工作人员进行绩效评估。(3)IT业务运行管理解决方案,以IT基础设施监控平台为支撑,以IT运维服务管理为抓手,努力实现“业务永续”的终极目标BroadviewIT运行管理解决方案由IT基础设施监控平台和IT运维服务平台组成,IT基础设施监控平台具有计算机网络、业务应用、系统安全和机房环境的监控报警功能;IT运维服务平台具有运行值班管理、运行维护管理、、运行统计与考核管理等功能,将人员、流程和技术有机地结合起来,将管理、监控和考核有机地结合起来,提升整个信息中心的运维管理水平。BroadView以统一事件平台为核心,将网络管理、系统管理、安全管理、服务管理贯穿在一起,建立的统一的IT运行管理平台。Broadview解决方案主要由基础监测层、统一事件处理层、运行服务管理层等组成,各个层次完成的基本的功能和技术规范如下:(1)基础监测管理基础监测管理实现对各类被管对象的管理功能,从范围看包括网络设备、安全设备、服务器、应用平台和业务系统等,从功能看主要包括配置管理、拓扑管理、故障管理、性能管理等,基础监测管理层面向相关领域的专业技术管理人员。(2)统一事件管理统一事件管理是运行管理平台的处理核心。通过统一数据接口规范数据接入标准,系统具备接入不同的基础监测系统的事件;利用事件规则库进行事件的过滤压缩、关联分析,大大压缩告警数量,定位真正故障原因;提供事件处理的策略,完成真正告警的通知和自动化处理。(3)运行维护管理运行维护管理包含集中运行展现和维护两大功能模块。集中运行展现提供集中的直观的监控呈现、快速发现和分析各类运行隐患,主要包括:网络拓扑、业务视图、告警监测、资产视图、统计分析等。通过全面的展现手段,使运行值班人员掌控全局运行状况,保障业务的稳定运行。维护流程管理通过借鉴ITIL等IT服务流程标准,建立符合公安行业现状和发展趋势的流程维护管理功能,流程管理的主要功能包括:故障处理、工单管理、资源管理、项目管理、值班管理、信息发布、运行考核等。(4)统一资源知识库统一资源库提供了各类信息的统一存储机制,包括资源信息、事件告警、性能分析、运维数据等,并为上层运行维护管理提供支撑数据。统一知识库贯穿于系统的各个层次,包括采集、分析、运维知识库等不同层次,包括信息内容、专家技能、标准规范、考核指标等不同内容,通过知识建设降低对个人依赖,实现运行知识的有效共享。这个体系结构是一个完整的网络管理、系统管理、安全管理、IT基础环境管理、运行值班管理解决方案,可以最大限度的保护网络中的投资,并充分考虑到将来管理需求扩展。(5)总结可以看出,以IT基础设施监控平台为支撑,以运维服务平台为抓手,全面提高IT系统的可用性,降低服务中断时间,通过这样的一体化方案,“IT业务系统运行无忧”才可以落到实处,而并不是类似噱头的空谈。(广通信达供稿)
信息发布:广州名易软件有限公司 http://www.myidp.net
|