城市社会治安视频监控系统运维管理工作探讨
|
随着社会经济的不断发展,各级政府行政机关社会管理压力越来越大,视频监控系统作为一种非接触式社会管理手段,已经成为维护社会治安以及城市管理秩序的重要抓手。据初步统计,广州市全市共建视频监控摄像机26.8万台,2013年公安机关利用视频系统提供犯罪侦查线索3万多条,协助破获刑事案件逾万宗,利用视频系统纠正、查处各类交通违法行为300万多起,协助处理城市管理事务近1.6万宗。然而,由于视频监控系统前端设备24小时不间断运行在室外环境,因此故障类型和数量也不断增加,有些故障还会直接影响社会治安及城市管理工作,如何加强视频监控系统运维管理工作,已经成为公安科技工作者的一个重要研究课题。笔者所在的广州市视频建设办承担了全市视频监控系统的运维统筹及管理工作,在2013年启动了广州市社会治安及城市管理智能化视频系统运维管理中心及其软件平台建设工作,现将有关设想介绍如下: 一、运维管理工作现状 目前,广州市视频系统已有约4.2万路的摄像头接入,其中有1万路接入公安网和3.2万路是接入视频专网。根据视频系统规模不断扩大、联网结构越来越复杂、产品升级换代节奏加快、系统建设升级改造活动越来越频繁的形势,广州市视频系统相关维护工作还是以落后的人工方式进行管理。随着广州市视频监控系统建设的不断深入,涵盖的应用系统越来越多,而且涉及的硬件和软件资源也变得相当庞大而复杂,管理上目前还较为被动、不能及早消除各种故障隐患,运维压力在日渐增大,缺少全面的管理手段和工具。虽然现有的视频监控联网管理平台具有部分的运维功能,但其主要作用在于实现视频资源的联网。其故障检测模块功能一是为监控中心人员提供查看前端摄像机的运行状态。二是监控范围限于对前端摄像机的故障进行简单判别,无法检测各类存储设备、视频传输网络和设备、服务器设备、平台软件、客户端的设备以及机房中心环境等具有关联的设备运行状态和参数,并对故障进行定位。三是未能定义运行监控相关的业务和技术规范,定义事件告警、运维作业、服务考核的各类业务标准和规范。 二、运维软件平台总体功能 广州市视频专网共接入约6万路的摄像枪及1万个IT设备,根据《广州市社会治安与城市管理智能化视频系统建设规划》(20132016年)及实施方案的工作要求,按照管理、业务、服务的三个层面进行建设,建立一种以流程为导向,以业务为中心、注重服务意识的管理模式,提高系统维护效率、减低运维成本、完善系统建设和运维历史、监督系统维护工作、评估系统运行绩效、优化系统设计和保障系统持续良好运行,由广州市社会治安与城市管理智能化视频系统运维中心进行统筹、分析、分配运行维护事件,实现专业化、智能化、实时在线的运维管理系统,提高广州市视频资源整体的运营效率,提供具有针对性和科学性的运行维护服务解决方案。提高智能视频系统应用,提高社会面管控及维稳处突能力,提高城市现代化管理水平,为建设智慧广州、幸福广州、平安广州打下坚实的基础。 三、需求分析 (一)设备管理 前端设备管理:主要是针对视频前端的摄像头和DVR。平台可以自动巡检前端设备的运行状态,并且对异常设备进行分析告警。通过智能化的成像巡检技术,平台对前端设备的成像质量检查并分析。视频故障主要分为视频清晰度异常、视频亮度异常、视频偏色、视频条纹干扰、雪花干扰、场景变化、云镜控制失效、画面冻结和信号缺失等。平台也可手动巡检前端设备的运行状态,可以灵活调度分析诊断某个前端设备的成像质量。 存储设备管理:网络存储设备(磁盘阵列、NVR、IPSAN等)的管理需采集到以下的数据指标参数,包括设备名称,IP地址,子网掩码,当前状态,网络设备类型,操作系统及操作系统版本等基本信息;以及CPU利用率、内存利用率、磁盘利用率等统计图表,及时的反应服务器设备资源的当前使用情况。流媒体服务管理,主要管理流媒体服务器的最大并发数目、聚合输出带宽、请求响应延时、服务器端丢包率、延迟抖动、CPU内存占用率等。 服务器设备管理:管理全网的服务器设备,服务器管理可以支持WINDOWS、LINUX、UNIX等操作系统,主要对服务器的基本信息、服务器运行参数(包括CPU、内存、硬盘等)、服务器接口信息等进行管理。 网络管理:管理所有网络设备,实现网络资源管理,管理网络配置;提供网络故障管理,及时发现故障原因,并且实时告警。同时对网络安全设备进行管理。 (二)应用管理 要求对中间件系统进行管理,检测中间件关键的运行状态和性能,支持的中间件系统类型包括:Tomcat、weblogic和websphere等。 (三) 实现业务视图定制、统一告警、权限控制、性能分析等功能。 (四)报表管理 提供各种报表,管理人员能根据这些报告准确评估整个IT环境运行情况,及早发现故障隐患和评估威胁。 (五)视频运维计费管理 目前的视频及IT设备主要由专门的运维公司来维护,然后根据周期内IT设备的运行维护情况来计算运维费用,通过计费管理功能模块记录并定义各运维商的计费规则,以及根据规则自动生成计费报表。结合需求,整个计费管理模块分为维护商管理、计费规则模板管理、计费报表。 四、总体框架设计 (一)运维管理中心平台拓扑图如图1 运维管理中心平台跨越公安内网、视频专网两个网络,针对该两个网络中视频相关资源进行运维管理。在视频专网环境中建设总运维中心系统,在公安内网、视频专网分别部署支撑服务器做为数据采集端,各数据采集端采集所在网络的IT或者视频资源运行数据。公安内网采集端运维数据通过边界接入平台传入视频专网,最终所有采集端的运维数据统一接入总运维中心。 数据采集端的部署点及采集范围主要按管理范围(区、市直单位或公安直属部门)和各范围内设备数量来计算分配。设备量相对较多的范围由一个数据采集端负责数据采集,而设备量相对较少的范围可由一个数据采集端负责多个范围的数据采集,做到资源按范围和设备量的合理分配。 (二)运维管理中心平台软件架构 视频系统运维管理中心平台采用BS架构,采用J2EE架构平台,使用JAVA开发语言和XML技术,采用易扩展维护的组件模式构造系统;考虑到平台建设的易维护性以及未来长期可扩展性的要求,平台主要构建在安全、稳定的主流操作系统和中间件上,使用集群式的大型关系型数据库管理数据。 视频系统运维管理中心平台整体架构图如2。 整个平台软件架构分为五层,分别如下:网元层,即视频资源层,指与视频相关的前端设备、网络、服务器、应用系统等资源。数据采集层,对网元层资源的运行数据进行采集和存储。数据分析层,对数据采集层采集到的数据进行分析。数据业务层,将分析后的数据与各业务功能进行结合,形成各业务功能模块。数据展现层,通过显示器或者大屏将各业务信息展现出来。 由于整个平台运维管理的视频资源繁多并分布多个网络,所以视频资源预警系统采用分布式架构部署。整个平台的软件部署架构图如图3。 (三)总体设计方案 运维管理中心平台按功能性质分为视频资源预警系统和视频运维服务管理系统两套子系统。视频资源预警系统负责对视频相关资源的运行数据进行采集、分析并生成告警;视频运维服务管理系统为运维人员提供集故障处理、运维流转、工作协同为一体的平台。 1、视频资源预警系统 (1)管理范围 系统压力预警:系统压力包括服务器运行压力、网络带宽传输压力、设备工作温度压力、机房环境压力等,如服务器的CPU占用率、内存占用率、剩余硬盘容量、CPU温度值等。 系统故障告警:含应用系统、操作系统、数据库以及中间件故障,包括客户端声光报警、手机短信报警、电子邮件报警等。设备故障报警:视频监控系统的后台各种硬件设备包括网络设备,以及前端接入的摄像机、卡口等设备,当这些设备发生故障时,告警管理模块能及时的发出告警信息。 网络流量告警:通过网管系统接口,能实时的采集到视频专网的网络流量信息,当发生网络阻塞或业务峰值时,能通过告警管理模块自动进行告警。 (2)数据采集方式 数据的来源主要分以下几种方式:主动方式,包括SNMP、JMX、JDBC、HTTP轮询方式;2)被动方式,包括Syslog、Trap方式;3)手动数据采集,手动数据采集就是在设备维护、检测、管理时候,实现即时获取数据并且把结果呈现。手动数据采集主要支持协议有:SNMP、JDBC、JMX、RTMP、HTTP等。 (3)告警管理 告警管理包括网络管理模块、服务器管理模块、数据库管理模块、中间件管理模块、安全产品管理模块以及流量管理模块的告警信息。所有告警信息可以根据故障严重程度、对业务影响范围以及客户具体要求进行分级告警,告警生命周期管理,流程见图4。 告警分级管理:系统可以自动区分事件不同的严重性和优先级别,使系统管理员可以迅速地把注意力放在重要的告警事件上,实现高效的分层告警管理,并以不同颜色的图标加以区分。 告警升级管理:可以定义事件自动升级处理的阀值;能够基于时间信息升级处理;当事件处理超过预期时限,根据预定义的升级条件,能够将该事件自动手工升级到指定的人员。 预警:初步流程设计如图5。 预警管理:提供建立故障预警管理,通过设置阀值,可以不断监测设备负载是否超标(CPU负载Mem利用率)、线路流量是否正常,端口是否有持续的错包等现象,同时系统会发出告警信息,分析判断网络的安全状态,分析非法入侵、攻击、病毒、物理故障等。 业务管理:业务管理模块可实现业务视图定制、统一告警、权限控制、性能分析等。 (4)性能分析报表管理 性能分析报表是一个依赖监测数据,然后把数据整合并且与基准值对比,最终形成对整个视频系统的健康情况的整体评分审查。以宏观角度对视频系统进行全面分析,提供性能分析描述建议,得到整个视频系统的运行情况,找到视频系统的性能瓶颈。 性能分析报表的主要包括:指标生成、基准值设置、分数值设置、性能评分、预设评分表格等。 (5)设备关系分析引擎 关系分析引擎可以让网络管理摆脱传统一个个网元孤立的管理模式,通过网元的关系做为基础的地图,把告警信息通过基础信息全面提供告警分析。关系分析引擎可以让管理人员减少关系分析人手判断操作,自动化从海量信息筛选出设备信息。 关系分析引擎是业务管理、性能分析和告警管理等智能分析基础引擎。通过自动发现,平台可以获取到主要视频系统的设备的部分关系。自动发现可以获取到网元管理主要有依赖关系和连接关系。管理人员可以通过手动维护设备的包含关系和关联关系。每当设备产生一条告警时候,就会进入关系分析引擎中,关系分析引擎就会遍历设备的关系,最终找出告警关系。 2、视频运维服务管理系统 (1) 资产登记:对系统所有设备建立台帐,包括设备编号、设备分类、设备名称、设备型号、保管人、使用状态、设备折旧、特种设备等。
| |