数据管理挑战不断升级,数据平台高举开放旗帜
|
(一)数据管理挑战正在不断升级 10年前,数据库管理员(DBA)主要关心的问题是如何优化其数据库管理系统的性能。而今天,DBA们开始注重如何实施高效的数据库管理。因为一旦管理员可以自动化任务、标准化数据格式,制定维护流程,数据库能够自行履行其存储和检索数据的职责。 同时,随着Web2.0和其它技术的发展与应用,数据库需要处理的数据量也在急速增加,其中包括视频、音频文件等大容量数据,而且数据已经渗透到了日常业务运营的方方面面。因此,今天的DBA们实际上面临比10年前更加复杂的情形与挑战,主要集中在以下几点: 一是数据量飞速增加。由于最近几年来数据更新速度日益增加,各种新技术层出不穷,以及数据使用方式不断推陈出新,企业生成的数据量也逐渐呈井喷之势。现在,各大企业都已经采用ERP、等解决方案,因此每天都会产生大量数据。 二是数据关联性增加。新技术为我们使用数据的方式开创了更多可能性。在日常业务运营中,从电子商务网站到库存管理,都需要借助数据和数据库管理系统的能力,来将数据迅速传递给需要它的应用。 三是服务器数量激增带动成本上升。由于顺应业务增长部署了更多物理服务器,而服务器CPU等资源的利用率却出现大幅下降,从而导致企业每年都需要从IT预算中支出大量的管理、维护和散热成本,使得IT预算不断紧缩的企业面临更大的压力。 四是数据挖掘与分析处理的压力加大。如果这些数据不能被实时、有效地加以利用,形成对实际业务决策有用的信息,数据增长反过来会带来负面影响。(二)挑战驱动创新 上述挑战一方面给企业带来现实压力,但另一方面也带来了创新机会。那么,面向ERP、CRM等关键业务的数据密集型工作负载,需要什么样的软硬件数据管理平台呢?笔者认为,至少需要满足以下几个方面的要求: 一是可扩展的处理能力。为管理数据密集型工作负载,将海量原始数据转化成有用的信息,并提供实时分析和查询服务,需要有非常强大的系统处理能力做支撑,以优化复杂多线程的应用性能。 二是出色的可靠性。由于某个数据库出现故障所产生的负面效应可能会波及整个企业,影响重大,因此需要平台能确保7*24小时不间断提供服务。 三是灵活的虚拟化性能。为减少物理服务器的数量,提高IT的灵活性,通过虚拟化实现整合的能力已经成为标配,同时还需要通过虚拟机实时迁移、灾备等功能来提高可用性。 四是成本节省。对于许多处在激烈竞争市场环境,IT预算紧缩的企业而言,降低包括硬件采购、软件许可证、管理维护、能耗等方面的成本一直是企业追求的目标。 (三)基于行业标准的开放数据管理平台 2010年,微软推出了这样一款全新数据管理平台:在英特尔至强7500服务器上部署SQLServer2008R2所提供的托管型自助式BI解决方案,可以针对超大型数据集近乎实时地分析和查询复杂数据。 据了解,使用微软自助式BI方案,最终用户可以利用面向Excel的PowerPivot插件等自助式分析工具,迅速查找到所需信息,进行特定分析和建模,帮助用户近乎实时地在大型数据集上执行复杂运算,从而获得有用信息,做出更好的业务决策。管理员也同样可以借助SQLServer2008R2的StreamInsight技术,在不到一秒内横跨多条数据流处理大量事件,帮助企业通过历史数据挖掘和持续了解动态数据,更迅速地识别和响应新趋势。 因此,这种方案对事务处理能力提出非常高的要求,而基于至强7500的服务器可以扩展至8个以上处理器,每个处理器可容纳8个内核,支持16条线程,而且还有1-2TB超大内存容量,大大降低延迟,提高数据库性能和SQLServer2008R2的能力。 当然,数据密集型工作负载,对于系统的可扩展性要求也很高。比如现在的SQLServer2008R2可以支持多达256颗逻辑处理器(原来是64颗处理器)和超过64条线程,用户还可通过SQLServer2008R2将数据仓库容量从数十万亿字节到数百万亿字节。对此,至强7500和至强E7也提供了相应的扩展性,在单一系统内,最大可以支持到256颗CPU,从而能够支持到最苛刻的数据密集型应用。 在可靠性上,至强7500系列的服务器具备20多项全新RAS特性,这些特性包括处理器间动态工作负载分配、互联错误检测和恢复,以及虚拟环境中的单个虚拟机恢复等。比如,WindowsServer2008R2具备的Windows硬件错误体系结构(WHEA)支持至强7500中的机器校验架构恢复(MCA)特性,可帮助平台在不中断操作系统应用的情况下,控制和恢复内存与高速缓存中的多位ECC错误——以前只有成本高昂的RISCUNIX平台和大型机才具备这些功能。 在TCO方面,X86服务器的硬件采购成本往往只有小型机的几分之一,但更重要的是,使用开放平台,有助于节省大量软件支持和许可成本。由于基于UNIX的软件通常按处理器内核数量而并非按插座数量计价,因此可节省成倍的成本。此外,由于微软不额外收取在线分析处理(OLAP)、数据挖掘、数据压缩、分区及其它特性的相关费用,因此相比Oracle等其他平台,在WindowsServer2008R2上运行SQLServer2008R2的成本也更低。 另外,值得一提的是,SQLServer2008R2已经支持Hyper-V实时迁移,允许用户在确保不停机的情况下在主机之间转移正在运行中的虚拟机。SQLServer2008R2还支持Sysprep,这样一来,管理员可以更轻松地创建SQLServer图像,随时随地迅速将它们部署在虚拟机中。对此,企业可以通过至强7500,以20:1的整合比率更换和整合过去的单核服务器,并可在1年内通过能耗、软件、许可证和维护成本的节省收回服务器更新带来的投资。 (四)小结:走向开放 数据管理不再是存储-检索的过程,随着技术应用的发展,以至强为核心的X86服务器,以及微软SQLServer数据库软件也在不断改进企业处理大规模数据的方式——对海量数据进行实时分析,并向企业各级用户快速提供有用的信息。比如中国人寿业务决策平台正是如此,将分散在公司各处的海量数据快速整合在SQLServer2008R2数据仓库内,然后提供决策分析时随时调用。 以往,专用的数据平台通常都是基于RISC或SPARC架构而构建,上面跑基于UNIX的软件,此类平台不仅购买成本高,在申请许可证、实施维护和培训方面的成本也较高。对于注重创新和成本效率的企业来说,今天开放的数据平台提供了新的选择。但这也意味着使用专有平台的企业需要做好迁移工作——将小型机换成X86服务器,将UNIX操作系统换成Linux或Windows,将应用和数据从原有系统迁移到新的系统中来。
信息发布:广州名易软件有限公司 http://www.myidp.net
|
|
|