信息系统科学预测的“水晶球” | ||||||||||||||||
文章来源:名易软件 对于未来,我们总是本能地满怀期待与憧憬。拥有确定性的明天,是千古以来萦绕在人类心头最原始的渴望。今天,这种梦想的光芒正投射在IT的疆土之上。为了更加准确、及时地把握商业活动的未来动向,预测分析正在成为一种被用户接受的科学“占卜术”。 美国的LoanPerformance公司运营着一个面向金融机构的贷款偿还信息合作数据库。通过数据库和预测分析工具,他们可以帮助金融客户预测哪些顾客无法及时还款,哪些顾客是在说谎,哪些顾客可能根本就没打算还款。 Highmark公司是美国一家医疗保险服务商,他们使用预测分析工具来预测和阻止客户的欺诈性索赔行为。 国内某著名钢铁企业,通过预测分析来制定年度冶炼计划,以此来最大限度地提高企业的生产收益率。 中国移动某省级分公司,通过对客户通话种类、离网时间等行为的分析来预测可能的客户流失问题,并依照结果制定相应的客户关怀计划。 从上面的几个案例中,我们发现,预测分析已经被应用在很多商业活动之中,它有时甚至与我们是如此的贴近,可能正在监视着我们的一举一动。事实证明,在技术推进和用户需求的双重作用下,预测分析目前正在呈现出快速蔓延的态势。而企业数据量的高速膨胀,也为预测的准确性提供了强大支撑。因此今天,预测分析已经成为一门企业可以掌握的技能,它将赋予使用者更敏锐的洞察力,让他们在“乱云飞渡”的市场之中,依旧从容不迫。 洞悉明日之机 古语有云:“凡事预则立,不预则废。”然而,现实环境中的诸多难以捕捉的不确定因素,使预测分析的商业化道路并非一片坦途。虽然很早就具备了通过统计分析学建立预测模型的能力,但是计算能力的滞后,让预测分析在很长一段时间内仅仅停滞在科研、教育等高端领域,从具体的企业运营数据中预测市场走向的愿望成为企业用户迟迟无法实现的“奢求”。 IT技术的发展彻底改变了这一局面。随着计算设备性能的突飞猛进和系统总体拥有成本的不断下降,企业已经可以组建自己专有的预测分析平台。同时,针对商业用途的预测分析工具的易用性不断提升,它们提供了更优化的模型构建工作流,使得业务分析人员不依赖统计人员就可以进行预测操作。 在突破了横亘在科研与商业应用之间的壁垒之后,预测分析真正迎来了大众化应用的时代。然而无论是以前的“阳春白雪”,还是现在的“老少皆宜”,以传统的统计分析为基础的预测分析流程并没有改变。 典型的预测分析通常包含以下几个步骤:即确定目标数据、开发统计模型、根据样本测试模型的准确性、将模型应用于整个数据集合,最后是将统计结果传送到系统前端进行展示。在具体的预测方法上,仍然以时间序列法和反问题动力系统分析为基础,并且辅以多元回归、神经元算法等计算手段。 不过,为了适应瞬息万变的商业环境,预测分析也在不断地进行自我调整,以满足大众化应用的需要。目前,预测建模的很多过程已经实现了自动化,涵盖不同行业需求的模型库也日臻成熟。这意味着企业用户可以以更快的速度建立模型,并且根据业务需求频繁地更新它们,从而实现对业务变化的及时响应。 迎接“后数据挖掘”时代 数据挖掘是预测分析技术成长的丰沃“土壤”。而在预测分析的带动之下,数据挖掘也开始走出以报表和查询为主的应用范畴,尝试着从历史数据中发现有关未来行为的线索。所以,今天的预测分析与数据挖掘存在着非常大的交集,它可以被看作是一种“后数据挖掘”时代的技术分支。 同时,由于预测分析仍然处在成长期,其自身的边界尚未完全明确。BusinessObjects中国区售前技术咨询总监鲁百年博士就表示,目前我们很难把“预测”和“分析”剥离开,很多被划定为预测的项目实际上只是进行了预警操作,那些所谓的实时预测系统也基本上只具备了预警能力。不过,在未来,预测应该会成为数据挖掘的一个独立的组成部分。 由此可见,我们今天所享用的预测服务可能还不是纯粹意义上的“预测”。但是,在多种技术的综合作用下,预测分析通过不断的“吐故纳新”实现自我优化。它对文本挖掘技术的采用就是一个很好的例证。 目前,已经有用户开始通过文本挖掘来提高其预测模型的准确度。LoanPerformance就在原先贷款历史、信用报告、人口统计学数据等结构化数据的基础上,在计算模型中引入了呼叫中心人员与顾客交谈的文本记录信息。他们使用了IntelligentResults公司的工具来分析这些语言数据,以确定某人是不是在说谎。而分析的重点在于寻找导致事件的原型。实践证明,融合了文本信息的模型比标准模型的效果更好,它使得系统预测的准确性比原始模型提高了18%。 J.D.PowerandAssociates最近也开始了文本挖掘技术的早期测试。他们正在研制一种名为ClearForest的工具,希望帮助用户预测出比基于结构化数据更实用的答案。SAS的EnterpriseMiner也可以根据呼叫中心对话中捕获的文本数据进行预测分析。 未来有多美? 成功的预测分析服务模式可以带来巨大的回报。以国外某金融机构为例,一个预测客户信用风险的模型在6个月内为该机构节省2百万美元,而系统的部署成本约为40万美元。这种高回报导致了预测分析工具的销售额大幅增长。据IDC预测,预测分析工具的销售额将在2008年时增加到30亿美元,比2004年增长近40%。同时它将占据BI(商业智能)市场25%的份额。 如此巨大的发展前景势必引发软件厂商新一轮的市场追逐。而在这一领域,主要的产品类型可以通过功能进行明确地划分。目前SAS、SPSS等公司组成了专业型预测分析工具的阵营,他们所提供的产品具有较高的预测准确性,但是应用起来非常复杂,使用范围有限,像SPSS主要就是面向教育、科技等专业人员的;而在应用型预测分析工具方面,主要的成员Kxen、Unica、J.D.PowerandAssociates等,他们向用户提供“傻瓜型”的预测工具,通常具备易用、高速等特点。 鲁百年介绍,Kxen的抽样水平非常高,擅长处理大型、复杂的数据结构,它在国内的应用比较广泛,有8家电信运营商正在使用这一产品。BusinessObjects也OEM了Kxen,希望通过这种产品绑定的方式帮助客户实现客户细分、预测等应用。而这也是许多BI厂商的普遍做法。 在应用方面,预测分析也表现出了惊人的行业渗透能力。除了在金融、电信等重点行业外,预测分析正在尝试着幻化出更多的应用形式。SAS大中华区解决方案总经理曾濠生就表示,目前预测分析在零售行业的表现相当活跃。据介绍,目前国内很多大型超市都在采用基于时间序列法的购买模型,以此分析客户的购买行为,制定吸引客户消费的优惠政策。另外,海关、卫生、公安等机构也是预测分析的热点应用区域。而从目前客户的需求状况看来,与市场越接近、业务数据量越大的对象,与预测分析的匹配程度就越高。 两个必要条件 技术的创新让预测分析的结果不断地向准确的目标靠近,不过目前用户必须面对的问题是,在技术尚未完全成熟的条件下,如何通过应用水平的提高来尽可能地保证预测的准确程度。在预测分析的一些早期案例中,用户经常会发现用预测分析工具所得到的是一些不相关、幼稚甚至是错误的结果。 比如,国内某电力企业,由于早期建模过程中的失误,导致花费大量资金所得出的结果根本无法成为决策参考。因此,专家建议,用户在部署预测分析系统时要报以科学、谨慎的心态,避免盲目行为。同时,专家强调,由于预测是基于大量、可靠的企业业务数据所做出的综合判断,所以强大的数据体系和具有多元化知识结构的分析人才是成功实施预测分析项目的两个必要条件。 曾濠生指出,准确的预测需要大量、持续的操作、交易等类型的数据作为支撑,因此用户必须拥有运行顺畅的业务数据流,基本的条件是企业已经拥有了一个成熟的平台。鲁百年也表示,一般的分析需要1年的业务数据就可以了,而要做出预测需要4年的数据才行,如果考虑到数据周期的问题,最理想的历史数据量是5年5个月。 另一方面,人才问题也在逐渐得到企业用户的重视。目前,一些企业为了提高预测的准确性,已经采用了由专业人员来审查、输入变量的方法。曾濠生表示,预测分析人员不仅要具备深厚的统计学功底,还需要熟悉企业的业务应用,这样才能创建出更加合理的预测模型。鲁百年指出,单一的知识结构对预测来说太过单薄,对预测结果的解释和分析将会考验分析人员的综合素质。 鲁百年还强调,预测模式需要一个反复验证的过程。所以在开始时预测出现偏差是正常现象,用户不必对此过于担心,今后有很多种方法可以进行校正。总的说来,模型运行的时间越久,其预测的准确性就越高。 来源:CCW
|