数据仓库建设的成功之道
怎样把数据从成本转化为价值?怎样从庞大的数据集中分析出有用的信息来用于企业的市场经营和企业决策?
随着数据的不断积累和增长,各个行业都在思考一个相同的问题,怎样把数据从成本转化为价值?怎样从庞大的数据集中分析出有用的信息来用于企业的市场经营和企业决策?
商业智能(Business Intelligence简称BI)早在1996年便由Gartner提出,其本质便是通过数据仓库、联机分析处理(OLAP)、数据挖掘等技术来完成从数据到信息的提炼,最终获得对企业经营和决策有用的知识。毫无疑问,只有通过商业智能的相关系统,才能真正把数据从企业的成本转化为价值。
虽然国内各行业对于数据仓库系统均有热切的期望,但是真正实施的企业却不多,中国移动在2003年率先在全国范围内启动了中国移动二级经营分析系统的建设,应该是开创了国内行业大规模进行数据仓库系统建设的先河。笔者有幸参加了其中某省经营分析系统的建设,一些心得供大家分享和借鉴。
影响数据仓库系统建设成功的关键因素
影响一个数据仓库系统成功与否的关键因素通常有如下几点:数据质量;市场业务人员的参与程度;集成商对于业务的了解程度以及合适的技术框架的建立。
数据质量
相对于国外企业而言,国内企业的信息化建设周期较短,而计算机技术的发展和市场发展均很迅速,因此很多企业从信息化建设伊始,便忙于对生产管理系统的不断整合或升级,但是却忽略了对于数据本身的整理。对于电信运营商而言,客户的背景资料例如客户的性别、年龄、家庭关系等对于客户相关分析如离网、市场营销等都非常重要,但是可能在大部分电信运营商的数据库里,性别不祥的用户比性别为男或女的用户都多。国外的电信运营商都很注重对于客户家庭成员的相关分析,而国内电信运营商是不可能进行这些类似的分析,因为根本不具备这些准确的信息。这些不准确的数据会导致数据仓库系统最终分析得到错误的结论,不可能对企业经营提供帮助,因此数据质量的好坏直接影响了数据仓库系统建设的成败。
业务人员的参与
数据仓库系统实际上是完全为业务人员服务的系统,数据仓库系统建设的一个原则便是:在企业的各个部门中谁需要了解的数据最多,便为谁服务。因此,数据仓库系统与传统的企业生产管理或者运营系统有很大的区别,数据仓库的用户通常会包括企业的决策人员,企业的市场分析人员,企业的一线业务人员。业务人员作为系统的最终使用者应该在系统建设之初便全程参与系统的建设,包括对于源数据的选取等。而很多企业仍然将数据仓库系统当成一个传统的信息系统来建设,往往将其完全交给企业的IT部门来负责,以交钥匙的方式建设完成后交给业务人员使用,业务人员缺乏对系统建设的参与,最终导致建设和使用的脱节。按照数据仓库建设理论,数据仓库是一个过程而不是一个系统,其本质便是随着业务的不断发展,数据的不断积累而不断的完善和发展新的分析功能,因此对于数据仓库系统的建设而言,一个好的方法便是开发到一定程度后,便开放给前端业务人员使用,随着业务人员的使用和反馈,慢慢完善系统的建设,最终满足业务人员的业务需求。形成业务、数据、系统和前台使用人员的良性互动。
集成商对于业务的了解程度
数据仓库系统的建设对于传统的IT集成商和软件开发商提出了更高的要求。在传统的生产管理系统中,集成商或开发商只需要了解系统要实现的相关业务流程,在软件中实现这些业务流程和相关的业务操作。但是数据仓库系统要求集成商对于客户的业务和经营有更高的了解。一个优秀的集成商在整个数据仓库系统的建设期间需要扮演多个角色,在系统建设的前期,集成商负责搭建整个技术平台,在系统建设的中后期,客户往往会要求集成商利用数据仓库平台参与到客户的经营分析中去,利用相关技术找出市场发展的规律或者瓶颈。在这个过程当中,集成商实际上便需要完成从集成、开发到咨询的角色转变。因此,每一个致力于数据仓库系统建设的集成商都应该培养一支对市场和技术都相当了解的团队。
合适的技术框架的选择
很多公司在准备建设数据仓库系统时,都把精力放在工具的选择方面例如ETL工具、数据库工具、OLAP工具等。其实对于一个数据仓库系统而言,最重要的是选择一个合适的技术框架,包括合适的逻辑数据模型和物理数据模型,合适的数据抽取策略,到底是先转换后加载,边转换、边加载还是先加载后转换?合适的数据展现策略,ROLAP,MOLAP还是HOLAP?选择了一个合适的技术框架,从技术层面而言,数据仓库便已成功了大半。
保障数据仓库系统建设成功
要建设一个成功的
- 蓝色基因GL-1120服务器突破1U服务器性价比极限(02-23)
- Maxim推出低功耗的高速PCIe 2.0无源开关(03-13)
- NI推出高精度多功能USB接口数据采集设备(04-05)
- Teradata为业务用户提供增强的分析能力(06-08)
- Teradata倾力打造世界一流的数据仓库(09-21)
- Teradata实验室推出创新的数据仓库概念(10-08)