微波EDA网,见证研发工程师的成长!
首页 > 通信和网络 > 通信网络业界新闻 > 三大模型架起数据仓库大厦

三大模型架起数据仓库大厦

时间:10-05 来源:赛迪网 点击:

以便使得该主题域能建设成为一个可应用的系统;它还要足够小,以便于开发和较快地实施。

  ◆粒度层次划分

  数据仓库逻辑设计中要解决的一个重要问题是决定数据仓库的粒度划分层次,粒度层次划分适当与否直接影响到数据仓库中的数据量和所适合的查询类型。由于主题数据库响应企业级业务OLTP需求,所以必须保存最细类度数据,同时根据业务部门的查询需求考虑确定多重粒度来提高复杂查询速度。

  ◆确定数据分割策略

  在这一步里,要选择适当的数据分割的标准,一般要考虑以下几方面因素:数据量〔而非记录行数)、数据分析处理的实际情况、简单易行以及粒度划分策略等。其中,数据量的大小是决定是否进行数据分割和如何分割的主要因素;数据分析处理的要求是选择数据分割标准的一个主要依据,因为数据分割是跟数据分析处理的对象紧密联系的。

  ◆关系模式定义

  数据仓库的每个主题都是由多个表来实现的,这些表之间依靠主题的公共码键联系在一起,形成一个完整的主题。在概念模型设计时,我们就确定了数据仓库的基本主题,并对每个主题的公共码键、基本内容等做了描述。在这一步里,我们将要对选定的当前实施的主题进行模式划分,形成多个表,并确定各个表的关系模式。

  关于物理模型

  物理模型设计所做的工作是根据信息系统的容量,复杂度,项目资源以及数据仓库项目自身的软件生命周期确定数据仓库系统的软硬件配置,数据仓库分层设计模式,数据的存储结构,确定索引策略,确定数据存放位置,确定存储分配等等。这部分应该是由项目经理和数据仓库架构师共同实施的。

  确定数据仓库实现的物理模型,必须做到以下几方面:

  ◆确定项目资源

  根据预算和业务需求,并参考以往的数据仓库项目经验,对该项目的成本周期和资源进行估算。

  关于项目周期的估算,主要基于ETL函数功能点以及加权后的复杂度进行估算,通过以往项目经验和专家评估,然后再根据软件生命周期的划分,可以有效的得知项目的整体周期。

  关于人员的估算,主要取决于人员的工作经验,素养,对新技术的掌握能力,还要考虑到人员流动等方面的人员备份。

  ◆确定软硬件配置

  数据仓库项目与其他业务系统不同,尤其需要对数据容量进行估算,这是因为数据仓库是历史的稳定的基于主题的集成的等等特性所决定的,它是对以往历史数据的集成,如果项目初期不加以考虑,很快就会造成灾难性的后果。

  所以,首先要得到数据仓库的预计容量,也要考量具体的关系数据库的性能,既要考虑实际的预算,也要视实际的需求而定。在发挥软件作用的同时,兼顾扩展性。

  ◆数据仓库存储设计

  数据仓库一般采用分层设计,即ODS层,数据仓库层,数据仓库聚合层数据集市等等;数据仓库的分层是灵活的,没有固定的模式,一切视实际情况而定。

  图2 兼顾行业经验、业务要求与现有信息系统

Copyright © 2017-2020 微波EDA网 版权所有

网站地图

Top