您的位置: >> 首页 >> 数据仓库 >> Data Model >> 查看资讯

推荐给好友 上一篇 我要投稿 下一篇

数据仓库维度建模技术在电信行业的应用

山东大学计算机科学与技术学院 栾诚 李玉忱

    在电信行业经营分析系统设计中,数据仓库维度建模设计至关重要。并将作为企业经营分析中最为关心的主题之一。本文将以客户流失分析为例,研究在实施电信行业经营分析系统时,如何构建数据仓库的维度模型。

    一、建模步骤

    a) 面向经营分析系统的数据仓库与面向事务处理的数据库应用需求不同,所采用的建模方法也不同。数据仓库建模的两个重要特点是面向主题和集成性。面向主题与传统数据库面向应用相对应。主题是一个在较高层次将数据归类的标准,是用户使用数据仓库进行决策分析时所关心的重点方面。每一个主题对应一个分析领域,通常与多个操作型信息系统相关。集成性是指在来源复杂的数据进入数据仓库之前,必须经过数据加工和集成,消除源数据中的不一致性,以保证数据仓库内的信息是关于整个电信行业的一致的全局信息。

    1. 模型关键数据结构的设计

    数据仓库的建模分为物理建模和逻辑建模。物理建模侧重于对物理存储介质的访问存取性能优化。逻辑建模针对于具体应用。

    1.1 模式选择

    逻辑建模是数据仓库实施中的重要一环,因为它能直接反映出业务部门的需求,同时对系统的物理实施有着重要的指导作用。目前较常用的两种建模方法是所谓的第三范式(3NF,即ThirdNormalForm)和星型模式(Star-Schema)。

    1.1.1 第三范式

    范式是数据库逻辑模型设计的基本理论,一个关系模型可以从第一范式到第五范式进行无损分解,这个过程也称为规范化(Normalize)。在数据仓库的模型设计中目前一般采用第三范式,它有非常严格的数学定义。如果从其表达的含义来看,一个符合第三范式的关系必须具有以下三个条件:

    (1) 每个属性的值唯一,不具有多义性;

    (2) 每个非主属性必须完全依赖于整个主键,而非主键的一部分;

    (3) 每个非主属性不能依赖于其他关系中的属性,因为这样的话,这种属性应该归到其他关系中去。

    第三范式的定义基本上是围绕主键与非主属性之间的关系而做出的。如果只满足第一个条件,则称为第一范式;如果满足前面两个条件,则称为第二范式,依此类推。因此,各级范式是向下兼容的。

    1.1.2 星型模式



TAG: 电信 建模 数据仓库 维度 行业
10秒注册会员 结交数据仓库朋友 分享你的精彩
31/3123>

我来说两句

seccode