如何理解数据仓库的四大特性?

我们知道数据仓库的四大特性:

    面向主题的(Subject Oriented) 集成的(Integrate) 相对稳定的(Non-Volatile) 反映历史变化(Time Variant)

那么,如何理解这四大特性呢?

一.怎么理解数据仓库是面向主题的?

首先理解主题这个概念

抽象意义上:在较高层次上将企业信息系统中数据进行综合、归类分析利用。属于一个抽象概念,每一个主题基本对应一个宏观分析领域。

逻辑意义上:主题(Subject)是对应企业中某一宏观分析领域所涉及的分析对象(重点是分析的对象,对象,仔细理解一下对象的含义)。

例如:"销售分析"就是一个分析领域,这个"销售分析"所涉及到的分析对象为商品、供应商、顾客、仓库等, 那么数仓主题可以确定为商品主题、供应商主题、顾客主题、仓库主题; 联系到下文"销售分析"可以作为一个主题域;如果"产品分析"是一个分析领域,"产品分析"所涉及到的分析对象为商品、地域、时间、类别等, 那么数仓的主题确定为商品主题、地域主题、时间主题、类别主题,"产品分析"可以作为一个主题域。

那面向主题的理解就是,操作型数据库的数据组织面向事务处理任务,各个业务系统之间各自分离,而数据仓库中的数据是按照一定的主题域进行组织。面向主题的数据组织方式, 就是在较高层次对分析对象数据的一个完整、统一并一致的描述,能完整及统一地刻画各个分析对象所涉及的有关企业的各项数据,以及数据之间的联系。

二.怎么理解数据仓库是集成的?

三.怎么理解数据仓库是相对稳定的这个特性?

数据仓库中的数据主要为决策者分析提供数据依据。决策依据的数据是不允许进行修改的。 即数据保存到数据仓库后,用户仅能通过分析工具进行查询和分析,而不能修改。 数据的更新升级主要都在数据集成环节完成,过期的数据将在数据仓库中直接筛除。

四.怎么理解数据仓库反映历史变化(Time Variant)这个特性?

数据仓库中的数据通常包含历史信息,系统记录了企业从过去某一时点(如开始应用数据仓库的时点)到目前的各个阶段的信息,通过这些信息, 可以对企业的发展历程和未来趋势做出定量分析和预测。 意思就是历史数据都是累加的,不断变多。

经验分享 程序员 微信小程序 职场和发展