数据仓库

数据仓库的定义-

在W.H.Inmon所著“Building-the-Data-Warehouse”一书中给出了数据仓库的定义:“数据仓库是面向主题的、整合的、稳定的,并且时变的收集数据以支持管理决策的一种数据结构形式。”这一定义指出了数据仓库和事务处理系统之间的主要差异。数据仓库的目标是为了制定管理的决策提供支持信息,这显著的与OLAP系统的快速响应需要不同。正象企业为了发展要进行业务重组一样,为了支持管理决策需要也要按决策业务科目的要求重组OLAP系统中的数据,并要按不同决策,分析内容分别组织使之方便使用。

这种基于主题的模式从用户角度来看就是多重的数据重组结构。在把数据装载到数据结构重组后的数据仓库之前,先要进行数据转换,或称“整合”处理。这一处理包括几个必不可少的操作步骤,做到使数据完整、统一,这就确保了在使用数据仓库时其中的数据是有质量保证的,对此后文有详述。简而言之,整合就是保证数据准确,到位,没有超出应有的数值范围,没有重复等。数据仓库中的数据不象事务处理系统中的数据那样频繁的修改,所以它是比较稳定的(不必实时修改)。在一次数据分析的执行过程中使用的数据不得变更,这才能保证两次在使用同一组信息进行分析时不会得出不同的答案。数据仓库一般是按周、月或隔月从OLAP系统周期性的批次更新数据。由于具有数据的时段稳定性,对数据仓库来说就可以减少许多传统RDBMS必须的资源消耗,如:记录的锁机制、参照完整性的检查、数据操作的日志、以及检查点/回退(Roll-back)等。

数据仓库技术为您提供的服务-

□ 从任何业务处理系统或数据源中取出决策所需数据
□ 对源数据进行清理和整合
□ 按计划或规则进行数据仓库的装载和更新
□ 按支持决策的需要
□ 以多种形式进行数据和信息的组织
□ 最丰富的决策数据分析处理能力,灵活多样的结果展现方式

数据仓库技术应用-

□ 烟草经营业务管理系统
□ 大型家电连锁超市POS系统

回页首
 
  版权所有:万国软件开发(深圳)有限公司