数据仓库
!"
博士论坛
!!!!"
!"
!!!!"
摘
要关键词
数据仓库设计的一种有效方法
王宏鼎
于
波
唐世渭
杨冬青
童云海
(北京大学信息科学中心视觉与听觉处理国家重点实验室,北京&""/0&)
123456:7894:;<8=$>?@$A8@$B:
通过数据仓库和数据库设计的比较,该文提出了一种基于数据库设计思想的数据仓库设计方法,给出了设计步
骤,并介绍了源数据分析。同时,该方法在实际应用中取得了满意的效果。
数据仓库
设计方法
设计步骤
源数据分析文献标识码+
中图分类号CD)&&
文章编号&""!2/))&2(!""#)"%2"""&2"!
!"#$$%&’()%!**+,-&.’,/%0(1"/-’-2-+%.,30%
2-"14,"15("1637,8-"19.(:%(6-"1/,"1;("18,"163".-(
(*E4EAFAGH4=IJK5L@464:8+@85IDMIBALL5:;,-A:EAMJIMN:JIM34E5I:*B5A:BA,
DA?5:;O:5PAML5EG,QA5R5:;&""/0&)
!<0’+-&’:QGBI3>4M5:;84E494MA7I@LA8AL5;:95E784E4=4LA8AL5;:,E75L>4>AM>MI>ILAL4:AJJABE5PA4>>MI4B7EI
8AL5;:84E494MA7I@LAI:E7A=4L5LIJ8AL5;:E7I@;7EIJ84E4=4LA,4:8>MIP58ALE7A8AL5;:2LEA>,4:846LI5:EMI8@BALLI@MBALGLEA384E44:46GL5L$+>>6G5:;E7A4>>MI4B7EI>M4BE5BA;AELL4E5LJ5A8MAL@6E$=%>:,+50:84E494MA7I@LA,8AL5;:4>>MI4B7,8AL5;:2LEA>,LI@MBALGLEA384E44:46GL5L
&数据仓库概述
近年来,有关数据仓库的专著和文章出现很多,尽管对数
!数据仓库与数据库设计比较
关系型数据库理论经过近)"年的发展,其设计理论已经
据仓库的定义不尽相同,但数据仓库是分析型系统的数据基础,用来支持领导层的决策与管理这一观点已达成了共识。数即面向主题、集成、相对稳定和反映历史据仓库有#个特点,变化’&(。
(面向主题:主题是指用户进行决策时所关心的重点方&)
面,一个主题通常与多个操作型信息系统相关。数据仓库中的数据是按照一定的主题域进行组织。
集成:数据仓库中的数据是把原有数据库数据经加工、(!)
汇总和整理得到的,从而保证数据仓库内的信息是关于整个企业一致的、全局的、统一的综合信息。
(相对稳定:数据仓库的数据主要供决策分析之用,所涉))
及的操作主要是数据查询,一旦数据进入数据仓库后,一般将被长期保存。
(反映历史变化:数据仓库中的数据包含历史信息,系统#)
记录了企业从过去某一时点到目前的各个阶段的信息,通过这些信息,可以对企业的发展历程和未来趋势做出定量的分析和预测。
因此,数据仓库用于支持管理和决策,面向分析型数据处理,它不同于企业原有的面向交易的操作型数据库;数据仓库是对多个异构的数据源的有效集成,集成后按照主题进行了重组,并包含历史数据。
基金项目:国家%0)重点基础研究发展规划项目(编号:资助S&%%%")!0"T)
比较成熟,而数据仓库是分析型系统的数据基础,与操作型系统相比,数据仓库设计方法有不同于数据库设计方法的特点。目前,流行的数据仓库设计方法主要有两个特点。
首先,有人认为数据仓库设计是数据驱动,还有人认为数据仓库设计是需求驱动,这一观点目前在理论界和工程界尚未达成一致。文献’&(’!(认为数据仓库设计和数据库设计的根本不同之处在数据仓库设计是数据驱动的系统设计方法,即创建数据仓库的工作是在原有的数据库基础上进行,从操作型环境中的数据出发来进行数据仓库的建设,如图&所示(图中忽略了一些其它细节,图!、图)类似,后面不在单独说明)。而国际上著名的数据仓库厂商如*+*、,-.等则认为数据仓库的设计过程,仍然是需求驱动,他们在建设数据仓库具体实践中,首先通过对决策层业务领域的调查和研究,进行业务发现,了解应用需求,并通过分析型的需求来逐步建立概念模型、逻辑模型和物理模型,在这些模型建立的基础上,将操作型数据通过抽如图!所示。这种方法类似数取转换后,导入数据仓库之中’)(’#(,据库系统的设计方法。
数据仓库设计的第二个特点是螺旋式开发过程,设计中需要反复迭代,不断补充完善,循环求精,从图&、图!也可以看出这种特点,这种开发方法利用反馈控制原理,系统设计和维护人员通过不断消除设计与需求之间的偏差来完善现有系统,
作者简介:王宏鼎(,男,博士生,研究方向为数据仓库与数据挖掘。于波,男,博士生,研究方向为数据仓库与数据挖掘。唐世渭,男,教授,博&%0U2)
士生导师,研究方向为数据库与信息系统。杨冬青,女,教授,博士生导师,研究方向为数据库与信息系统。童云海,男,讲师,研究方向为计算机工程与应用!""#$%
&
百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说教育文库数据仓库设计的一种有效方法在线全文阅读。
相关推荐: