数据仓库与数据挖掘(数据仓库与数据挖掘第五章课后答案)

本篇文章给大家谈谈数据仓库与数据挖掘,以及数据仓库与数据挖掘第五章课后答案对应的知识点,希望对各位有所帮助,不要忘了收藏本站喔。

本文目录一览:

简述数据库 数据仓库 和数据挖掘三者之间的关系

先说说数据仓库和数据挖掘的关系,再说说数据库与数据仓库的关系

数据仓库与数据挖掘的联系

(1) 数据仓库为数据挖掘提供了更好的、更广泛的数据源。

(2) 数据仓库为数据挖掘提供了新的支持平台。

(3) 数据仓库为更好地使用数据挖掘这个工具提供了方便。

(4) 数据挖掘为数据仓库提供了更好的决策袭郑支持。

(5) 数据挖掘对数据仓库的数据组织提出了更高的要求。

(6) 数据挖掘还为数据仓库提供了广泛的技术支持。

数据仓库与数据挖掘的差别

(1) 数据仓库是一种数据存储和数据组织技术, 提供数据源。

(2) 数据挖掘是一种数据分析技术, 可针对数据仓库中的数据进行分析。

1、数据库:是一种逻辑概念,用来存放数据的仓库,通过数据库软件来实现。数据库由很多表组成,表是二维的,一张表里面有很多字段。字段一字排开,对数据就一行饥侍一行的写入表中。数据库的表,在于能够用二维表现多维的关系。拍肢颂如:oracle、DB2、MySQL、Sybase、MSSQL Server等。

2、数据仓库:是数据库概念的升级。从逻辑上理解,数据库和数据仓库没有区别,都是通过数据库软件实现存放数据的地方,只不过从数据量来说,数据仓库要比数据库更庞大德多。数据仓库主要用于数据挖掘和数据分析,辅助领导做决策;

区别主要总结为以下几点:

1.数据库只存放在当前值,数据仓库存放历史值;

2.数据库内数据是动态变化的,只要有业务发生,数据就会被更新,而数据仓库则是静态的历史数据,只能定期添加、刷新;

3.数据库中的数据结构比较复杂,有各种结构以适合业务处理系统的需要,而数据仓库中的数据结构则相对简单;

4.数据库中数据访问频率较高,但访问量较少,而数据仓库的访问频率低但访问量却很高;

5.数据库中数据的目标是面向业务处理人员的,为业务处理人员提供信息处理的支持,而数据仓库则是面向高层管理人员的,为其提供决策支持;

6.数据库在访问数据时要求响应速度快,其响应时间一般在几秒内,而数据仓库的响应时间则可长达数几小时

数据仓库与数据挖掘的关系,区别与联系(概括一点)

区别:

1、目的不同:

数据仓库是为了支持复杂的分析和决策,数据挖掘是为了在海量的数据里面发掘出预测陵孝慎性的、分析性的信息,多用来预测。

2、阶段不同:

数据仓库是数据挖掘的先期步骤,通过数据仓库的构建,提高了数据挖掘的效率和能力,保证了数据挖掘中的数据的宽广性和完整性。

3、处理方式不同:

数据挖掘是基于数据仓库和多维数据库中的数据,找到数据的潜在模式进行预测,它可以对数据进行复杂处理。大多数情况下,数据挖掘是让数据从数据仓库到数据挖掘数据库中。

联系:

1、数据仓库是为了数据挖掘做预准备,数据挖掘可建立在数据仓库之上。

2、最终目的都为了提升企业的信息化竞争能力。

扩展资料:

数据仓库与数据挖掘的发展历程:

关系数据库是20世纪70年代初提出来,经过数据库专家几十年的努力,理论和实践都取得了显著成果,标志着数据库技术的日益成熟。

但它仍然难以实现对关系数据库中数据的分析,不能很好地支持决策,因此在80年代,产生了数据仓库的思想,90年代,数据仓库的基本原理、架构形式和使用原则都已确定。

主要技术包括对数据库中数据访问、网络、C / S结构和图形界面,一些大公司已经开始构建数据仓库。针对数据仓库中迅速增长的海量数据的收集、存放,用人力已经不能解决,那么数据仓库中有用的知识的提取就需要数据挖掘来实现。

数据挖掘与统计学子领域“试探性数据分析”及人工智能子领域“知识发现”和机器学有关慎察,是一门综合性的技术学科。

参考资料:

百度百科-数据挖掘

百度百尺敬科-数据仓库

[img]

数据仓库与数据挖掘技术—特点及元数据

数据仓库具有以下特点

数据仓库中的数据是面向主题组织的

在较高层次上对分析对象的数据做一个完整的、一致的描述,能有效地刻画出分析对象所涉及的各项数据及数据间的联系。主题通常在一个较高层次上将数据归类的标准,每个主题对应一个宏观分析领域。数据仓库中应重新组织数据,完成业务数据向主题数据的转换。主题的孙枝帆抽取则应根据分析的要求进行确定,根据所需要的信息,分不同类别、不同角度等主题把数据整理之后存储起来

数据仓库的数据是集成的

事务处理系统中的操作型数据在进入数据仓库之前,必须经过统一和综合,演变为分析性数据。需要完成的工作包括:处理字段的同名异义,异义同名,单位不统一,长度不一致等问题,然后对源数据进行综合和计算,生成面向主题分析的高层、综合的数据

数据仓库的数据是稳定的

数据仓库中存放的是供分则雹析决策用的历史数据,而不是联机事务处理的当前数据。涉及的数据操作主要是数据查询,一般不进行数据的增删改操作

数据仓库的数据是随时间不断变化的

数据仓库系统需要不断获取联机事务处理系统不同时刻的数据,经集成后追加到数据仓库中

数据仓库中的数据分为四个级别、早期细节级,当前细节级,轻度综合级,高度综合级

首先进入当前细节级,并根据具体需要进一步的综合,从而进入轻度综合级,乃至高度综合级。老化的数据进入早期细节级,数据仓库中存在着不同的综合级别,一般称之为粒度。粒度越大,表示细节程度越低,综合程度越高

元数据是“关于数据的数据”,是新一轮迭代开发和数据搭念仓库维护的主要技术手册。如同数据仓库的导航器,快速高效的定位信息,实现数据检索和挖掘

1、技术元数据

存储关于数据仓库系统技术细节的数据,是用于开发和管理数据仓库使用的数据。它主要包括数据仓库结构的描述、业务系统、数据仓库和数据集市的体系结构及模式以及汇总用的算法和操作环境到数据仓库环境的映射

2、业务元数据

业务元数据从业务角度表述了数据仓库中的数据

数据仓库的建立过程一般有两种方法,“自顶而下”和“自底而上”。

自顶而下:先建立一个企业级数据仓库,然后再在其基础上建立部门级数据集市。

自底向上:优先建立一些数据集市,最后再把它们汇集成一个企业级数据仓库。

关于数据仓库与数据挖掘和数据仓库与数据挖掘第五章课后答案的介绍到此就结束了,不知道你从中找到你需要的信息了吗 ?如果你还想了解更多这方面的信息,记得收藏关注本站。

标签列表