数据仓库(原书第4版)pdf下载pdf下载

数据仓库(原书第4版)百度网盘pdf下载

作者:
简介:本篇主要提供数据仓库(原书第4版)pdf下载
出版社:
出版时间:2019-11
pdf下载价格:0.00¥

免费下载


书籍下载


内容介绍

编辑推荐

  数据仓库为企业和组织提供了收集、存储和分析海量业务数据的必要策略。《数据仓库(原书第4版)》被誉为数据仓库的“圣经”,第4版涵盖了数据仓库新技术,保持了在这一领域的先锋地位,详尽地讲述了数据仓库的基本概念、基本原理,以及建立数据仓库的方法和过程。内容主要包括:决策支持系统的发展、数据仓库环境结构、数据仓库设计、数据仓库粒度划分、数据仓库技术、分布式数据仓库、EIS系统和数据仓库的关系、外部和非结构化数据与数据仓库的关系、数据装载问题、数据仓库与Web、ERP与数据仓库以及数据仓库的复查要目等。《数据仓库(原书第4版)》适合开发人员、管理人员、设计人员、数据管理员、数据库管理员,以及其他在现代数据处理环境中进行系统建造的人员阅读。另外,本书也很适用于学习信息处理技术的学生。

内容简介

  《数据仓库(原书第4版)》详尽地讲述了数据仓库的基本概念、基本原理,以及建立数据仓库的方法和过程。主要内容包括:决策支持系统的发展、数据仓库环境结构、数据仓库设计、数据仓库粒度划分、数据仓库技术、分布式数据仓库、EIS系统和数据仓库的关系、外部和非结构化数据与数据仓库的关系、数据装载问题、数据仓库与Web、ERP与数据仓库以及数据仓库的复查要目。
  《数据仓库(原书第4版)》是数据仓库的创始人撰写的关于数据仓库的著作,这个新版本收录了该领域的经典理论和前沿发展。本书既可以作为相关专业的研究生教材,也是数据仓库的研究、开发和管理人员的必备指南。

作者简介

  王志海博士,特聘教授。1985年毕业于郑州大学计算机科学系,获理学学士学位,1987年毕业于哈尔滨船舶工程学院计算机与信息科学系,获工学硕士学位,1998年毕业于合肥工业大学计算机与信息学院,获博士学位。先后在澳大利亚Monash大学计算机科学与软件工程学院进行博士后研究工作,Deakin大学信息技术学院任研究员,Monash大学计算机科学与软件工程学院任高级研究员。曾任中国计算机学会人工智能与模式识别专业委员会委员,中国人工智能学会机器学习委员会委员,2003年国际软件工程大会数据挖掘技术在软件工程中应用研讨会(:DMSE’2003,uSA)等程序委员会委员,2004~2007年历届亚太数据库知识发现与数据挖掘会议(PAKDD)程序委员会委员,2005年中国分类技术及其应用研讨会程序委员会委员等。在国际学术刊物,国际学术会议和国内学术刊物上发表论文约30多篇。

内页插图

目录

专家指导委员会
译者序
第2版前言
第3版前言
第4版前言

第1章 决策支持系统的发展
1.1 演化
1.1.1 直接存取存储设备的出现
1.1.2 个人计算机/第四代编程语言技术
1.1.3 进入抽取程序
1.1.4 蜘蛛网
1.2.自然演化式体系结构的问题
1.2.1 数据缺乏可信性
1.2.2 生产率问题
1.2.3 从数据到信息
1.2.4 方法的变迁
1.2.5 体系结构化环境
1.2.6 体系结构化环境中的数据集成
1.2.7 用户是谁
1.3 开发生命周期
1.4 硬件利用模式
1.5 为重建工程创造条件
1.6 监控数据仓库环境
1.7 小结

第2章 数据仓库环境
2.1 数据仓库的结构
2.2 面向主题
2.3 第1天到第n天的现象
2.4 粒度
2.4.1 粒度带来的好处
2.4.2 粒度的一个例子
2.4.3 双重粒度
2.5 探查与数据挖掘
2.6 活样本数据库
2.7 分区设计方法
2.8 数据仓库中的数据组织
2.9 审计与数据仓库
2.10 数据的同构/异构
2.11 数据仓库中的数据清理
2.12 报表与体系结构化环境
2.13 各种环境中的操作型窗口
2.14 数据仓库中的错误数据
2.15 小结

第3章 设计数据仓库
3.1 从操作型数据开始
3.2 数据/过程模型与体系结构化环境
3.3 数据仓库与数据模型
3.3.1 数据仓库的数据模型
3.3.2 中间层数据模型
3.3.3 物理数据模型
3.4 数据模型与迭代式开发
3.5 规范化/反向规范化
3.6 元数据
3.7 数据周期——时间间隔
3.8 转换和集成的复杂性
3.9 数据仓库记录的触发
3.9.1 事件
3.9.2 快照的构成
3.9.3 一些例子
3.10 概要记录
3.11 管理大量数据
3.12 创建多个概要记录
3.13 从数据仓库环境到操作型环境
3.14 数据仓库数据的直接操作型访问
3.15 数据仓库数据的间接访问
3.15.1 航空公司的佣金计算系统
3.15.2 零售个性化系统
3.15.3 信用审核
3.16 数据仓库数据的间接使用
3.17 星形连接
3.18 支持操作型数据存储
3.19 需求和Zachman框架
3.20 小结

第4章 数据仓库中的粒度
4.1 粗略估算
4.2 规划过程的输入
4.3 溢出存储器中的数据
4.4 确定粒度级别
4.5 一些反馈循环技巧
4.6 确定粒度级别的几个例子
4.6.1 银行环境中的粒度级别
4.6.2 制造业环境中的粒度级别
4.6.3 保险业环境中的粒度级别
4.7 填充数据集市
4.8 小结

第5章 数据仓库和技术
5.1 管理大量数据
5.2 管理多种介质
5.3 索引和监控数据
5.4 多种技术的接口
5.5 程序员/设计者对数据存放位置的控制
5.6 数据的并行存储和管理
5.7 语言接口
5.8 数据的有效装载
5.9 有效利用索引
5.10 数据压缩
5.11 复合主键
5.12 变长数据
5.13 加锁管理
5.14 只涉及索引的处理
5.15 快速恢复
5.16 其他的技术特征
5.17 DBMS类型和数据仓库
5.18 改变DBMS技术
5.19 多维DBMS和数据仓库
5.20 在多种存储介质上构建数据仓库
5.21 数据仓库环境中元数据的角色
5.22 上下文和内容
5.22.1 上下文信息的三种类型
5.22.2 捕获和管理上下文信息
5.22.3 回顾上下文信息管理历史
5.23 刷新数据仓库
5.24 测试问题
5.25 小结

第6章 分布式数据仓库
6.1 分布式数据仓库的类型
6.1.1 局部数据仓库和全局数据仓库
6.1.2 技术分布式数据仓库
6.1.3 独立开发的分布式数据仓库
6.2 开发项目的本质特征
6.3 分布式数据仓库的开发
6.3.1 在分布的地理位置间协调开发
6.3.2 企业数据的分布式模型
6.3.3 分布式数据仓库中的元数据
6.4 在多种层次上构建数据仓库
6.5 多个小组建立当前细节级
6.5.1 不同层的不同需求
6.5.2 其他类型的细节数据
6.5.3 元数据
6.6 公共细节数据采用多种平台
6.7 小结

第7章 主管信息系统和数据仓库
7.1 EIS概述
7.2 一个简单例子
7.3 向下钻取分析
7.4 支持向下钻取处理
7.5 作为EIS基础的数据仓库
7.6 到哪里取数据
7.7 事件映射
7.8 细节数据和EIS
7.9 在EIS扣只保存汇总数据
7.10 小结

第8章 外部数据与数据仓库
8.1 数据仓库中的外部数据
8.2 元数据和外部数据
8.3 存储外部数据
8.4 外部数据的不同部件
8.5 建模与外部数据
8.6 辅助报告
8.7 外部数据存档
8.8 内部数据与外部数据的比较
8.9 小结

第9章 迁移到体系结构化环境
9.1 一种迁移方案
9.2 反馈循环
9.3 策略方面的考虑
9.4 方法和迁移
9.5 数据驱动的开发方法
9.5.1 概念
9.5.2 系统开发生命周期
9.5.3 智者观点
9.6 小结

第10章 数据仓库和Web
10.1 支持电子商务环境
10.2 将数据从Web移动到数据仓库
10.3 将数据从数据仓库移动到Web
10.4 对Web的支持
10.5 小结

第11章 非结构化数据和数据仓库
11.1 两个领域的集成
11.1.1 文本——公共联接
11.1.2 基本错误匹配
11.1.3 环境间文本匹配
11.1.4 概率匹配
11.1.5 匹配所有信息
11.2 主题匹配
11.2.1 产业特征主题
11.2.2 自然事件主题
11.2.3 通过主题和主题词关联
11.2.4 通过抽象和元数据关联
11.3 两层数据仓库
11.3.1 非结构化数据仓库分类
11.3.2 非结构化数据仓库中的文档
11.3.3 非结构化数据可视化
11.4 自组织图(SOM)
11.4.1 非结构化数据仓库
11.4.2 数据量和非结构化数据仓库
11.5 适用于两个环境
11.6 小结

第12章 大型数据仓库
12.1 快速增长的原因
12.2 庞大数据量的影响
12.2.1 基本数据管理活动
12.2.2 存储费用
12.2.3 实际存储费用
12.2.4 大型数据量中的数据使用模式
12.2.5 一个简单计算
12.2.6 两类数据
12.2.7 数据分类涉及的问题
12.3 数据在不同介质的存储
12.3.1 近线存储
12.3.2 访问速度和磁盘存储
12.3.3 存档存储
12.3.4 透明的意义
12.4 环境间数据转移
12.4.1 CMSM方法
12.4.2 数据仓库使用监控器
12.4.3 不同存储介质下数据仓库的扩展
12.5 数据仓库转换
12.6 总费用
12.7 最大容量
12.8 小结

第13章 关系模型和多维模型数据库设计基础
13.1 关系模型
13.2 多维模型
13.3 雪花结构
13.4 两种模型的区别
13.4.1 区别的起源
13.4.2 重建关系型数据
13.4.3 数据的直接访问和间接访问
13.4.4 支持将来未知的需求
13.4.5 支持适度变化的需求
13.5 独立数据集市
13.6 建立独立数据集市
13.7 小结

第14章 数据仓库高级话题
14.1 最终用户的需求和数据仓库
14.1.1 数据仓库和数据模型
14.1.2 关系型的基础
14.1.3 数据仓库和统计处理
14.2 数据仓库内的资源竞争
14.2.1 探查型数据仓库
14.2.2 数据挖掘型数据仓库
14.2.3 冻结探查型数据仓库
14.2.4 外部数据和探查型数据仓库
14.3 同一个处理器处理数据集市和数据仓库
14.4 数据的生命周期
14.5 测试和数据仓库
14.6 追踪数据仓库中的数据流
14.6.1 数据仓库中的数据速率
14.6.2 “推”和“拉”数据
14.7 数据仓库和基于网络的电子商务环境
14.7.1 两种环境之间的界面
14.7.2 粒度管理器
14.7.3 概要记录
14.7.4 ODS,概要记录以及性能
14.8 财务数据仓库
14.9 记录系统
14.10 结构体系的概要历史——演化为公司信息工厂
14.10.1 CIF的进化
14.10.2 障碍
14.11 CIF的未来
14.11.1 分析
14.11.2 ERP/SAP
14.11.3 非结构化数据
14.11.4 数据量
14.12 小结

第15章 数据仓库的成本论证和投资回报
15.1 应对竞争
15.2 宏观上的成本论证
15.3 微观上的成本论证
15.4 来自遗留环境的信息
15.4.1 新信息的成本
15.4.2 用数据仓库收集信息
15.4.3 成本比较
15.4.4 建立数据仓库
15.4.5 完整的情况图
15.4.6 得到数据的障碍
15.5 数据的时间价值
15.6 集成的信息
15.6.1 历史数据的价值
15.6.2 历史数据和客户关系模型
15.1 小结

第16章 数据仓库和ODS
16.1 互补的结构
16.1.1 ODS中的升级
16.1.2 历史数据与ODS
16.1.3 概要记录
16.2 不同种类的ODS
16.3 数据库设计——一种混合的方式
16.4 按比例画图
16.5 ODS中的事务集成
16.6 对ODS处理日进行分片
16.7 多个ODS
16.8 ODS和网络环境
16.9 ODS的一个例子
16.10 小结

第17章 企业信息依从准则和数据仓库.
17.1 两个基本行为
17.2 财务依从准则
17.2.1 “是什么”
17.2.2 “为什么”
17.3 审计公司的交流信息
17.4 小结

第18章 最终用户社区
18.1 农民
18.2 探险者
18.3 矿工
18.4 旅行者
18.5 整个社区
18.6 不同的数据类型
18.7 成本论证和ROI分析
18.8 小结

第19章 数据仓库设计的复查要目
19.1 何时进行设计复查
19.2 谁负责设计复查
19.3 有哪些议事日程
19.4 结果
19.5 复查管理
19.6 典型的数据仓库设计复查
19.7 小结
术语表
参考文献

前言/序言

  早期的数据库理论认为所有的数据都应该装载在一个公共的数据源中。这个想法不难得出。主文件是先于数据库而出现的,这些主文件存储在顺序介质上,为实现随之而来的各种应用而创建。在主文件之间根本没有数据集成。因此,将数据集成为单一的数据源——数据库的理念得到极大的认同。
  数据仓库的诞生基于以上这些理念。数据仓库对于那些赞同传统数据库理论的人来说是一种智力上的威胁,因为数据仓库本身意味着应该建立不同种类的数据库。然而,建立不同种类的数据库的思想并不被数据库理论学家们所接受。
  现在,数据仓库已经被认为是一种明智的选择。基于许多不同理由,人们相信数据仓库就是所想要的。近期的一项调查显示,公司用于数据仓库和商业智能方面的开销超过了事务处理和在线事务处理(OLTP)方面,这在几年前是不可想象的。
  数据仓库的成熟期已经到来。
  本书第4版的问世恰逢时宜,它掀起了数据仓库的新浪潮。
  除了数据仓库中由来已久的概念外,本书第4版还囊括了数据仓库的基础知识,也包含了许多当今有关信息基础框架的主题。
  本书中较为重要的新主题是:
  ·依从准则(涉及Sarbanes Oxley,HIPAA,Basel II以及其他问题)
  ·近线存储(扩展数据仓库使其无穷大)
  ·多维数据库设计
  ·非结构化数据
  ·最终用户(他们是谁,他们需要什么)
  ·ODS和数据仓库
  除了这些新主题外,本版还体现了更为庞大的围绕数据仓库所建立的体系结构。
  技术伴随着数据仓库的发展而发展。在数据仓库发展的早期阶段,50GB~100GB的数据量被认为是一个庞大的数据仓库。现在,一些数据仓库已经达到千万亿字节的容量范围。其他技术包括多维技术——数据集市和星形连接方面的进展。此外,技术的进步也使得数据可以存储在非磁盘存储介质之上。
  总而言之,技术的进步使今天的科技成果成为可能。没有现代技术的发展,就不会有数据仓库的出现。
  本书可供数据仓库架构和系统设计师参阅。最终用户可能发现这本书的有用之处在于全面了解有关数据仓库的解释。管理者和学生们也将发现本书的有益之处。