|
內容簡介: |
本书覆盖了数据仓储构建的所有主要领域,包括数据仓储的定义和环境;数据仓储的4个类型、对数据仓储的5类共15个要求;2个方法论的总结及3个构建方法。本书给出了一个高性能的参照系统结构。基于此参照系统结构,本书系统地讨论了大量设计议题、并包括21个设计建议、8个实践建议、7个设计原则、27个通用算法和技术、12个元数据驱动的通用操作符、7个工作过程、4个范式基础及范式原则。
|
目錄:
|
第1章绪论
1.1数据仓储与数据
1.2数据仓储的上下文
1.3数据仓储的分类
1.3.1拓扑结构/后台分类
1.3.2组织机构/前端分类
1.3.3 时间性/更新分类
1.3.4地理特性/位置分类
1.4数据仓储需满足的要求
1.4.1功能性要求
1.4.2信息性要求
1.4.3操作性要求
1.4.4经济性要求
1.4.5安全性要求
1.5数据仓储方法论
1.5.1教条的开发方法:自上而下
1.5.2 实用的开发方法:自下而上
1.5.3有效的方法:居顶不下
1.6数据仓储构建的方法
1.6.1 老方法:手工ELT法
1.6.2新方法:工具辅助的ETL法
1.6.3现代方法:工具辅助的ELT法
1.6.4 未来的方法:基于MG0的ELT法
1.7构建本书同时构建一数据仓储
第一篇设计问题、概念和体系结构
第2章体系结构概要
第3章预备域
3.1源应用系统
3.1.1 分析
3.1.2接口
3.2预备域
3.2.1平面文件区
3.2.2原始表区
3.2.3已预备表区
3.2.4平面文件加载
3.2.5错误拒绝
3.2.6变化量识别
3.2.7列清洗和域完整性的保证
3.2.8行过滤
3.2.9操作识别
3.2.10最小设计原则
第4章处理域
4.1数据
4.1.1代码数据
4.1.2对象数据
4.1.3事件数据
4.2 H寸I;-I性
4.2.1历史化
4.2.2 归档
4.2.3 三时维
4.3数据完整性
……
第二篇组件、算法与技术
第三入篇构建范式及元数据驱动通用操作器
第四篇生存环境及更多
|
|