掌握用于构建分析型应用敏捷和灵活的设计方式:统一星型模型(USSUnified Star Schema)。与传统的维度模型相比,统一星型模型有很多优势。在这本书里你可以看到统一星型模型作为单一星型模型的强大功能,对于你的公司来说,不论是现在的业务还是将来的业务,都可以作为你的业务基础模型来使用。数据仓库传奇人物Bill Inmon(比尔?因蒙)和数据仓库专家Francesco Puppini(弗朗切斯科?普皮尼)逐步解释了为什么统一星型模型方法是当今商业智能设计的方法,并通过许多示例来验证这一点。本书分为两部分。部分,体系结构。介绍了数据集市和数据仓库的优点,包括组织如何发展到当前的分析状态,以及当前商业智能体系结构所面临的挑战。部分共分为8章:第1章数据集市与维度模型:了解数据仓库和数据集市背后的驱动力以及特征。第2章维度建模概念:掌握维度模型的概念,包括事实表、维表、星型模型和雪花模型。第3章数据集市演变:了解多个数据集市的优势,以及由于数据集市管理不当而引起的数据质量、版本控制和可信度问题。第4章转换:了解数据提取、转换和加载(ETL)的过程,以及提取、转换和加载(ETL)为报告带来的价值。第5章集成数据集市的方法:了解数据仓库如何为您的公司报表工作带来收益。第6章监控数据集市环境:了解监控数据集市的动机。确定需要修改的数据,区分活跃数据和非活跃数据,以及如何清除休眠数据。第7章数据集市环境中的元数据和文档:了解数据仓库环境中元数据的不同类型,包括简单表和元素的元数据、数据来源元数据、加载日期型元数据、组合型元数据和使用型元数据。第8章向集成型数据集市演变:了解当前数据仓库环境的演变取得的进展。第二部分,统一星型模型的应用。涵盖了统一星型模型方法以及它如何解决部分中讨论的挑战。第二部分包含8章:前言第9章统一星型模型简介:熟悉统一星型模型。了解其架构和用例,以及统一星型模型方法与传统构建模型方法的差异。统一星型模型的关键概念举例,如猎人和猎物以及与电话线相连的房屋。了解去范式化的危险。第10章数据丢失:了解数据丢失的原因,以及为什么不建议在数据集市中进行完全外连接(full outer join)的原因。根据定义,所有其他连接(内连接、左连接和右连接)均会丢弃某些数据。因此,使用这些连接构建的数据集市也只能解决一部分的问题。然而,统一星型模型方法不会创建任何连接,因此,它不会丢失任何数据。join被引入统一星型模型命名约定中,可使开发人员和终用户的日常工作更加轻松。另外,需要了解Bridge表,并了解其如何连接到其他表。跟随Spotfire的实际效果,它能让终用户在没有数据专家的情况下也很容易创建仪表盘所需要的展示内容。第11章扇形陷阱:了解面向数据模型的规范,并通过示例学习扇形陷阱的危险。了解一对多关系的另一种表示法。区分连接和关联,并能意识到内存关联是扇形陷阱的解决方案。另外,应了解“拆分度量(Splitting the Measures)”和“将所有度量移至Bridge表(moving all the measures to the Bridge)”的技术。后了解习惯于使用JSON的相关人员遇到的陷阱及其修复方法的示例。第12章Chasm陷阱:回顾笛卡儿乘积,会看到一个基于LinkedIn的Chasm陷阱示例,该示例说明Chasm陷阱会产生不需要的重复项。了解Chasm陷阱如何呈线性增长以及呈平方增长。了解Chasm陷阱行计数的方法,该方法有助于计算所得表的准确行数。Bridge表基于一个联合体(Union),它不会创建任何重复项。后,请参阅JSON Chasm陷阱的示例及其修复方法。第13章多事实查询:区分直接连接的多个事实与无直接连接的多个事实。了解尽管具有多对多关系的操作是联合(Union),但该联合很难创建并且会造成混乱。探索BI工具如何能够构建聚合的虚拟行(Rows),以及统一星型模型方法在Bridge表的基础上如何自然地嵌入联合(Union)中。跟随Spotfire中的实现,了解终用户可以多么容易地构建有价值的仪表盘(Dashboard)。第14章循环:了解有关循环和解决循环的5种传统技术的更多信息。统一星型模型方法是一种很好的循环解决方案。在SAP Business Objects实践中,说明使用统一星型模型方法,终用户可以拥有真正的“自助服务体验”。第15章非一致粒度:通过示例了解非一致粒度。当维度不符合要求时,创建BI解决方案会带来许多挑战,这些挑战传统上是通过创建临时查询或通过构建没有集成的仪表盘来解决的。了解统一星型模型引入了一种称为“重新范式化”的解决方案。它的优势在于,只在统一星型模型的设置阶段需要开发人员,同时统一星型模型不依赖于业务需求,因此终用户可以自由地生成其个性化的报告和仪表盘(Dashboard)。第16章Northwind案例学习:见证使用ODM检测Northwind缺陷有多么简单。验证涉及产生扇形陷阱和Chasm陷阱的表,它们的连接存在产生不正确总数的风险。