登入帳戶  | 訂單查詢  | 購物車/收銀台( 0 ) | 在線留言板  | 付款方式  | 聯絡我們  | 運費計算  | 幫助中心 |  加入書簽
會員登入 新註冊 | 新用戶登記
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2023年度TOP分類閱讀雜誌 香港/國際用戶
最新/最熱/最齊全的簡體書網 品種:超過100萬種書,正品正价,放心網購,悭钱省心 送貨:速遞 / EMS,時效:出貨後2-3日

2024年08月出版新書

2024年07月出版新書

2024年06月出版新書

2024年05月出版新書

2024年04月出版新書

2024年03月出版新書

2024年02月出版新書

2024年01月出版新書

2023年12月出版新書

2023年11月出版新書

2023年10月出版新書

2023年09月出版新書

2023年08月出版新書

2023年07月出版新書

『簡體書』数据综合治理实践指导手册

書城自編碼: 3720502
分類: 簡體書→大陸圖書→工業技術一般工业技术
作者: 陈刚
國際書號(ISBN): 9787512146471
出版社: 北京交通大学出版社
出版日期: 2022-01-01

頁數/字數: /
書度/開本: 16开 釘裝: 平装

售價:NT$ 261

我要買

share:

** 我創建的書架 **
未登入.



新書推薦:
官商跃迁:中国古代政商关系简史
《 官商跃迁:中国古代政商关系简史 》

售價:NT$ 458.0
当代学术·乡族与国家:多元视野中的闽台传统社会(修订本)
《 当代学术·乡族与国家:多元视野中的闽台传统社会(修订本) 》

售價:NT$ 458.0
了不起的中国冠军:讲给孩子的奥运故事
《 了不起的中国冠军:讲给孩子的奥运故事 》

售價:NT$ 354.0
海外中国研究·北京的六分仪:中国历史中的全球潮流
《 海外中国研究·北京的六分仪:中国历史中的全球潮流 》

售價:NT$ 354.0
霍比特人(插图典藏版,150余幅精美全彩插图,原作地图首度汉化为简体中文,2024年全新译本)
《 霍比特人(插图典藏版,150余幅精美全彩插图,原作地图首度汉化为简体中文,2024年全新译本) 》

售價:NT$ 562.0
权力的文化与文化的权力:旧制度下的欧洲(1660—1789)
《 权力的文化与文化的权力:旧制度下的欧洲(1660—1789) 》

售價:NT$ 718.0
穿透估值:读懂估值中的共识与博弈
《 穿透估值:读懂估值中的共识与博弈 》

售價:NT$ 411.0
人设、流量与成交
《 人设、流量与成交 》

售價:NT$ 311.0

建議一齊購買:

+

NT$ 534
《 深入理解微电子电路设计——电子元器件原理及应用(原书第5版) 》
+

NT$ 510
《 汽车发动机故障诊断手册 》
+

NT$ 588
《 工业互联网:技术、实践与行业解决方案 》
+

NT$ 468
《 EPLAN电气设计从入门到精通 》
+

NT$ 458
《 KUKA工业机器人操作与运维 》
+

NT$ 209
《 浅埋煤层风氧化富水区域巷道失稳机理与控制 》
內容簡介:
本书简要阐述了数据治理的基本概念及相关理论,侧重于数据质量管理和数据集成两方面,介绍相关基本理论的同时,详细描述了自主研发的数据质量管理系统和多源数据汇集处理系统。基于这些数据治理软件,结合具体的实际案例,详细描述了数据质量管理与数据集成的典型功能。本书案例内容丰富,步骤翔实具体,有助于读者在理解数据质量管理和数据集成的基本理论的同时,能较全面地掌握数据质量管理与数据集成软件的常用功能及其操作方法。
  本书既可以作为高等院校信息管理与信息系统、信息资源管理、大数据工程以及计算机信息管理等专业本科生的教材或辅助读本,也可以作为企事业单位信息管理工作人员的培训教材。
目錄
第1章 数据治理概述 11.1 数据治理的定义 11.2 数据治理的基本要求 21.3 数据治理模型 31.4 数据治理一般步骤 5第2章 数据质量 82.1 数据质量概述 8 2.1.1 数据质量定义 8 2.1.2 数据质量问题 8 2.1.3 数据质量维度 102.2 数据清洗 10 2.2.1 数据清洗定义 10 2.2.2 数据清洗方法 11 2.2.3 数据清洗流程 21第3章 数据质量管理系统 253.1 数据源管理 25 3.1.1 关系数据库数据源管理 25 3.1.2 文件数据源管理 273.2 数据剖析 27 3.2.1 元数据 27 3.2.2 值预览 28 3.2.3 值分布分析 283.3 数据质量评估 29 3.3.1 指标体系维护 29 3.3.2 评估算法库 31 3.3.3 数据检查算子库 32 3.3.4 数据血缘关系维护 35 3.3.5 数据质量评估流程 37 3.3.6 评估任务库 403.4 数据清洗 40 3.4.1 清洗算子库 40 3.4.2 数据清洗流程 43 3.4.3 清洗任务库 45 3.4.4 清洗案例库 463.5 系统设置 46 3.5.1 用户管理 46 3.5.2 角色管理 47 3.5.3 模块管理 49 3.5.4 修改密码 52第4章 常用数据质量管理系统操作 534.1 规划评估指标 534.2 导入数据源 544.3 建立基础指标体系 564.4 创建数据质量评估任务 584.5 配置指标树 594.6 配置评估算子 594.7 设置指标聚合方式 614.8 执行评估方案 624.9 数据清洗 644.10 算子开发 66 4.10.1 算子开发与部署方法 66 4.10.2 算子开发实例 70第5章 数据集成 745.1 数据集成的概念 745.2 数据集成的方法 75 5.2.1 虚拟视图方法 76 5.2.2 物化方法 77 5.2.3 混合型集成方法 785.3 数据集成开发生命周期 79第6章 多源数据汇集处理系统 806.1 管理部分 80 6.1.1 用户管理 80 6.1.2 管理案例库 826.2 普通人员视图 84 6.2.1 历史库 85 6.2.2 案例模板库 86 6.2.3 数据源创建 87 6.2.4 预设向导模板 896.3 开发者视图 92 6.3.1 新建 92 6.3.2 打开 93 6.3.3 资源库 93 6.3.4 统计 94 6.3.5 模型校验 94 6.3.6 事前校验 96 6.3.7 测试模型 96 6.3.8 逐步测试 96 6.3.9 插入断点 97 6.3.10 插入监控点 98 6.3.11 大数据支持 99 6.3.12 日志和统计升级 99 6.3.13 数据预览 100第7章 常用数据集成功能操作 1017.1 数据集成准备 1017.2 表属性的计算汇总 1037.3 表数据分组统计 1137.4 表间数据关联 1247.5 脚本处理 1337.6 多表数据合并 1427.7 字段合并与数据分流 1517.8 数值范围标识 1627.9 作业处理 1707.10 综合操作(1) 1777.11 综合操作(2) 197参考文献 209
內容試閱
前 言
  
  随着信息量的剧增带来巨大的数据价值,人们已经意识到挖掘数据价值的重要性,但如何实现数据价值的化,始终未得到完美解决。由于各企业和部门之间的相互独立,容易造成信息系统之间的不兼容,数据结构存在较大差异,数据难以共享,形成信息的孤岛效应。为解决在获取数据价值过程中出现的这些典型难题,数据治理技术得到快速发展。数据治理从数据的全生命周期的各个环节做出专业的管理。
  本书重点介绍了数据治理中的两种常用的治理技术——数据质量管理和数据集成,并在自主研发的平台上基于典型的案例实现数据质量的管理和数据的集成。数据质量管理能够确保数据模式和数据实例的一致性、正确性、完整性和小性。数据集成可将分散的若干个数据源中的数据逻辑地或物理地集成到一个统一的数据集合体中,以统一的视图对外提供数据服务。因此,本书分为数据治理概述、数据质量管理、数据集成等三部分。
  第1部分数据治理概述共1章(第1章),介绍了不同机构体系对数据治理概念的理解,并从四个方面提出对数据治理定义的理解。在进行数据治理时,不同的机构体系都遵循一定的基本原则,具体阐述了COBIT5提出的五项原则。针对不同领域或行业,设计的数据治理模型会有所区别,IBM数据治理委员会提出了在业界认可度较高的数据治理模型。该模型从11个数据治理成熟度类别来度量数据治理能力。数据治理的步骤主要阐述了IBM数据治理委员会提出的统一流程。
  第2部分数据质量管理共3章(第2~4章),介绍了数据质量常见的三种定义,具体阐述了数据质量的问题分类以及评价数据治理的标准。数据清洗主要研究如何检测并消除数据中的错误和不一致等质量问题。根据常见的数据治理问题,如数据缺失、数据记录相似或重复、数据异常、数据逻辑错误等,提供了相应的数据清洗方法,同时总结了提高数据清洗效率的典型流程。数据质量管理系统是一款通过对数据质量建立各个指标维度后进行质量评估终实现数据清洗的软件系统,主要分为用于管理不同类型数据源的数据源管理、用于元数据查看预览的数据剖析、用于指标体系建立与维护以及支撑整个评估流程的数据质量评估、用于对完成数据评估的数据进行清洗的数据清洗、用于系统基本功能设置以及用户设置的系统设置等五大功能。基于数据质量管理系统,以教师信息为依托,介绍了常用的数据质量管理的操作流程,以及检查算子的开发方法。
  第3部分数据集成共3章(第 5~7 章),介绍了数据集成的概念,虚拟视图和物化及其混合的集成方法,以及数据集成的开发生命周期。多源数据汇集处理系统是一款基于 Kettle软件改造的专用数据集成软件,其核心功能和运行模式与Kettle基本一致。它能够以普通人员、专业数据人员、开发者等不同身份操作软件的功能。在该软件上,详细介绍了表属性的计算汇总、表数据分组统计、表间数据关联、脚本处理、多表数据合并、字段合并与数据分流、数据范围标识等典型数据集成方法,并阐述了这些典型方法的综合运用。
  本书由陈刚负责全面筹划、设计工作,其中第1、3、4章由陈刚负责编写,第5、6、7章由郝建东负责编写,第2章由张中辉负责编写,胡琨和于坤参与了部分章节的编写,郝建东负责统稿、校验、修订等工作。
  本书既可以作为高等院校信息管理与信息系统、信息资源管理、大数据工程以及计算机信息管理等专业本科生的教材或辅助读本,也可以作为企事业单位信息管理工作人员的培训教材,在理解数据治理,特别是数据质量管理和数据集成的相关理论的同时,通过数据质量管理和数据集成的典型软件,掌握数据治理的常用方法,提高实践操作能力。
  由于编者水平有限、编写时间紧迫,加之数据工程理论与技术不断发展,书中难免存有错误和不妥之处,敬请专家和广大读者不吝批评指正。编者将进一步完善和充实本书的内容。
  
  编著者
  2021年5月于南京

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 香港用户  | 台灣用户 | 海外用户
megBook.com.tw
Copyright (C) 2013 - 2024 (香港)大書城有限公司 All Rights Reserved.