登入帳戶  | 訂單查詢  | 購物車/收銀台(0) | 在線留言板  | 付款方式  | 聯絡我們  | 運費計算  | 幫助中心 |  加入書簽
會員登入   新用戶註冊
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2023年度TOP分類閱讀雜誌 香港/國際用戶
最新/最熱/最齊全的簡體書網 品種:超過100萬種書,正品正价,放心網購,悭钱省心 送貨:速遞 / 物流,時效:出貨後2-4日

2024年10月出版新書

2024年09月出版新書

2024年08月出版新書

2024年07月出版新書

2024年06月出版新書

2024年05月出版新書

2024年04月出版新書

2024年03月出版新書

2024年02月出版新書

2024年01月出版新書

2023年12月出版新書

2023年11月出版新書

2023年10月出版新書

2023年09月出版新書

『簡體書』数据架构:数据科学家的第一本书(原书第2版)

書城自編碼: 3638714
分類: 簡體書→大陸圖書→計算機/網絡程序設計
作者: [美]W. H. 因蒙[W. H. Inmon],[美]丹尼
國際書號(ISBN): 9787111679608
出版社: 机械工业出版社
出版日期: 2021-05-01

頁數/字數: /
書度/開本: 16开 釘裝: 平装

售價:NT$ 516

我要買

share:

** 我創建的書架 **
未登入.



新書推薦:
古典的回響:溪客舊廬藏明清文人繪畫
《 古典的回響:溪客舊廬藏明清文人繪畫 》

售價:NT$ 1990.0
掌故家的心事
《 掌故家的心事 》

售價:NT$ 390.0
孤独传:一种现代情感的历史
《 孤独传:一种现代情感的历史 》

售價:NT$ 390.0
家、金钱和孩子
《 家、金钱和孩子 》

售價:NT$ 295.0
量价关系——透视股票涨跌脉络
《 量价关系——透视股票涨跌脉络 》

售價:NT$ 340.0
二十四节气生活美学
《 二十四节气生活美学 》

售價:NT$ 340.0
西班牙内战:秩序崩溃与激荡的世界格局:1936-1939
《 西班牙内战:秩序崩溃与激荡的世界格局:1936-1939 》

售價:NT$ 990.0
基于鲲鹏的分布式图分析算法实战
《 基于鲲鹏的分布式图分析算法实战 》

售價:NT$ 495.0

建議一齊購買:

+

NT$ 690
《 混沌工程:复杂系统韧性实现之道 》
+

NT$ 974
《 数字孪生理论实战全覆盖(套装共2册) 》
+

NT$ 474
《 复杂装备系统数字孪生:赋能基于模型的正向研发和协同创新 》
+

NT$ 346
《 云计算架构设计模式 》
+

NT$ 753
《 WebAssembly实战 》
+

NT$ 690
《 持久内存编程 》
內容簡介:
本书由“数据仓库之父”Inmon和“Data Vault之父”Linstedt领衔撰写,带领读者从宏观视角了解数据架构的基本概念和原则,是数据科学家、分析师和管理者在入门阶段的必备参考读物。本书创新性地提出终端状态架构的概念,新增了关于可视化和大数据的章节,以及文本管理和分析等来自不同行业的实例。通过阅读本书,读者将通晓数据收集、治理、提取、分析等不同阶段的核心技术,进而学会将大数据技术融入现有的信息基础设施或数据仓库系统。
目錄
献词译者序第1章 数据架构与数据类型11.1 数据架构简介11.1.1 细分数据11.1.2 重复性和非重复性非结构化数据21.1.3 数据的“分水岭”21.1.4 文本数据和非文本数据31.1.5 各种形式的数据31.1.6 商业价值41.2 数据基础设施41.2.1 重复性数据的两种类型41.2.2 重复性结构化数据51.2.3 重复性大数据61.2.4 两种基础设施61.2.5 基础设施的优化71.2.6 比较两种基础设施81.3 分水岭81.3.1 企业数据的分类81.3.2 什么是分水岭91.3.3 重复性非结构化数据91.3.4 非重复性非结构化数据101.3.5 不同的环境121.4 企业数据统计图131.5 企业数据分析161.6 数据的生命周期:理解时间线上的数据191.7 数据简史231.7.1 纸带和打孔卡231.7.2 磁带231.7.3 磁盘存储器241.7.4 数据库管理系统241.7.5 耦合处理器241.7.6 在线事务处理241.7.7 数据仓库251.7.8 并行数据管理251.7.9 数据保险箱251.7.10 大数据251.7.11 分水岭26第2章 终端状态架构——“世界地图”272.1 架构组件272.2 终端状态架构中不同类型的数据282.3 通过模型塑造数据292.4 数据仓库在哪里302.5 不同类型的问题在终端状态架构中得到不同的回答312.6 数据湖中的数据312.7 终端状态架构中的元数据322.8 网络化元数据322.9 演变的经验332.10 数据湖架构34第3章 终端状态架构中的转换353.1 冗余数据353.2 转换353.3 定制数据363.4 转换文本373.5 转换应用数据373.6 将数据转换为定制状态383.7 将数据转换为批量存储383.8 自动生成数据的转换393.9 转换批量数据393.10 转换和冗余40第4章 大数据414.1 大数据简史414.1.1 类比—占领制高点414.1.2 占领制高点424.1.3 IBM 360的标准化424.1.4 在线事务处理424.1.5 Teradata和MPP处理434.1.6 Hadoop和大数据434.1.7 IBM和Hadoop434.1.8 坚守制高点434.2 何谓大数据434.2.1 另一种定义444.2.2 大体量444.2.3 廉价存储444.2.4 罗马人口普查方法444.2.5 非结构化数据454.2.6 大数据中的数据464.2.7 重复性数据的语境464.2.8 非重复性数据474.2.9 非重复性数据的语境474.3 并行处理494.4 非结构化数据534.4.1 无处不在的文本信息534.4.2 基于结构化数据的决策534.4.3 商业价值建议544.4.4 重复性和非重复性非结构化信息544.4.5 易于分析554.4.6 语境化564.4.7 一些语境化方法564.4.8 Map Reduce574.4.9 手工分析584.5 将重复性非结构化数据语境化584.5.1 解析重复性非结构化数据594.5.2 重铸输出数据594.6 文本消歧594.6.1 从叙述性数据库到分析性数据库604.6.2 文本消歧的输入604.6.3 映射614.6.4 输入/输出614.6.5 文档分解和命名值处理624.6.6 文档预处理634.6.7 电子邮件634.6.8 电子表格644.6.9 报告反编译器644.7 分类法654.7.1 数据模型和分类法664.7.2 分类法的适用性674.7.3 什么是分类法674.7.4 多种语言的分类法684.7.5 商业分类法还是私人分类法684.7.6 分类法和文本消歧的动态过程684.7.7 分类法和文本消歧的分离技术684.7.8 分类法的不同类型694.7.9 分类法—随着时间的推移进行维护70第5章 孤岛式应用环境715.1 孤岛式应用的挑战715.2 构建孤岛式应用735.3 孤岛式应用是什么样的745.4 当前值数据745.5 限度的历史数据755.6 高可用性765.7 孤岛式应用之间的重叠765.8 冻结业务需求775.9 拆除孤岛式应用77第6章 数据保险箱786.1 数据保险箱2.0简介786.1.1 数据保险箱的起源和背景786.1.2 什么是数据保险箱2.0建模806.1.3 如何定义数据保险箱2.0方法论816.1.4 为什么需要数据保险箱2.0架构816.1.5 数据保险箱2.0的实施范围816.1.6 数据保险箱2.0的商业利益816.1.7 数据保险箱1.0简介826.2 数据保险箱建模简介836.2.1 数据保险箱模型的概念836.2.2 数据保险箱模型的定义836.2.3 数据保险箱模型的组成部分836.2.4 业务键为何如此重要846.2.5 数据保险箱和数据仓库的关系856.2.6 如何转换到数据保险箱建模856.2.7 为什么要对暂存区的数据进行限制866.2.8 数据保险箱模型的基本规则866.2.9 为什么需要很多链接结构876.2.10 数据保险箱2.0的主键选项876.3 数据保险箱架构简介93
內容試閱
献  词我要将本书献给下面的医生和医院,是他们救了我的命。如果没有这些医生和医院,没有他们的精细护理,这本书永远不会写成。他们是:科罗拉多州丹佛市玫瑰医院科罗拉多州丹佛市国立犹太医院玫瑰医院Christopher Stees医生玫瑰医院Peder Horner医生玫瑰医院Michael Firstenberg医生玫瑰医院Ryan Tobin国立犹太医院Susan Kotake医生国立犹太医院Ellen Volker医生以及所有的护士和其他工作人员,由于人数太多,原谅我无法一一列举出来。谢谢,谢谢,谢谢!WHI2019年2月译 者 序“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。”确实,数据已成为21世纪的“石油”,成为世界上关键的战略性基础资源。大数据的概念从2012年起进入大众视野,近几年来受到了越来越多的关注。特别是2020年全世界爆发新冠疫情以来,大数据科学家应用大数据技术对不同地区的人群感染新冠病毒的数量进行预测,帮助相关部门对疫情进行防控,让人们进一步意识到开展大数据研究的重要意义。本书为数据科学家未来从事大数据研究提供了全新的视角。大数据是人工智能的重要基础,人工智能反过来也拓宽了对大数据的数据量和数据种类的需求。为了获得更高的智能,需要对已有的数据采集、数据清洗、数据过滤和数据分析等相关算法及理论进行优化,或者开发设计出新的算法,探索新的理论。大数据与人工智能之间的关系是相互依赖和相互促进,同时,人工智能对数据架构的理论提出了更高的要求。本书从数据架构的角度描述数据,从不同数据背景的角度介绍数据,并利用不同行业的大量实例和案例研究,为数据科学家提供必要的知识。结合这些行业的实例,数据科学家将从整体的角度对数据有更全面、更清楚的认识。本书提出了终端状态架构的概念,帮助读者更宏观地把握数据收集、治理、提取、分析等不同阶段使用的不同技术。本书还对数据的商业价值、数据管理和数据可视化等进行了综合介绍,帮助数据科学家更全面地认识数据处理,为大数据未来的技术和理论发展提供新的思路。数据科学是一个正在蓬勃发展的领域,也是一种正在改变世界和影响日常生活的技术。虽然我们开展了很多相关领域的研究和探索,但在翻译的过程中依然感到本书涉及面广,涵盖内容多。为此,我们力求准确反映原书所表达的思想、概念和技术原理,希望能对相关的研究人员、技术人员和学生有所帮助。但受限于译者的学术和技术水平,翻译中难免有错漏或瑕疵,恳请读者及同行批评指正,我们将不胜感激。后,感谢家人和朋友的支持与帮助。同时,要感谢在本书翻译过程中做出贡献的人,特别是北京邮电大学张瑞涛、赵孟宇、傅广涛、丁哲伦、黄淮、靳梦凡和张涵等。还要感谢机械工业出版社的各位编辑,以及北京邮电大学计算机学院的大力支持。北京邮电大学智能通信软件与多媒体北京市重点实验室计算智能与可视化实验室黄智濒 陶袁2021年2月

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 台灣用户 | 香港/海外用户
megBook.com.tw
Copyright (C) 2013 - 2024 (香港)大書城有限公司 All Rights Reserved.