登入帳戶  | 訂單查詢  | 購物車/收銀台(0) | 在線留言板  | 付款方式  | 聯絡我們  | 運費計算  | 幫助中心 |  加入書簽
會員登入   新用戶註冊
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2023年度TOP分類閱讀雜誌 香港/國際用戶
最新/最熱/最齊全的簡體書網 品種:超過100萬種書,正品正价,放心網購,悭钱省心 送貨:速遞 / 物流,時效:出貨後2-4日

2024年10月出版新書

2024年09月出版新書

2024年08月出版新書

2024年07月出版新書

2024年06月出版新書

2024年05月出版新書

2024年04月出版新書

2024年03月出版新書

2024年02月出版新書

2024年01月出版新書

2023年12月出版新書

2023年11月出版新書

2023年10月出版新書

2023年09月出版新書

『簡體書』云数据平台:设计、实现与管理

書城自編碼: 3783416
分類: 簡體書→大陸圖書→計算機/網絡程序設計
作者: [加]丹尼尔·兹布里夫斯基[Danil Zburivsky]
國際書號(ISBN): 9787111712046
出版社: 机械工业出版社
出版日期: 2022-08-01

頁數/字數: /
書度/開本: 16开 釘裝: 平装

售價:NT$ 709

我要買

share:

** 我創建的書架 **
未登入.



新書推薦:
东野圭吾:分身(东野圭吾无法再现的双女主之作 奇绝瑰丽、残忍又温情)
《 东野圭吾:分身(东野圭吾无法再现的双女主之作 奇绝瑰丽、残忍又温情) 》

售價:NT$ 295.0
浪潮将至
《 浪潮将至 》

售價:NT$ 395.0
在虚无时代:与马克斯·韦伯共同思考
《 在虚无时代:与马克斯·韦伯共同思考 》

售價:NT$ 260.0
日内交易与波段交易的资金风险管理
《 日内交易与波段交易的资金风险管理 》

售價:NT$ 390.0
自然信息图:一目了然的万物奇观
《 自然信息图:一目了然的万物奇观 》

售價:NT$ 640.0
经纬度丛书·州县之民:治乱之间的小民命运
《 经纬度丛书·州县之民:治乱之间的小民命运 》

售價:NT$ 440.0
女性史:古代卷(真正意义上的女性大历史)
《 女性史:古代卷(真正意义上的女性大历史) 》

售價:NT$ 560.0
跨代伴侣治疗
《 跨代伴侣治疗 》

售價:NT$ 440.0

建議一齊購買:

+

NT$ 505
《 思维导图学C++趣味编程 》
+

NT$ 713
《 STM32库开发实战指南(第2版):基于STM32F103 》
+

NT$ 301
《 JavaScript前端开发与实例教程(微课视频版) 》
+

NT$ 1011
《 Go Web编程实战派——从入门到精通 》
+

NT$ 894
《 Java核心技术 卷II 高级特性(原书第11版) 》
+

NT$ 505
《 C++新经典:设计模式 》
編輯推薦:
本书介绍如何设计既可伸缩又足够灵活的云数据平台,以应对不可避免的技术变化。你将了解云数据平台设计的核心组件,以及Spark和Kafka流等关键技术。你还将探索如何设置流程来管理基于云的数据、确保数据的安全,并使用高级分析和BI工具对数据进行分析。本书旨在帮助企业通过现代云数据平台使用所有数据的业务集成视图,并利用先进的分析实践来驱动预测和数据服务。本书总结了不同的数据消费者如何使用平台中的数据,并讨论了影响云数据平台项目成功的常见业务问题。
內容簡介:
本书是一本针对设计充分利用云灵活性的现代可伸缩数据平台的实践指南。你将了解云数据平台设计的核心组件,以及Spark和Kafka流等关键技术的作用。你还将探索如何设置流程来管理基于云的数据,确保数据的安全,并使用高级分析和BI工具对数据进行分析。本书旨在帮助企业通过现代云数据平台使用所有数据的业务集成视图,并利用先进的分析实践来驱动预测和迄今无法想象的数据服务。
目錄
前言致谢引言第1章 数据平台介绍11.1 从数据仓库向数据平台转变背后的趋势21.2 数据仓库与数据的多样性、规模和速度31.2.1 多样性31.2.2 规模41.2.3 速度51.2.4 所有的V同时出现51.3 数据湖61.4 云来了71.5 云、数据湖、数据仓库:云数据平台的出现91.6 云数据平台的构建块91.6.1 摄取层101.6.2 存储层101.6.3 处理层111.6.4 服务层131.7 云数据平台如何处理这三个V141.7.1 多样性141.7.2 规模141.7.3 速度151.7.4 另外两个V151.8 常见用例16第2章 为什么是数据平台而不仅仅是数据仓库182.1 云数据平台和云数据仓库的实践192.1.1 近距离观察数据源202.1.2 云数据仓库—纯架构示例212.1.3 云数据平台架构示例222.2 摄取数据242.2.1 将数据直接摄取到Azure Synapse242.2.2 将数据摄取到Azure数据平台252.2.3 管理上游数据源的变化262.3 处理数据282.3.1 处理数据仓库中的数据292.3.2 处理数据平台上的数据312.4 访问数据322.5 云成本方面的考虑342.6 练习答案36第3章 不断壮大并利用三巨头:Amazon、Microsoft Azure和Google373.1 云数据平台分层架构383.1.1 数据摄取层403.1.2 快存储和慢存储433.1.3 处理层453.1.4 技术元数据层473.1.5 服务层和数据消费者483.1.6 编排层和ETL覆盖层523.2 数据平台架构中层的重要性573.3 将云数据平台层映射到特定工具593.3.1 AWS613.3.2 Google Cloud653.3.3 Azure703.4 开源和商业替代方案733.4.1 批量数据摄取743.4.2 流数据摄取和实时分析743.4.3 编排层753.5 练习答案77第4章 将数据导入平台784.1 数据库、文件、API和流794.1.1 关系型数据库804.1.2 文件814.1.3 通过API的SaaS数据814.1.4 流824.2 从关系型数据库中摄取数据834.2.1 使用SQL接口从RDBMS摄取数据834.2.2 全表摄取854.2.3 增量表摄取904.2.4 变更数据捕获944.2.5 CDC供应商概述984.2.6 数据类型转换1004.2.7 从NoSQL数据库摄取数据1024.2.8 为RDBMS或NoSQL摄取管道捕获重要的元数据1044.3 从文件中摄取数据1074.3.1 跟踪已摄取的文件1094.3.2 捕获文件摄取元数据1124.4 从流中摄取数据1134.4.1 批量摄取和流摄取的区别1174.4.2 捕获流管道元数据1184.5 从SaaS应用程序摄取数据1194.5.1 没有标准的API设计方法1214.5.2 没有标准的方法来处理全数据导出和增量数据导出1214.5.3 结果数据通常是高度嵌套的JSON1224.6 将数据摄取到云中需要考虑的网络和安全问题1224.7 练习答案125第5章 组织和处理数据1265.1 在数据平台中作为单独的层进行处理1275.2 数据处理阶段1295.3 组织你的云存储1305.4 通用数据处理步骤1375.4.1 文件格式转换1375.4.2 重复数据清除1425.4.3 数据质量检查1475.5 可配置的管道1495.6 练习答案152第6章 实时数据处理和分析1536.1 实时摄取与实时处理1546.2 实时数据处理用例1566.2.1 零售用例:实时摄取1566.2.2 线上游戏用例:实时摄取和实时处理1586.2.3 实时摄取与实时处理的总结1606.3 什么时候应该使用实时摄取或实时处理1616.4 为实时使用组织数据1636.4.1 对快存储的解剖1636.4.2 快存储是如何扩展的1666.4.3 在实时存储中组织数据1686.5 通用的实时数据转换1736.5.1 实时系统中数据重复的原因1736.5.2 实时系统中的数据重复清除1766.5.3 在实时管道中转换消息格式1816.5.4 实时数据质量检查1826.5.5 将批量数据与实时数据相结合1836.6 用于实时数据处理的云服务1846.6.1 AWS实时处理服务1856.6.2 Google Cloud实时处理服务1866.6.3 Azure实时处理服务1886.7 练习答案190第7章 元数据层架构1917.1 元数据是什么1927.1.1 业务元数据1927.1.2 数据平台内部元数据或管道元数据1937.2 利用管道元数据1937.3 元数据模型1977.4 元数据层实现选项2077.4.1 元数据层作为配置文件的集合2077.4.2 元数据数据库2107.4.3 元数据API2127.5 现有的解决方案概述2147.5.1 云元数据服务2147.5.2 开源元数据层实现2167.6 练习答案220第8章 模式管理2218.1 为什么要进行模式管理2228.1.1 传统数据仓库架构中的模式变化2228.1.2 读时模式方法2238.2 模式管理方法2258.2.1 模式即契约2268.2.2 数据平台中的模式管理2288.2.3 监控模式变化2348.3 模式注册表实现2358.3.1 Apache Avro模式2368.3.2 现有的模式注册表实现2378.3.3 模式注册表作为元数据层的一部分2388.4 模式演化场景2408.4.1 模式兼容性规则2428.4.2 模式演化和数据转换管道2448.5 模式演化和数据仓库2478.6 练习答案252第9章 数据访问和安全2539.1 不同类型的数据消费者2549.2 云数据仓库2559.2.1 AWS Redshift2569.2.2 Azure Synapse2599.2.3 Go
內容試閱
本书是我们协作完成的,我们都热爱数据、新技术和解决客户问题。我们在一家从事数据、分析和云IT服务的公司一起工作了5年,在那里合作开发了一个云分析实践。拥有多年Hadoop经验的Danil负责技术开发,而Lynda负责商业运营。我们很早就意识到这两者都是解决现实世界的数据问题所需要的,随着时间的推移,Danil变得更加以业务为导向,而Lynda对云和数据也有了足够的了解,可以为Danil提供帮助,有时甚至可以挑战Danil。Hadoop作为一个大数据平台转变为用于数据和分析的云原生平台,因为我们都相信云和大数据的前景。在老板的支持下,我们组建了一个内部团队,不仅设计并交付了出色的技术解决方案,而且还使用数据和云交付了真正的商业成果。我们为几十个客户提供了这些服务,并且随着时间的推移,我们开发了一套最佳实践和知识体系。正是这种经历,以及我们独特的技术和商业技能的结合,让我们可以承担一个非常复杂的技术主题,并使它为大众所认可。我们首先从博客文章和白皮书开始,当Manning打电话问Danil是否想再写一本书(他的第一本书是关于Hadoop的)时,我们一拍即合。我们都是行业活动的活跃演讲者,因此利用这些机会为本书制定了大纲,并通过读者的反馈来予以完善。我们还加入了真实的客户案例,让本书更生动、更具实际意义。

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 台灣用户 | 香港/海外用户
megBook.com.tw
Copyright (C) 2013 - 2024 (香港)大書城有限公司 All Rights Reserved.