登入帳戶  | 訂單查詢  | 購物車/收銀台(0) | 在線留言板  | 付款方式  | 聯絡我們  | 運費計算  | 幫助中心 |  加入書簽
會員登入   新用戶註冊
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2024年度TOP分類閱讀雜誌 香港/國際用戶
最新/最熱/最齊全的簡體書網 品種:超過100萬種書,正品正价,放心網購,悭钱省心 送貨:速遞 / 物流,時效:出貨後2-4日

2025年01月出版新書

2024年12月出版新書

2024年11月出版新書

2024年10月出版新書

2024年09月出版新書

2024年08月出版新書

2024年07月出版新書

2024年06月出版新書

2024年05月出版新書

2024年04月出版新書

2024年03月出版新書

2024年02月出版新書

2024年01月出版新書

2023年12月出版新書

『簡體書』分布式数据库系统原理(第4版)

書城自編碼: 3899978
分類: 簡體書→大陸圖書→教材研究生/本科/专科教材
作者: [德]塔姆尔·厄兹叙[M. Tamer ?zsu],帕特里克
國際書號(ISBN): 9787302636526
出版社: 清华大学出版社
出版日期: 2023-07-01

頁數/字數: /
書度/開本: 16开 釘裝: 平装

售價:NT$ 505

我要買

share:

** 我創建的書架 **
未登入.



編輯推薦:
本书第4版涵盖了分布式数据库系统领域的广度和深度内容,可以作为高等学校高年级本科生和研究生的分布式数据库系统教材,也可以作为从事相关工作研究人员的参考用书。
內容簡介:
本书主要介绍分布式数据库管理系统的基本概念、基本理论和设计问题,涵盖了分布式数据库系统的设计、实现和管理等方面的诸多专题。全书由两大部分组成, 第一部分包括第1~14章,以关系数据库为主,讲述了分布式数据管理的基础原理,内容包括分布式数据库设计,分布式查询的分解与优化,事务管理,分布式并发控制,分布式数据库管理系统的可靠性,数据复制等分布式数据管理技术的经典内容,第14章还讨论了并行数据库系统。第二部分包括第15~18章,介绍了互联网时代分布式数据管理研究的前沿,包括分布式对象数据库管理,P2P数据管理,万?
目錄
第1章 引言 1
1.1 什么是分布式数据库系统 1
1.2 分布式DBMS的发展历程 2
1.3 数据传输方案 4
1.4 分布式DBMS的承诺 5
1.4.1 分布式及复制数据的透明管理 6
1.4.2 基于分布式事务的可靠性 8
1.4.3 性能提升 8
1.4.4 可扩展性 9
1.5 设计问题 10
1.5.1 分布式数据库设计 10
1.5.2 分布式数据控制 10
1.5.3 分布式查询处理 10
1.5.4 分布式并发控制 11
1.5.5 分布式数据库的可靠性 11
1.5.6 复制 11
1.5.7 并行数据库 11
1.5.8 数据库集成 12
1.5.9 其他分布式方法 12
1.5.10 大数据处理和NoSQL 12
1.6 分布式DBMS体系架构 12
1.6.1 分布式DBMS体系架构的模型 13
1.6.2 客户/服务器系统 15
1.6.3 P2P系统 16
1.6.4 多数据库体系架构 18
1.6.5 云计算 20
1.7 本章参考文献说明 23
第2章 分布与并行数据库设计 25
2.1 数据分片 27
2.1.1 水平分片 28
2.1.2 垂直分片 39
2.1.3 混合分片 48
2.2 分配 49
2.2.1 辅助信息 50
2.2.2 分配模型 50
2.2.3 解决办法 52
2.3 结合的方法 53
2.3.1 工作负载不可知时的划分技术 53
2.3.2 工作负载可知的划分技术 54
2.4 自适应方法 57
2.4.1 检测工作负载的变化 57
2.4.2 检测受影响的数据项 58
2.4.3 增量重构 58
2.5 数据目录 60
2.6 本章小结 61
2.7 本章参考文献说明 61
2.8 本章习题 63
第3章 分布式数据控制 66
3.1 视图管理 66
3.1.1 集中式DBMS中的视图 67
3.1.2 分布式DBMS中的视图 69
3.1.3 物化视图的维护 70
3.2 访问控制 75
3.2.1 裁决式访问控制 76
3.2.2 多级访问控制 77
3.2.3 分布式访问控制 79
3.3 语义完整性控制 81
3.3.1 集中式语义完整性控制 82
3.3.2 分布式语义完整性控制 85
3.4 本章小结 89
3.5 本章参考文献说明 90
3.6 本章习题 91
第4章 分布式查询处理 93
4.1 查询处理概述 93
4.1.1 查询处理问题 94
4.1.2 查询优化 96
4.1.3 查询处理的分层结构 98
4.2 数据本地化 101
4.2.1 主水平划分的归约 101
4.2.2 连结的归约 103
4.2.3 垂直分片的归约 104
4.2.4 诱导分片的归约 105
4.2.5 混合分片的归约 106
4.3 分布式查询的连结排序 107
4.3.1 连结树 107
4.3.2 连结排序 109
4.3.3 基于半连结的算法 110
4.3.4 连结与半连结的对比 113
4.4 分布式代价模型 114
4.4.1 代价函数 114
4.4.2 数据库统计数据 115
4.5 分布式查询优化 116
4.5.1 动态方法 116
4.5.2 静态方法 120
4.5.3 混合方法 122
4.6 自适应查询处理 126
4.6.1 自适应查询处理的流程 127
4.6.2 eddy方法 128
4.7 本章小结 129
4.8 本章参考文献说明 130
4.9 本章习题 131
第5章 分布式事务处理 134
5.1 背景与概念定义 135
5.2 分布式并发控制 137
5.2.1 基于加锁的并发控制算法 138
5.2.2 基于时间戳的并发控制算法 145
5.2.3 多版本并发控制算法 149
5.2.4 乐观并发控制算法 150
5.3 基于快照隔离的分布式并发控制算法 152
5.4 分布式DBMS的可靠性 154
5.4.1 两阶段提交协议 155
5.4.2 两阶段提交协议的变型版本 161
5.4.3 处理站点故障 162
5.4.4 网络划分 168
5.4.5 Paxos共识协议 170
5.4.6 体系架构方面的考虑 173
5.5 扩展事务管理的现代方法 174
5.5.1 Spanner系统 175
5.5.2 LeanXcale系统 175
5.6 本章小结 177
5.7 本章参考文献说明 178
5.8 本章习题 181
第6章 数据复制 183
6.1 复制数据库的一致性 184
6.1.1 相互一致性 184
6.1.2 相互一致性与事务一致性 186
6.2 更新管理策略 187
6.2.1 积极更新传播 187
6.2.2 懒惰更新传播 188
6.2.3 集中式技术 188
6.2.4 分布式技术 189
6.3 复制协议 189
6.3.1 积极集中式协议 189
6.3.2 积极分布式协议 194
6.3.3 懒惰集中式协议 194
6.3.4 懒惰分布式协议 199
6.4 分组通信 200
6.5 复制与故障 202
6.5.1 故障和懒惰复制 202
6.5.2 故障和积极复制 202
6.6 本章小结 205
6.7 本章参考文献说明 205
6.8 本章习题 207
第7章 数据库集成——多数据库系统 209
7.1 数据库集成 209
7.1.1 自底向上的设计方法 210
7.1.2 模式匹配 213
7.1.3 模式集成 220
7.1.4 模式映射 221
7.1.5 数据清洗 227
7.2 多数据库查询处理 228
7.2.1 多数据库查询处理的关键问题 228
7.2.2 多数据库查询处理体系架构 229
7.2.3 基于视图的查询重写 231
7.2.4 查询优化和执行 234
7.2.5 查询翻译和执行 243
7.3 本章小结 245
7.4 本章参考文献说明 246
7.5 本章习题 248
第8章 并行数据库系统 258
8.1 并行数据库系统的目标 258
8.2 并行架构 261
8.2.1 通用架构 261
8.2.2 共享内存架构 262
8.2.3 共享磁盘架构 264
8.2.4 无共享架构 264
8.3 数据放置 265
8.4 并行查询处理 268
8.4.1 数据处理的并行算法 268
8.4.2 并行查询优化 273
8.5 负载均衡 277
8.5.1 并行执行的问题 277
8.5.2 算子内负载均衡 279
8.5.3 算子间负载均衡 280
8.5.4 查询内负载均衡 280
8.6 容错性 283
8.7 数据库集群 284
8.7.1 数据库集群架构 285
8.7.2 复制 286
8.7.3 负载均衡 286
8.7.4 查询处理 286
8.8 本章小结 289
8.9 本章参考文献说明 289
8.10 本章习题 291
第9章 对等数据管理 293
9.1 基础设施 295
9.1.1 非结构化P2P网络 296
9.1.2 结构化P2P网络 298
9.1.3 超级节点P2P网络 301
9.1.4 P2P网络比较 303
9.2 P2P系统上的模式映射 303
9.2.1 成对模式映射 303
9.2.2 基于机器学习技术的映射 304
9.2.3 公共协议映射 304
9.2.4 基于信息检索技术的模式映射 305
9.3 P2P系统的查询处理 306
9.3.1 Top-k查询 306
9.3.2 连结查询 316
9.3.3 区间查询 317
9.4 副本一致性 320
9.4.1 DHT中的基本支持 320
9.4.2 DHT中的数据货币 321
9.4.3 副本协调 322
9.5 区块链 325
9.5.1 区块链定义 326
9.5.2 区块链基础设施 327
9.5.3 区块链2.0 329
9.5.4 问题 330
9.6 本章小结 331
9.7 本章参考文献说明 332
9.8 本章习题 333
第10章 大数据处理 335
10.1 分布式存储系统 337
10.1.1 谷歌文件系统 338
10.1.2 对象存储与文件存储的结合 339
10.2 大数据处理框架 339
10.2.1 MapReduce数据处理 340
10.2.2 使用Spark处理数据 348
10.3 流数据处理 352
10.3.1 流模型、语言和算子 353
10.3.2 数据流的查询处理 356
10.3.3 数据流系统容错 362
10.4 图分析平台 363
10.4.1 图划分 365
10.4.2 MapReduce和图分析 369
10.4.3 图分析专用系统 369
10.4.4 以顶点为中心的整体同步系统 372
10.4.5 以顶点为中心的异步并行系统 374
10.4.6 以顶点为中心的聚集-应用-分散系统 376
10.4.7 以划分为中心的整体同步系统 377
10.4.8 以划分为中心的异步并行系统 378
10.4.9 以划分为中心的聚集-应用-分散系统 378
10.4.10 以边为中心的整体同步系统 378
10.4.11 以边为中心的异步并行系统 379
10.4.12 以边为中心的聚集-应用-分散系统 379
10.5 数据湖 379
10.5.1 数据湖与数据仓库 379
10.5.2 体系架构 380
10.5.3 挑战 382
10.6 本章小结 382
10.7 本章参考文献说明 383
10.8 本章习题 385
第11章 NoSQL、NewSQL与Polystore技术 388
11.1 NoSQL系统提出的动机 388
11.2 键值存储系统 390
11.2.1 DynamoDB 390
11.2.2 其他键值存储系统 392
11.3 文档存储系统 392
11.3.1 MongoDB 393
11.3.2 其他文档存储 395
11.4 宽列存储 395
11.4.1 Bigtable 396
11.4.2 其他宽列存储系统 397
11.5 图数据库管理系统 397
11.5.1 Neo4j 398
11.5.2 其他图数据库系统 401
11.6 混合数据存储系统 401
11.6.1 多模型NoSQL存储系统 401
11.6.2 NewSQL数据库系统 402
11.7 Polystore系统 404
11.7.1 松耦合的Polystore系统 405
11.7.2 紧耦合Polystore系统 408
11.7.3 混合系统 412
11.7.4 结束语 415
11.8 本章小结 416
11.9 本章参考文献说明 417
11.10 本章习题 418
第12章 万维网数据管理 419
12.1 万维网图管理 420
12.2 万维网搜索 421
12.2.1 万维网爬取 422
12.2.2 索引 423
12.2.3 排序与链接分析 424
12.2.4 对关键词搜索的评价 425
12.3 万维网查询 426
12.3.1 半结构化数据方法 427
12.3.2 万维网查询语言方法 430
12.4 问答系统 435
12.5 隐藏万维网搜索与查询 438
12.5.1 隐藏万维网爬取 438
12.5.2 元搜索 439
12.6 万维网数据集成 441
12.6.1 万维网表格/融合表格 442
12.6.2 语义万维网和链接开放数据 442
12.6.3 万维网数据集成中的数据质量问题 456
12.7 本章参考文献说明 462
12.8 本章习题 464
附录 465
参考文献 466

8
分布式数据库系统原理(第4版)
9
目 录
內容試閱
在本书第1版出版的1991年,分布式数据库技术还很新,市面上的产品也不是很多。在第1版的前言中,我们引用了Michael Stonebraker的话——他在1988年提出,在接下来的 10 年中,集中式DBMS 将成为一种“古董”,大多数组织将转向分布式DBMS。可以说,Michael Stonebraker的这一预测被证明是正确的,当今使用的大部分数据库系统都是分布式或并行的,它们通常也称为横向扩展系统。另外,在我们撰写本书第1版时,本科生和研究生的数据库课程并不像现在这样普及。因此,本书的第1版在介绍分布式/并行解决方案之前对集中式解决方案做了详尽介绍。然而,随着时代的变化,现在已经很难找到不具备数据库基本知识的研究生了。因此,一本关于分布式/并行数据库技术的研究生教材在今天需要有不同的定位。这正是我们在这一版本中的目标,我们同时还保留了第3版引入的许多新内容。具体而言,我们在第4版中引入的主要修订如下:
  (1)多年来,分布式数据库系统的动机和环境均发生了变化(如Web、云等的出现)。鉴于此,对分布式数据库技术进行整体介绍的章节需要进行更新。因此,我们修改了引言部分,以便可以从更为现代的视角看待这项技术。
  (2)我们新增了一个关于大数据处理的章节,涵盖了分布式存储系统、数据流处理、MapReduce与Spark 平台、图分析和数据湖的内容。随着上述系统的激增,系统地对它们进行介绍是必不可少的。
  (3)类似地,我们通过新的一章来介绍NoSQL系统日益增长的影响。该章涵盖了4种类型的 NoSQL系统,即键值存储、文档存储、宽列系统和图DBMS,此外还涵盖了NewSQL和Polystore系统。
  (4)我们把第3版中的数据库集成和多数据库查询处理章节合并为一个数据库集成 章节。
  (5)我们对之前主要关注XML的Web数据管理章节进行了大幅修订,重新聚焦目前更常见的RDF技术。我们也在相关章节中讨论了Web数据集成方法,同时涵盖数据质量这一重要问题。
  (6)我们修订了P2P数据管理章节,大幅新增了对区块链的介绍。
  (7)为了使前面的章节更为简洁,我们删除了基本的集中式技术,已压缩查询处理和事务管理的相关章节,并将这些章节的重点放在分布式/并行技术上。同时,我们在这些章节中增加了一些近来重要的内容,例如动态查询处理技术(eddies),以及Paxos共识算法及其在提交协议中的使用。
  (8)我们更新了并行DBMS的章节,阐明了系统的目标,特别是对比了纵向扩展与横向扩展,并介绍了包括UMA与NUMA的并行架构。此外,我们还新增了一个小节来介绍并行排序算法和并行连结算法的不同解决方案,从而探讨如何利用当今常见的大内存和多核处理器。
  (9)我们更新了分布式设计章节,大幅增加了一些同时结合了数据分片和站点分配的现代方法。通过重新梳理材料,目前该章节是面向分布式/并行数据划分内容的核心章节。
  (10)尽管对象技术持续在信息系统中发挥作用,但它在分布式/并行数据管理中的重要性已经下降。因此,这一版本删除了关于对象数据库的章节。
  很明显,我们采用更为现代的处理方式对整本书和每一章进行了修订和更新。同时,我们仍保留了在此过程中删除的材料——这些材料作为在线附录包含在本书的官方网站上(https://cs.uwaterloo.ca/ddbs)。为了保持本书的合理篇幅(这也使价格保持合理),我们选择在线提供这些内容而不将它们纳入印刷版本。网站还包括基于本书的教学课件以及大多数习题的参考答案(仅开放给采用本书进行教学的教师)。
  与之前的版本一样,许多同事为本书第4版的完成提供了帮助,在此感谢他们(排名不分先后)。Dan Olteanu在第3章中对可以显著减少物化视图维护时间的两种优化方法进行了很好的探讨。Phil Bernstein提供了有关多版本事务管理的新论文,这些论文指导了第5章的更新。Khuzaima Daudjee提供了关于分布式事务处理的新参考文献,这些文献已被添加到第5章的参考文献说明部分。Ricardo Jimenez Peris为第5章撰写了有关高性能事务系统的内容,他还为第11章撰写了关于LeanXcale的部分。Dennis Shasha审阅了P2P章节中关于区块链的部分。Michael Carey审阅了第10章、第11章和第8章的内容,给出了非常详细的建议,极大地改进了这些章节。Tamer的学生Anil Pacaci、Khaled Ammar和博士后Xiaofei Zhang审阅了有关大数据的章节,他们发表的论文中的一些内容也包含在该章中。第11章(NoSQL、NewSQL和Polystores)涵盖了Boyan Kolev和Patrick的学生Carlyna Bondiombouy所发表论文中的内容。Jim Webber审阅了第11章中有关Neo4j的部分。第11章中图分析系统的特征部分基于Minyang Han的硕士论文,他还提出了该章介绍的GiraphUC方法。Semih Salihoglu和Lukasz Golab也审阅了该章的部分内容并提供了非常有帮助的建议。Alon Halevy针对第12章中的WebTables提出了建议。Ihab Ilyas和Xu Chu对Web数据集成中的数据质量进行了讨论。Stratos Idreos介绍了如何使用database cracking进行数据划分,并为第2章撰写了相关的内容。Renan Souza和Fabian St?ter审阅了整 本书。
  本书的第3版引入了许多新主题,这些主题延续到了这一版,许多同事在撰写这些章节时发挥了很大的作用。我们想再次感谢他们的帮助,因为他们的影响也反映在当前版本中。Renée Miller、Erhard Rahm和Alon Halevy在整理关于数据库集成的讨论方面发挥了关键作用,Avigdor Gal对相关章节进行了全面的审阅。Matthias Jarke、Xiang Li、Gottfried Vossen、Erhard Rahm和Andreas Thor为相关章节贡献了习题。Hubert Naacke为异构代价建模部分做出了贡献,Fabio Porto为自适应查询处理部分做出了贡献。如果没有Gustavo Alonso和Bettina Kemme的帮助,我们无法撰写关于数据复制的内容(第6章)。Esther Pacitti也通过审阅和提供背景材料为数据复制章节做出了贡献;她还参与了并行DBMS一章中有关数据库集群复制的部分。P2P数据管理在很大程度上要归功于与Beng Chin Ooi的讨论。本章关于P2P 系统中查询处理的部分使用了Reza Akbarinia和Wenceslao Palma的博士工作中的材料,而关于复制的部分,则使用了Vidal Martins的博士工作中的材料。
  我们要感谢Springer的编辑Susan Lagerstrom-Fife在Springer内部推动这个项目,并督促我们及时完成本书。我们几乎错过了她所有的截止日期,但我们希望最终结果是令人满意的。
  最后,我们愿意听取读者对本书的意见和建议。我们欢迎任何方面的反馈,但我们更加希望收到以下方面的意见与建议:
  (1)尽管我们尽了最大努力,但可能仍然存在任何错误(我们希望不会有很多);
  (2)任何应该删减、添加或扩展的主题;
  (3)您设计的任何习题,如果您希望将其纳入本书中。
  
   M. Tamer ?zsu (tamer.ozsu@uwaterloo.ca)
   Patrick Valduriez (patrick.valduriez@inria.fr)
  
  
  
  
4
分布式数据库系统原理(第4版)
5
前??言

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 台灣用户 | 香港/海外用户
megBook.com.tw
Copyright (C) 2013 - 2025 (香港)大書城有限公司 All Rights Reserved.