登入帳戶  | 訂單查詢  | 購物車/收銀台(0) | 在線留言板  | 付款方式  | 聯絡我們  | 運費計算  | 幫助中心 |  加入書簽
會員登入   新用戶註冊
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2024年度TOP分類閱讀雜誌 香港/國際用戶
最新/最熱/最齊全的簡體書網 品種:超過100萬種書,正品正价,放心網購,悭钱省心 送貨:速遞 / 物流,時效:出貨後2-4日

2024年12月出版新書

2024年11月出版新書

2024年10月出版新書

2024年09月出版新書

2024年08月出版新書

2024年07月出版新書

2024年06月出版新書

2024年05月出版新書

2024年04月出版新書

2024年03月出版新書

2024年02月出版新書

2024年01月出版新書

2023年12月出版新書

2023年11月出版新書

『簡體書』经典并行与量子并行:提升并挖掘计算系统的潜在性能 刘宇航

書城自編碼: 4046961
分類: 簡體書→大陸圖書→計算機/網絡數據庫
作者: 刘宇航
國際書號(ISBN): 9787111750826
出版社: 机械工业出版社
出版日期: 2024-10-01

頁數/字數: /
書度/開本: 16开 釘裝: 平装

售價:NT$ 658

我要買

share:

** 我創建的書架 **
未登入.



新書推薦:
我们终将老去:认识生命的第二阶段
《 我们终将老去:认识生命的第二阶段 》

售價:NT$ 418.0
祛魅:对世界祛魅是一个人变强的开始
《 祛魅:对世界祛魅是一个人变强的开始 》

售價:NT$ 286.0
家族财富传承
《 家族财富传承 》

售價:NT$ 704.0
谁是窃书之人 日本文坛新锐作家深绿野分著 无限流×悬疑×幻想小说
《 谁是窃书之人 日本文坛新锐作家深绿野分著 无限流×悬疑×幻想小说 》

售價:NT$ 254.0
一个经济杀手的自白 第3版
《 一个经济杀手的自白 第3版 》

售價:NT$ 505.0
8秒按压告别疼痛
《 8秒按压告别疼痛 》

售價:NT$ 398.0
津巴多时间心理学:挣脱束缚、改写命运的6种时间观
《 津巴多时间心理学:挣脱束缚、改写命运的6种时间观 》

售價:NT$ 352.0
大英博物馆东南亚简史
《 大英博物馆东南亚简史 》

售價:NT$ 806.0

編輯推薦:
本书从算势和算力的视角对传统的并行计算进行了一次新的审视,尤其是将量子并行计算与经典并行计算使用统一的角度去观察,是一种极大地创新。从内容看,这种尝试是非常成功的:本书包含了经典并行计算中经常讨论的话题,如并行体系结构、性能模型、存储模型、共享存储结构与编程、分布式存储与编程、连接并行计算部件的互连网络、并行计算机中的资源调度、并行输入输出、高速缓存一致性及事务内存等,这些内容十分重要,是并行计算的重要基础概念,在算力算势的角度下,这些内容又焕发出新的生机。同时,本书也详略得当地介绍了量子并行的内容,对后摩尔时代的我们来说,这些内容是我们继续使用并行计算这一方式挖掘新方法,新思路,解决新问题的工具,是异常宝贵的。将经典并行和量子并行相结合,可以使读者有广阔的视角和思路解决问题。
內容簡介:
本书深入浅出介绍后摩尔时代的并行计算核心技术,理论与实践并重,同时兼顾数学模型、结构模型、编程模型。本书具有以下特色:从概念上明确算势与算力的联系与区别,强调在后摩尔时代背景下从潜在能力(算势)到实际能力(算力)的充分转化的重要性;注重量化分析和理论推导,单列一章对计算性能模型和存储性能进行了介绍;注重并行应用程序的设计,单列一章介绍并对比分析了共享存储编程与非共享存储编程的基本原理;注重融会贯通,培养整体观念,分别考察了共享存储结构和分布式存储结构,揭示潜在的可利用的并行硬件资源以及对应的编程方法;编制了大量的原创的有助于提高读者理解深度和应用知识能力的例题;在国内外同类教材或专著中,率先以算势和算力的统一的视角,系统对比了经典并行计算与量子并行计算,促进两个领域的沟通融合。
關於作者:
刘宇航 中国科学院计算技术研究所副研究员,《中国计算机学会通讯》编委、专栏作家,中国计算机学会职业伦理和公共政策工作委员会常务委员,中国计算机学会高级会员。研究方向为计算机体系结构、高性能计算、存储系统、智能并发系统等。在包括HPCA、SC、DAC、TPDS等国内外高水平的期刊和学术会议上累计发表论文60余篇,专著3部,发明专利10余项,一系列关键技术实际落地应用到国产智能手机等一线芯片或系统,致力于构建信息技术新体系以解决卡脖子技术难题。
目錄
推荐序一
推荐序二
前言
第1章 计算概念的谱系
1.1 引言/ 2 
1.2 计算概念谱系化的意义/ 3 
1.3 计算概念的谱系/ 4 
1.3.1 算势/ 5 
1.3.2 算力/ 7 
1.3.3 算术/ 10 
1.3.4 算法/ 11 
1.3.5 算礼/ 13 
1.4 计算概念谱系组分的相互关系/ 14 
1.5 从场的角度认识算势与算力的异同/ 16 
1.6 证明与计算之间的关系/ 20 
1.7 本章小结/ 23 
1.8 思考题/ 23 
参考文献/ 23 
第2章 并行处理的意义及挑战
2.1 引言/ 26 
2.2 并行计算机与应用和工艺的关系/ 26 
2.3 并行处理的普遍性/ 28 
2.4 多核微处理器技术/ 31 
2.5 并行处理需要应对的挑战/ 35 
2.6 并行处理的学科任务/ 40 
2.7 本章小结/ 41 
2.8 思考题/ 41 
参考文献/ 41 
第3章 并行处理的一般原理
3.1 引言/ 44 
3.2 冯·诺依曼结构/ 44 
3.3 通过实例说明指令级并行与数据依赖/ 47 
3.4 通过实例说明线程级并行/ 49 
3.5 延迟隐藏和延迟减少/ 55 
3.6 并行处理技术的图形化表示/ 60 
3.7 费林分类法/ 63 
3.8 指令级并行/ 65 
3.8.1 流水线技术/ 65 
3.8.2 指令的动态调度/ 65 
3.8.3 多发射技术/ 66 
3.9 并行计算机系统的分类/ 67 
3.9.1 向量计算机/ 67 
3.9.2 多处理机/ 68 
3.9.3 多主机/ 68 
3.9.4 大规模并行处理计算机/ 68 
3.10 并行结构的类型/ 69 
3.10.1 单处理器的并行结构/ 69 
3.10.2 多处理器的并行结构/ 69 
3.10.3 处理机结构创新的历史/ 70 
3.10.4 多核共享内存模型/ 73 
3.10.5 多核消息传递模型/ 76 
3.11 本章小结/ 80 
3.12 思考题/ 81 
参考文献/ 81 
第4章 计算性能模型和存储性能模型
4.1 引言/ 84 
4.2 并行执行时间效率模型/ 85 
4.3 可扩展定律/ 103 
4.3.1 阿姆达尔定律/ 103 
4.3.2 古斯塔夫森-巴西斯定律/ 104 
4.3.3 存储受限的扩展定律(孙-倪定律)/ 106 
4.4 并行计算模型/ 112 
4.4.1 PRAM模型/ 112 
4.4.2 BSP模型/ 114 
4.4.3 LogP模型/ 117 
4.5 程序性能指标/ 120 
4.5.1 单道程序工作负载的性能指标/ 120 
4.5.2 多道程序工作负载的性能指标/ 122 
4.6 存储系统的性能指标/ 123 
4.6.1 平均存储访问时间/ 123 
4.6.2 存储延迟与存储带宽/ 124 
4.6.3 单位时钟周期完成的存储访问数量/ 126 
4.6.4 并发平均存储访问时间/ 127 
4.6.5 存储级并行性/ 130 
4.6.6 并发感知的局部性/ 131 
4.7 基准测试/ 133 
4.7.1 基准测试的定义和分类/ 133 
4.7.2 基准测试运行的规范/ 134 
4.7.3 基准测试程序组的要求/ 134 
4.7.4 基准测试的开发者/ 135 
4.7.5 性能测试结果的总结/ 136 
4.8 性能评估方式/ 136 
4.8.1 Roofline模型/ 136 
4.8.2 模拟器/ 151 
4.8.3 需要避免的4个陷阱/ 160 
4.9 本章小结/ 161 
4.10 思考题/ 161 
参考文献/ 161 
第5章 共享存储结构与编程
5.1 引言/ 164 
5.2 共享存储体系结构的类型/ 165 
5.3 并行编程模型/ 168 
5.3.1 抽象与实现的区别及其实例/ 168 
5.3.2 通信与协作/ 176 
5.3.3 通信层面三种并行编程模型的特点/ 187 
5.3.4 混合编程模型/ 188 
5.4 并行处理的流程/ 189 
5.4.1 思路和实例/ 189 
5.4.2 问题分解/ 193 
5.4.3 任务分配/ 193 
5.4.4 协调/ 194 
5.4.5 进程映射/ 194 
5.5 并行编程优化/ 205 
5.5.1 静态分配与动态分配/ 206 
5.5.2 延迟与带宽/ 214 
5.5.3 内在通信与人为通信/ 217 
5.6 减少通信的技术/ 221 
5.6.1 利用时间局部性/ 221 
5.6.2 利用空间局部性/ 222 
5.7 共享内存体系结构/ 228 
5.8 共享内存体系结构编程——OpenMP/ 242 
5.9 实验——OpenMP/ 274
5.9.1 实验——OpenMP求sinx/ 274 
5.9.2 实验——OpenMP求π值/ 278 
5.9.3 实验——OpenMP求斐波那契数列第n项/ 283 
5.9.4 实验——Gauss-Seidel迭代算法的并行实现及其优化/ 291 
5.10 本章小结/ 296 
5.11 思考题/ 296 参考文献/ 296 
第6章 分布式存储结构与编程
6.1 引言/ 300 
6.2 向量处理机体系结构/ 300 
6.2.1 结构特点/ 300 
6.2.2 性能分析/ 305 
6.2.3 向量指令并行/ 307 
6.2.4 向量链/ 307 
6.2.5 向量分解strip-mining技术/ 308 
6.2.6 向量条件执行/ 308 
6.2.7 压缩/展开操作/ 309 
6.2.8 向量归约/ 310 
6.2.9 存储访问/ 311 
6.2.10 分散和聚集/ 312 
6.3 SIMD编程/ 327 
6.3.1 SIMD简介/ 327 
6.3.2 实现向量化的几种方法/ 327 
6.3.3 向量化编译指令/ 328 
6.3.4 向量化过程中的主要挑战/ 330 
6.3.5 编译器向量化方式/ 335 
6.3.6 循环变换/ 339 
6.3.7 数据地址对齐/ 341 
6.3.8 别名/ 341 
6.3.9 条件语句/ 342 
6.3.10 原生SIMD支持/ 342 
6.4 CUDA编程/ 343 
6.4.1 异构计算的定义/ 344 
6.4.2 CUDA/ 345 
6.4.3 GPU的并发控制/ 346 
6.4.4 GPU的内存管理/ 347 
6.4.5 SIMT/ 348 
6.4.6 CUDA编程/ 349 
6.4.7 CUDA与GPU硬件之间的映射/ 355 
6.4.8 深流水线设计/ 356 
6.4.9 GPU内存/ 356 
6.4.10 GPU并发策略/ 358 
6.4.11 库函数介绍/ 358 
6.5 MPI编程/ 363 
6.5.1 MPI在编程模型内的分类定位/ 363 
6.5.2 信息交互模型与通信方式/ 364 
6.5.3 MPI基本函数/ 367 
6.5.4 MPI程序执行(以C on linux为例)/ 370 
6.5.5 MPI集群通信函数/ 370 
6.6 实验——编写MPI并行程序/ 379 
6.6.1 编写MPI程序并行计算平均值/ 379 
6.6.2 编写MPI程序并行计算矩阵向量乘法/ 381 
6.6.3 编写MPI程序并行计算圆周率/ 383 
6.7 实验——基于CUDA并发的矩阵乘法/ 386 
6.8 本章小结/ 391 
6.9 思考题/ 392 
第7章 并行计算机系统的互连网络
7.1 引言/ 394 
7.2 互连网络的基本概念/ 394 
7.2.1 互连网络分层架构/ 394 
7.2.2 互连网络相关参数/ 395 
7.3 互连网络物理层/ 397 
7.3.1 消息结构/ 397 
7.3.2 物理层流控制/ 397 
7.4 互连网络交换层/ 398 
7.4.1 互连网络交换层功能与架构/ 398 
7.4.2 互连网络交换层技术/ 399 
7.5 互连网络路由层/ 402 
7.5.1 互连网络拓扑结构/ 402 
7.5.2 互连网络路由方式/ 409 
7.5.3 路由协议结构/ 410 
7.5.4 蝴蝶形拓扑结构路由算法/ 411 
7.5.5 维序路由算法/ 412 
7.5.6 死锁问题/ 413 
7.6 互连网络软件层/ 415 
7.6.1 互连网络软件层架构/ 415 
7.6.2 性能分析/ 417 
7.7 本章小结/ 418 
7.8 思考题/ 419 
第8章 并行计算机系统的资源调度
8.1 引言/ 422 
8.2 相关工作/ 425 
8.2.1 延迟敏感型应用延迟测量与建模/ 426 
8.2.2 数据中心干扰的测度方法/ 427 
8.2.3 资源管理使能技术/ 427
8.2.4 资源调度策略/ 429
8.3 延迟敏感型应用分析与建模/ 432 
8.3.1 延迟敏感型应用概述/ 433 
8.3.2 延迟敏感型应用延迟的组成及影响因素/ 435 
8.3.3 平均延迟与尾延迟的关系/ 436 
8.3.4 Littles law的尾延迟形式/ 441 
8.4 数据中心干扰的测度/ 444 
8.4.1 信息熵与系统熵/ 445 
8.4.2 场景1:仅存在延迟敏感型应用时/ 445 
8.4.3 场景2:仅存在尽力交付型应用时/ 446 
8.4.4 场景3:延迟敏感型和尽力交付型应用混合运行时/ 447 
8.4.5 系统熵的优点/ 447 
8.5 资源调度策略/ 449 
8.5.1 调度方法/ 450 
8.5.2 实验验证/ 453 
8.6 本章小结/ 459 
8.7 思考题/ 460 
参考文献/ 460 
第9章 并行输入输出
9.1 引言/ 468 
9.2 I/O软件栈/ 468 
9.3 并行文件系统/ 469 
9.4 常见并行文件系统/ 475 
9.4.1 并行虚拟文件系统PVFS/ 475 
9.4.2 通用并行文件系统GPFS/ 478 
9.4.3 集群文件系统Lustre/ 479 
9.5 POSIX/ 482 
9.6 MPI-I/O/ 483 
9.6.1 MPI-I/O的特性/ 483 
9.6.2 MPI-I/O示例/ 485 
9.6.3 MPI-I/O的底层读写优化/ 487 
9.7 PnetCDF/ 490 
9.8 本章小结/ 495 
9.9 思考题/ 496 
参考文献/ 496 
第10章 高速缓存一致性、同步和事务性内存
10.1 引言/ 498 
10.2 高速缓存一致性/ 498 
10.2.1 基于总线的一致性协议/ 500 
10.2.2 基于目录的一致性协议/ 502 
10.3 目录结构/ 503 
10.3.1 全映射位向量目录/ 503 
10.3.2 有限指针目录/ 504 
10.3.3 链式目录/ 505 
10.3.4 粗糙向量目录/ 506 
10.3.5 树形压缩向量目录/ 506 
10.3.6 单级混合目录/ 507 
10.3.7 多级目录/ 508 
10.4 实现高速缓存一致的典型系统/ 511 
10.4.1 Dash/ 511 
10.4.2 Origin 2000/ 512 
10.4.3 Alewife/ 513 
10.4.4 Exemplar X/ 514 
10.4.5 NUMA-Q/ 514 
10.5 同步原语和锁机制/ 515 
10.5.1 同步原语/ 515 
10.5.2 互斥锁的实现/ 516 
10.5.3 栅障/ 520 
10.5.4 实验——无锁算法/ 524 
10.5.5 并行软件优化/ 533 
10.6 事务性内存/ 537 
10.6.1 事务性内存的特性/ 537 
10.6.2 事务性内存的优点/ 538 
10.6.3 事务性内存的实现/ 543 
10.7 本章小结/ 549 
10.8 思考题/ 549 
参考文献/ 550 
第11章 量子并行计算
11.1 引言/ 554 
11.2 对量子力学的基本理解/ 555 
11.2.1 量子力学与经典力学有本质区别/ 555 
11.2.2 量子计算的优势在于并行/ 555 
11.2.3 量子的概念/ 555 
11.2.4 不确定性原理/ 556 
11.2.5 对叠加态的理解/ 558 
11.2.6 张量积/ 561 
11.2.7 左矢与右矢/ 561 
11.3 几种重要的熵及其联系/ 563 
11.3.1
內容試閱
前 言
呈现在读者面前的是一本试图从新的视角对并行计算进行审视的书,具体来说,就是从算势与算力的视角,对后摩尔时代的经典并行计算与量子并行计算进行统一审视。我们当前处于后摩尔时代,这决定了本书具有鲜明的时代特点,现在单个晶体管的特征尺寸已接近原子尺寸,量子效应越来越显著。在经典计算机中,量子效应是作为一种需要防范的、可能会造成误差或错误的因素而存在的。在量子计算机中,量子效应就不再是负面角色,而是具有非凡潜力的正面角色。无论从哪个角度看,目前都需要研究量子计算,但不能舍弃经典计算。总而言之,我们需要研究它们的区别与联系。区别是显然的,联系是隐含的,本书提出从算势和算力的角度建立它们的联系。
计算技术改变了人类的生产方式,也改变了人类的生活方式。计算技术诞生伊始,并行的思想、方法就开始孕育和发展,但相对而言较少为人所知。值得注意的是,计算技术可以改变人类的思维方式,并行计算的思想和方法也能促进人脑并行思维能力的发展。经过“并行计算”这门课程的学习和专业训练,人的大脑神经网络(包括神经元突触连接方式和神经回路等)会得到训练,进而可以在面对各种各样的场景时,运用并行思维,设计并行算法,以更短的时间完成问题求解。
并行是节省计算时间、提高计算效率的基本方法,并行计算或并行处理是整个计算机科学理论体系中具有普遍性、深刻性的一个核心概念。但在实践中,很多从业人员仅把“并行计算”认知为少部分人从事的一个具体的研究方向,对其普遍性、深刻性缺乏认识。并行计算本身不是目标或目的,只是手段或方式,真正的目标或目的是缩短问题求解时间、求解更大的问题、提高能量效率。计算机系统计算能力的潜在峰值称为算势,用户实际获得的计算能力称为算力。并行计算这个学科一方面是为了提高算势,另一方面是为了提高算势到算力的转化率,最终是为了提高算力。
值得注意的是,并行计算不是一门纯粹的理论,也不是一门单纯的技术,它有从基础科学到技术科学再到应用技术的一套完整的体系。读者只要深入地研读一下钱学森先生的《论技术科学》一文就会得到这样的结论。这种特点决定了并行计算这个学科的学习和研究方法,也决定了本书的写法。按照优先级从高到低,本书坚持“兴趣>思维>方法>知识”的排序公式,即首先激发读者主动学习并行计算的兴趣,其次培养读者自觉应用并行计算解决问题的思维,然后讲解并行计算方法,最后才是传授并行计算知识。
本书以并行计算的视角审视计算机系统的各个层次,训练读者的系统观念和并行计算思维。体系结构(architecture)、微体系结构(microarchitecture)、并行计算(parallel computing)是三个既有联系又有区别的学科。体系结构又称为指令集体系结构(instruction set architecture,ISA),它规定了一个刻画处理器功能的指令集。指令集是软件与硬件的接口,所有的软件必须被映射到这个指令集内才能被处理器硬件执行。微体系结构是体系结构的实现,一种体系结构可以有多种不同的实现。微体系结构关注的内容有流水线的设计、高速缓存的设计、内存控制器的设计、分支预测器的设计等。软件一般看不到微体系结构的细节,因为这些细节是在硬件中实现的。并行计算是一个广泛渗透于计算机系统全栈的设计思想、方法和技术,体现在体系结构、微体系结构、系统软件、应用软件等各个层次上。
本书的核心观点是“为满足不断增长的用户在计算应用上的效用需求,有且只有两种途径,一是提升计算系统的潜能,即提升算势,二是挖掘计算系统的潜能,即提升算势到算力的转化率。通过两种途径,最终实现在本质上具有高通量、低延迟、低熵、高效用的计算系统”。熵是对“无序”的量度,“有序”是指在从外部看来完全一样的条件下,系统内部所具有的不同排列方式的数目是较少的。低熵是通过体系结构和调度策略的优化设计来实现的。但我们不需要所有的低熵状态,只有极大化服务质量和系统性能的那种低熵才是我们需要的。算势到算力的充分转化,需要通过体系结构和调度策略的优化设计,需要在庞大的设计空间中“海底捞针”式地找到那个可行解,这需要通过深刻的洞察和巧妙的设计来实现,而不是通过蛮力搜索和平凡的设计实现。
本书具有以下特色:(1)从概念上明确算势与算力的区别,强调从算势到算力的充分转化的重要性;(2)注重量化分析和理论推导,单列一章对计算性能模型和存储性能模型进行了介绍;(3)注重并行应用程序的设计,单列一章介绍并对比分析了共享存储编程和非共享存储编程的基本原理;(4)注重融会贯通,培养整体观念,分别介绍了共享存储结构和分布式存储结构,揭示潜在的可利用的并行硬件资源以及对应的编程方法;(5)编制了大量的有助于读者深刻理解和灵活应用知识的例题;(6)以统一的视角审视和对比了经典并行计算与量子并行计算,促进两个领域的沟通融合。
本书在撰写时尝试兼取教材和专著的优点。作为教材,本书尝试通俗易懂地反映那些沉淀下来的历久弥新的经典内容,本书的内容曾在中国科学院大学作为研究生教材授课四个学年,每年都有新体会、新补充。作为专著,本

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 台灣用户 | 香港/海外用户
megBook.com.tw
Copyright (C) 2013 - 2025 (香港)大書城有限公司 All Rights Reserved.