新書推薦:
《
甲骨文丛书·消逝的光明:欧洲国际史,1919—1933年(套装全2册)
》
售價:NT$
1265.0
《
剑桥日本戏剧史(剑桥世界戏剧史译丛)
》
售價:NT$
918.0
《
中国高等艺术院校精品教材大系:材料的时尚表达??服装创意设计
》
售價:NT$
347.0
《
美丽与哀愁:第一次世界大战个人史
》
售價:NT$
653.0
《
国家豁免法的域外借鉴与实践建议
》
售價:NT$
857.0
《
大单元教学设计20讲
》
售價:NT$
347.0
《
儿童自我关怀练习册:做自己最好的朋友
》
售價:NT$
316.0
《
高敏感女性的力量(意大利心理学家FSP博士重磅力作。高敏感是优势,更是力量)
》
售價:NT$
286.0
|
編輯推薦: |
本书是“十二五”普通高等教育本科国家级规划教材、国家级一流课程教材和普通高等教育精品教材。本书系统地论述了计算机系统结构的基本概念、基本结构、基本方法等,强调从开发并行性的角度、用量化分析(性能评价)的方法来研究和分析计算机系统。本书配套资源丰富,包括教学大纲、教学课件、850分钟的微课视频和在线题库。
|
內容簡介: |
本书系统地论述了计算机系统结构的基本概念、基本结构、基本方法等,强调从开发并行性的角度、用量化分析(性能评价)的方法研究和分析计算机系统,并且采用微课的形式,配备了教学动画和视频。
全书共有15章。第1章论述计算机系统的基本概念、并行性的发展和定量分析基础。第2章论述计算机指令系统的设计和MIPS指令系统。第3章论述流水线技术,包括性能分析、调度、相关与冲突以及流水线的实现。第4章论述向量处理机的结构、常用技术和性能评价。第5章和第6章分别论述如何用硬件和软件的方法开发指令级并行性,包括Tomasulo算法、基于硬件的前瞻执行、多指令流出技术、循环展开、VLIW、EPIC等。第7章论述存储系统,重点论述Cache的基本知识及提高Cache性能的各种方法。第8章论述总线、通道处理机和RAID。第9章论述互连网络的特性参数、静/动态互连网络以及消息传递机制等。第10章论述SMP、DSM、MPP等并行计算机系统结构,以及多Cache一致性、同步、同时多线程。第11章论述多核架构以及基于多核的并行程序设计。第12章论述机群系统。第13章论述领域专用体系结构。最后两章分别论述阵列处理机和数据流计算机。
本书内容丰富、语言简练、可读性好,可作为高等院校计算机及相关专业的教材,也可作为相关科技人员的参考书。
|
目錄:
|
CONTENTS
第1章计算机系统结构基础知识1
1.1计算机系统结构的基本概念1
1.1.1计算机系统的层次结构2
1.1.2计算机系统结构的定义3
1.1.3计算机组成和计算机实现3
1.1.4计算机系统结构的分类4
1.2计算机系统的设计7
1.2.1计算机系统设计的定量原理7
1.2.2计算机系统设计者的主要任务10
1.2.3计算机系统设计的主要方法12
1.3计算机系统的性能评测13
1.4计算机系统结构的发展17
1.4.1冯·诺依曼结构及其改进17
1.4.2软件对系统结构的影响19
1.4.3器件发展对系统结构的影响21
1.4.4应用对系统结构的影响22
1.5计算机系统结构中并行性的发展23
1.5.1并行性的概念23
1.5.2提高并行性的技术途径25
1.5.3单机系统中并行性的发展25
1.5.4多机系统中并行性的发展25
1.5.5并行机的发展变化26
习题128
第2章指令系统的设计30
2.1指令系统结构的分类30
2.2指令系统的寻址方式32
2.3指令系统的设计和优化35
2.3.1指令系统设计的基本原则35
2.3.2控制指令36
2.3.3指令操作码的优化37
2.3.4指令字格式的优化40
2.4指令系统的发展和改进42
2.4.1沿CISC方向发展和改进指令系统42
2.4.2沿RISC方向发展和改进指令系统43
2.5操作数的类型和大小45
2.6MIPS指令系统结构47
2.6.1MIPS的寄存器47
2.6.2MIPS的数据表示47
2.6.3MIPS的数据寻址方式47
2.6.4MIPS的指令格式48
2.6.5MIPS的操作49
2.6.6MIPS的控制指令50
2.6.7MIPS的浮点操作51
习题251
目录计算机系统结构教程(第4版)第3章流水线技术53
3.1流水线的基本概念53
3.1.1什么是流水线53
3.1.2流水线的分类55
3.2流水线的性能指标58
3.2.1流水线的吞吐率58
3.2.2流水线的加速比60
3.2.3流水线的效率61
3.2.4流水线的性能分析举例62
3.2.5流水线设计中的若干问题64
3.3非线性流水线的调度64
3.3.1单功能非线性流水线的最优调度65
3.3.2多功能非线性流水线的调度67
3.4流水线的相关与冲突70
3.4.1一条经典的5段流水线70
3.4.2相关与流水线冲突72
3.5流水线的实现83
3.5.1MIPS的一种简单实现83
3.5.2基本的MIPS流水线85
习题390
第4章向量处理机93
4.1向量的处理方式93
4.2向量处理机的结构95
4.2.1“存储器存储器”结构95
4.2.2“寄存器寄存器”结构95
4.3提高向量处理机性能的常用技术97
4.3.1设置多个功能部件98
4.3.2链接技术98
4.3.3分段开采技术101
4.3.4采用多处理机系统101
4.4向量处理机的性能评价102
4.4.1向量指令的处理时间Tvp102
4.4.2最大性能R∞和半性能向量长度n1/2104
4.4.3向量长度临界值n?瘙經105
4.5向量处理机实例106
4.5.1具有代表性的向量处理机106
4.5.2Cray YMP和C90106
4.5.3NEC SXX44108
习题4108
第5章指令级并行及其开发——硬件方法110
5.1指令级并行的概念110
5.2相关与指令级并行111
5.3指令的动态调度112
5.3.1动态调度的基本思想112
5.3.2记分牌动态调度方法114
5.3.3Tomasulo算法121
5.4动态分支预测技术131
5.4.1采用分支历史表132
5.4.2采用分支目标缓冲器133
5.4.3基于硬件的前瞻执行135
5.5多指令流出技术139
5.5.1基于静态调度的多流出技术140
5.5.2基于动态调度的多流出技术142
5.5.3超长指令字技术145
5.5.4多指令流出处理器受到的限制146
5.5.5超流水线处理机146
习题5149
第6章指令级并行的开发——软件方法151
6.1基本指令调度和循环展开151
6.1.1指令调度的基本方法151
6.1.2循环展开153
6.2跨越基本块的静态指令调度155
6.2.1全局指令调度155
6.2.2踪迹调度157
6.2.3超块调度160
6.3静态多指令流出: VLIW技术161
6.4显式并行指令计算163
6.4.1非绑定分支164
6.4.2谓词执行165
6.4.3前瞻执行167
6.5开发更多的指令级并行170
6.5.1挖掘更多的循环级并行170
6.5.2软流水175
6.6实例: IA64体系结构178
6.6.1IA64的指令格式179
6.6.2IA64的谓词执行机制181
6.6.3IA64的前瞻执行机制183
习题6183
第7章存储系统185
7.1存储系统的层次结构185
7.1.1存储系统的层次结构概述185
7.1.2存储系统的性能参数186
7.1.3三级存储系统187
7.1.4存储层次的4个问题189
7.2Cache的基本知识189
7.2.1基本结构和原理189
7.2.2映像规则190
7.2.3查找方法192
7.2.4Cache的工作过程194
7.2.5替换算法195
7.2.6写策略199
7.2.7Cache性能分析200
7.2.8改进Cache性能202
7.3降低Cache的不命中率203
7.3.1三种类型的不命中203
7.3.2增加Cache块大小205
7.3.3增加Cache的容量206
7.3.4提高相联度206
7.3.5伪相联Cache207
7.3.6硬件预取208
7.3.7编译器控制的预取208
7.3.8编译优化209
7.3.9“牺牲”Cache211
7.4减少Cache的不命中开销212
7.4.1采用两级Cache212
7.4.2让读不命中优先于写215
7.4.3写缓冲合并215
7.4.4请求字处理技术216
7.4.5非阻塞Cache技术216
7.5减少命中时间217
7.5.1容量小、结构简单的Cache217
7.5.2虚拟Cache217
7.5.3Cache访问流水化220
7.5.4踪迹Cache220
7.5.5Cache优化技术总结220
7.6并行主存系统221
7.6.1单体多字存储器222
7.6.2多体交叉存储器222
7.6.3避免存储体冲突226
7.7虚拟存储器228
7.7.1基本概念228
7.7.2快速地址转换技术229
7.7.3页式虚拟存储器实例: 64位Opteron的存储管理229
7.8实例: AMD Opteron的存储器层次结构232
习题7236
第8章输入输出系统239
8.1I/O系统的性能239
8.2I/O系统的可靠性、可用性和可信性240
8.3廉价磁盘冗余阵列241
8.3.1RAID0243
8.3.2RAID1243
8.3.3RAID2244
8.3.4RAID3245
8.3.5RAID4245
8.3.6RAID5246
8.3.7RAID6246
8.3.8RAID10与RAID01247
8.3.9RAID的实现与发展247
8.4总线248
8.4.1总线的设计248
8.4.2总线标准和实例250
8.4.3与CPU的连接251
8.5通道处理机252
8.5.1通道的作用和功能252
8.5.2通道的工作过程253
8.5.3通道种类255
8.5.4通道流量分析257
8.6I/O与操作系统259
8.6.1DMA和虚拟存储器259
8.6.2I/O和Cache数据一致性260
习题8262
第9章互连网络264
9.1互连函数264
9.1.1互连函数的表示方法264
9.1.2几种基本的互连函数265
9.2互连网络的结构参数与性能指标269
9.2.1互连网络的结构参数269
9.2.2互连网络的性能指标270
9.3静态互连网络271
9.4动态互连网络277
9.4.1总线网络277
9.4.2交叉开关网络277
9.4.3多级互连网络279
9.4.4动态互连网络的比较282
9.5消息传递机制283
9.5.1消息寻径方案283
9.5.2死锁与虚拟通道286
9.5.3流控制策略287
9.5.4选播和广播寻径算法291
习题9292
第10章多处理机294
10.1引言294
10.1.1并行计算机系统结构的分类294
10.1.2存储器系统结构和通信机制296
10.1.3并行处理面临的挑战298
10.2对称式共享存储器的系统结构300
10.2.1多处理机Cache一致性300
10.2.2实现一致性的基本方案301
10.2.3监听协议的实现304
10.3分布式共享存储器的系统结构308
10.3.1目录协议的基本思想308
10.3.2目录协议实例311
10.3.3目录的三种结构314
10.4同步316
10.4.1基本硬件原语316
10.4.2用一致性实现锁318
10.4.3同步性能问题320
10.5同时多线程322
10.5.1将线程级并行转换为指令级并行323
10.5.2同时多线程处理器的设计324
10.5.3同时多线程的性能325
10.6大规模并行处理机326
10.6.1并行计算机系统结构326
10.6.2大规模并行处理机328
10.7多核处理器及性能对比331
10.8多处理机实例——Origin 2000336
习题10342
第11章多核架构与编程344
11.1多核架构的需求344
11.1.1功耗与散热问题344
11.1.2并行度问题345
11.1.3应用软件问题346
11.2多核架构346
11.2.1多核的组织架构347
11.2.2多核架构实例348
11.3基于多核的并行程序设计351
11.3.1并行编程模型概述351
11.3.2共享存储模型与消息传递模型352
11.3.3并行语言354
11.3.4并行算法355
11.4多核编程实例355
11.4.1一个简单的OpenMP程序356
11.4.2OpenMP中的排序算法357
习题11 359
第12章机群系统360
12.1机群的基本结构361
12.1.1机群的硬件组成361
12.1.2机群的软件362
12.2机群的特点363
12.3机群的分类364
12.4典型机群系统简介365
12.4.1Berkeley NOW365
12.4.2Beowulf366
12.4.3LAMP366
12.4.4IBM SP2367
12.4.5天河2号368
习题12372
第13章领域专用体系结构373
13.1选择DSA的原因373
13.2DSA的设计原则374
13.3深度神经网络376
13.3.1DNN的神经单元376
13.3.2典型的DNN模型378
13.4张量处理器383
13.5微软Catapult390
习题13399
第14章阵列处理机400
14.1阵列处理机的操作模型和特点400
14.2阵列处理机的基本结构401
14.2.1分布式存储器的阵列机401
14.2.2共享存储器的阵列机402
14.3阵列处理机实例403
14.3.1实例1: Illiac Ⅳ阵列处理机403
14.3.2实例2: BSP计算机406
14.4阵列处理机的并行算法举例410
习题14413
第15章数据流计算机415
15.1数据流计算机的基本原理415
15.1.1数据驱动原理415
15.1.2数据流计算机中指令的执行过程416
15.1.3数据流计算机的指令结构417
15.2数据流程序图和数据流语言417
15.2.1数据流程序图417
15.2.2数据流语言及其性质421
15.3数据流计算机结构422
15.3.1静态数据流计算机422
15.3.2动态数据流计算机424
15.4数据流计算机的评价427
15.4.1数据流计算机的优点427
15.4.2数据流计算机的缺点428
15.4.3数据流计算机设计中需解决的问题429
习题15429
参考文献431
|
內容試閱:
|
FOREWORD
党的二十大报告中指出:教育、科技、人才是全面建设社会主义现代化国家的基础性、战略性支撑。必须坚持科技是第一生产力、人才是第一资源、创新是第一动力,深入实施科教兴国战略、人才强国战略、创新驱动发展战略,这三大战略共同服务于创新型国家的建设。高等教育与经济社会发展紧密相连,对促进就业创业、助力经济社会发展、增进人民福祉具有重要意义。
本书是《计算机系统结构教程》(第3版)(清华大学出版社,2021年)的修订版,是“十二五”普通高等教育本科国家级规划教材。本书的第1版于2011年被评为国家级精品课程教材。为了适应现代教学的需要,反映计算机技术的新发展,我们对该教材进行了修订和补充,并且采用了微课的形式,为本书配备了教学动画和视频。
本书系统地论述了计算机系统结构的基本概念、基本结构、基本方法等,强调从开发并行性的角度、用量化分析(性能评价)的方法研究和分析计算机系统。
全书共有15章,各章内容如下。
第1章论述计算机系统结构的概念以及系统结构和并行性的发展,并介绍定量分析基础。
第2章为指令系统的设计,论述计算机指令系统设计的各个方面,包括指令系统的分类、寻址技术、功能设计、格式设计以及指令系统的发展和改进,并且介绍一种RISC计算机——MIPS的指令系统。
第3章为流水线技术,论述流水线的基本概念、分类和性能分析、非线性流水线的调度,介绍流水线中的相关与冲突问题及其解决方法,并以MIPS为例讨论流水线的实现。
第4章为向量处理机,论述向量处理机的结构和特点、提高向量处理机性能的方法以及向量处理机的性能评价,并介绍了三个向量处理机实例。
第5章和第6章分别论述如何用硬件和软件的方法开发指令级并行。第5章的具体内容包括指令级并行的概念、记分牌和Tomasulo动态调度算法、基于硬件的前瞻执行以及多指令流出技术等。第6章的内容包括循环展开和基本指令调度、跨越基本块的静态指令调度、VLIW技术、显式指令并行执行EPIC等,并介绍一个实例——IA\\|64体系结构。
第7章为存储系统,论述Cache的基本知识、降低Cache不命中率的方法、减少Cache不命中开销的方法以及减少命中时间的方法,并对并行主存和虚拟存储器做简要讨论。最后介绍一个存储层次实例——AMD Opteron的存储器层次结构。
第8章为输入输出系统,论述总线及其与CPU、存储器的连接,通道处理机及其流量分析,并详细论述廉价磁盘冗余阵列RAID。
第9章为互连网络,论述互连函数、互连网络的特性参数、静态互连网络、动态互连网络以及消息传递机制等。
第10章为多处理机,论述对称式共享存储器系统结构、分布式共享存储器系统结构、多Cache一致性、同步、同时多线程以及MPP,并介绍多处理机实例。
第11章为多核架构与编程,论述对多核架构的需求、几种多核架构以及基于多核的并行程序设计。
第12章为机群系统,论述机群的结构、软件模型以及机群的分类,并介绍5个典型的机群系统,包括我国自主研制的天河2号。
第13章为领域专用体系结构,论述DSA的主要特点及应用领域实例等,包括谷歌的TPU以及微软的Catapult等。
第14章为阵列处理机,论述阵列处理机的操作模型、结构和特点以及并行算法,并介绍两个阵列处理机实例。
第15章为数据流计算机,论述数据流计算机模型、数据流程序图和数据流语言、静态数据流计算机结构以及动态数据流计算机结构。
本书的主要特点是:
(1) 取材先进,体系完整,覆盖面广,深度与广度相结合。
(2) 采用微课形式,配有850分钟的教学视频和动画视频。使用它们进行教学或者自学,能达到非常好的教学效果。
(3) 配有基于模拟器的实验(见《计算机系统结构实践教程》(第3版),张晨曦等,清华大学出版社),对于深入理解和掌握本课程内容有很大的帮助。模拟器是编者团队自己开发的,拥有自主版权。
(4) 配有教学(或自学)指导教材《计算机系统结构学习指导与题解》(第2版)(张晨曦等,清华大学出版社)。
(5) 重点突出,可读性好,语言简练,通俗易懂。
(6) 提供教学大纲、教学动画课件和教学PPT课件。
(7) 提供在线题库,包括填空题、单选题、多选题、名词解释、简答题、综合题。资源下载提示
素材(源码)等资源: 扫描目录上方的二维码下载。
在线作业: 扫描封底的作业系统二维码,登录网站在线做题及查看答案。
微课视频: 扫描封底的文泉云盘防盗码,再扫描书中相应章节的视频讲解二维码,可以在线学习。本书的大部分内容由张晨曦教授编写,其余部分的分工为: 沈立教授编写了第6章、第12章和第13章,王志英教授编写了第10章,李江峰副教授编写了第4章和第5章,王伟教授编写了第11章。
本书直接或间接地引用了许多专家和学者的文献或著作,在此向他们表示衷心的感谢。
由于编者水平有限,书中难免有疏漏和不妥之处,敬请读者批评指正。
作者
2023年12月
|
|