新書推薦:
《
村上春树·旅(一本充满村上元素的旅行指南,带你寻访电影《挪威的森林》拍摄地,全彩印刷;200余幅摄影作品)
》
售價:NT$
301.0
《
智能驾驶硬件在环仿真测试与实践
》
售價:NT$
709.0
《
都铎王朝时期英格兰海事法庭研究
》
售價:NT$
398.0
《
中年成长:突破人生瓶颈的心理自助方案
》
售價:NT$
296.0
《
维奥莱塔:一个女人的一生
》
售價:NT$
347.0
《
商业银行担保管理实务全指引
》
售價:NT$
658.0
《
信风万里:17世纪耶稣会中国年信研究(全二册)
》
售價:NT$
811.0
《
青铜之美 国宝里的中式美学
》
售價:NT$
806.0
|
編輯推薦: |
《OpenCL异构计算》编著者 Benedict R.Gaster、Lee
Howes、David、R.Kaeli、 Perhaad Mistry、Dana Schaa 。
本书可帮助学生和研究人员更好地理解通用异构计算尤其是opencl提供的解决方案,尤其是适合不同经验水平的学生,可以作为opencl课程的教材或其他课程的参考,例如并行编程课程和高级课程。
|
內容簡介: |
《OpenCL异构计算》编著者 Benedict R.Gaster、Lee
Howes、David 、R.Kaeli、 Perhaad Mistry、Dana Schaa 。
《opencl异构计算》提供opencl的第一手资料,详尽阐述了如何在异构环境下进行并行编程。第1章首先介绍如何在并行系统下编程,定义异构编程需要理解的概念。第2~4章循序渐进地介绍opencl的基本架构。第5章和第6章对这些概念加以扩展,旨在帮助读者更好地理解。第7~10章提供4
个更复杂的案例学习,让读者理解到opencl具有广泛的应用。第11~13章锁定高级主题展开讨论。本书可帮助学生和研究人员更好地理解通用异构计算尤其是opencl提供的解决方案,尤其是适合不同经验水平的学生,可以作为opencl课程的教材或其他课程的参考,例如并行编程课程和高级课程。
|
目錄:
|
第一章 并行编程入门
引言
opencl
本书目标
并行思维
并发编程模型和并行编程模型
线程和共享内存
消息传递通信
不同的并行粒度
数据共享和同步
本书结构
参考文献
扩展阅读和相关网站
第二章 opencl简介
引言
opencl标准
opencl 规范
kernel和opencl执行模型
平台和设备
主机-设备交互
执行环境
上下文
命令队列
事件
内存对象
flush命令和finish命令
新建一个opencl程序对象
opencl的kernel
内存模型
编写kernel
向量相加实例的完整代码
小结
参考文献
第三章 opencl设备架构
引言
硬件权衡
性能随频率的提升及其限制
超标量执行
vliw
simd和向量处理
硬件多线程
多核架构
集成:片上系统和apu
高速缓存层次和内存系统
架构设计空间
cpu设计
gpu体系结构
apu和类apu的设计
小结
参考文献
第四章 opencl基本实例
引言
应用实例
简单的矩阵相乘
图像卷积实例
小结
第五章 opencl的并发与执行模型
引言
kernel,work_item,workgroup和
执行域
opencl同步:kernel,fence和barrier
队列与全局同步
opencl内存一致性 事件
命令barrier与marker
主机端内存模型
buffer对象
image对象
设备端内存模型
设备端宽松的内存一致性
全局内存
本地内存
常量内存
私有内存
小结
第六章 opencl在cpugpu
平台上的实现
引言
opencl在amd phenom ii x上的
实现
opencl在amd radeon hd
gpu上的实现
多线程和内存系统
基于clause的simd执行
资源分配
opencl的内存性能
opencl全局内存
本地内存——软件管理的cache
小结
参考文献
第七章 opencl案例学习:卷积
引言
计算卷积的kernel
选择合适的workgroup大小
将数据缓存到本地内存
执行卷积
小结
代码清单
主机端代码
kernel代码
参考文献
第八章 opencl案例学习:
视频处理
引言
获得视频帧
cpu上的解码
在gpu上解码视频
在opencl中处理一个视频
在多个视频上处理多个不同effect
事件链
最终输出显示到屏幕
openclopengl协同工作能力
小结
第九章 opencl案例学习:直方图
引言
选择适量的work-group
选择最优的work-group大小
全局内存访存优化
使用原子操作计算局部直方图
本地内存访存优化
局部直方图的规约
全局规约
完整的kernel代码
性能和小结
第十章 opencl案例学习:
混合粒子模拟
引言
计算概览
gpu实现
创建buffer
构造加速结构
计算碰撞
合成
cpu实现
负载均衡
性能和小结
生成均匀网格的kernel代码
粒子模拟的kernel代码
第十一章 opencl扩展
引言
扩展机制概览
设备拆分
双精度
参考文献
第十二章 opencl的性能剖析和
调试
引言
基于事件的剖析
amd app profiler
收集opencl程序轨迹
收集opencl gpu kernel性能
计数器
amd app kernelanalyzer
演示amd app profiler
启动amd app profiler
使用应用程序的轨迹数据
以发现性能瓶颈
使用gpu性能计数器发现kernel的
性能瓶颈
调试opencl应用程序
gdebugger概览
使用gdebugger调试并行opencl
应用程序
amd printf扩展
小结
第十三章 webcl
引言
框架设计
webcl 实验性实现
firefox扩展
连接javascript和opencl
webcl动手练习
web照片编辑器
讨论
小结
参考文献
扩展阅读和相关网站
索引
|
|