新書推薦:
《
月与蟹(青鲤文库)荣获第144届直木奖,天才推理作家经典作品全新译本。一部青春狂想曲,带你登上心理悬疑之巅。
》
售價:NT$
230.0
《
索恩丛书·盛清统治下的太监与皇帝
》
售價:NT$
403.0
《
透过器物看历史(全6册)
》
售價:NT$
2234.0
《
我在台北故宫博物院读名画
》
售價:NT$
500.0
《
尼罗河往事:古埃及文明4000年
》
售價:NT$
347.0
《
一个人·谁也不是·十万人(诺贝尔文学奖得主反思自我的巅峰之作)
》
售價:NT$
250.0
《
重写晚明史(全5册 精装)
》
售價:NT$
3560.0
《
汉末晋初之际政治研究
》
售價:NT$
602.0
|
編輯推薦: |
《流计算和视频编码》由张春元、文梅、苏华友、伍楠、任巨所著,结合课题研究,比较全面地反映了我们在流计算领域,包括流计算原理、视频编码应用、流化方法、基于单指令多数据和GPU的流化实现等方面取得的研究成果,可供并行处理器体系结构、并行编程、视频编码等方向的研究人员参考,也可作为计算机科学与技术等专业高年级本科生和研究生的教材。
|
內容簡介: |
《流计算和视频编码》主要阐述一种众核并行编程思想——流计算思想,并以典型视频编码标准H.264为例,详细论述具有普适性的流化方法。全书共分7章。第1章主要介绍视频编码的基本内容、视频编码并行化的潜力和挑战。第2章介绍流计算的基本原理,包括流计算思想、流体系结构、编程模型和流应用等。第3章详细论述面向媒体处理的流化方法并提出程序结构的优化方法。第4章以H.264编码器为实例,阐述利用流化方法将串行编码器转换为并行流化编码器框架S264。第5章系统地阐述S264框架在SIMD并行处理器上的映射过程和全高清实时的H.264编码器S264S在STORM流处理器上的实现。第6章从多线程执行的角度描述了S264框架在GPU上的实现。第7章从视频编码应用的角度对未来视频编码的发展与基于流计算的并行化研究进行讨论。
《流计算和视频编码》是作者及其研究团队十余年科研经验和成果的总结,可供并行处理器体系结构、并行编程、视频编码等方向的研究人员参考,也可作为计算机科学与技术等专业高年级本科生和研究生的教材。
|
目錄:
|
前言
第1章 视频压缩编码
1.1 概述
1.2 视频压缩编码面临的新挑战
1.3 视频编码并行化潜力
1.4 H.264编码标准
1.4.1 基本概况
1.4.2 编码器结构
1.4.3 特点和关键技术
1.4.4 帧间预测
1.4.5 帧内预测
1.4.6 变换量化
1.4.7 熵编码
1.4.8 去块滤波
第2章 流计算原理
2.1 流计算思想
2.2 流体系结构模型
2.2.1 解耦合计算和访存
2.2.2 多级存储层次
2.2.3 典型流处理器
2.3 流程序设计模型
2.3.1 流级程序
2.3.2 核心级程序
2.3.3 流计算模型与并行处理器的结合
2.4 流应用
第3章 流化方法
3.1 流化
3.1.1 流化定义
3.1.2 流化特征
3.1.3 特征指标有效性验证
3.2 基本流化方法
3.2.1 循环划分法
3.2.2 核心合并技术
3.2.3 流分割技术
3.2.4 常规流化步骤
3.3 高级流化方法
3.3.1 流重组
3.3.2 短流加载
3.3.3 核心分裂
3.3.4 并行粒度调整
3.4 面向流化的程序结构优化
3.4.1 重负载循环
3.4.2 计算窗口重叠
3.4.3 循环内分支
3.4.4 循环间数据相关
第4章 H.264编码器的流化
4.1 x264编码器概述
4.2 x264编码器结构剖析
4.2.1 profile工具:PAPI
4.2.2 函数层次的局限性
4.2.3 变量和数据结构层次的局限性
4.2.4 控制密集型组件层次的局限性
4.3 x264编码程序的流化
4.3.1 函数到Kernel的转化
4.3.2 结构变量到stream的转化
4.3.3 控制密集型组件到计算密集型组件的转化
4.4 S264:流化的H-264框架
第5章 S264/S:基于SIMD并行的H.264流化编码器
5.1 SIMD流处理器
5.2 帧间预测的流式实现
5.2.1 全搜索:流重用
5.2.2 UMHexagonS:非规则流
5.2.3 多分辨率多窗口帧间预测
5.2.4 分析与讨论
5.3 帧内编码:多模式和强数据相关
5.3.1 相关性分析
5.3.2 相关性问题:可扩展块并行
5.3.3 多模式问题:Kernel参数化
5.3.4 分析与讨论
5.4 CAVLC的流式实现:可变长编码
5.4.1 相关性分析
5.4.2 解耦合分段并行
5.4.3 分析与讨论
5.5 去块滤波的流式实现:控制密集型
5.5.1 相关性分析
5.5.2 去块滤波的流式实现:分组并行
5.5.3 分析与讨论
5.6 基于STORM的SIMD H.264编码器
5.6.1 S264./S编码器
5.6.2 评测与分析
第6章 S264/G:基于GPU的并行H.264编码器
6.1 GPU和CUDA
6.1.1 GPU概述
6.1.2 CUDA硬件模型
6.1.3 CUDA编程模型
6.1.4 CUDA存储模型
6.2 基于CUDA的H.264编码器框架
6.3 帧间预测:平衡线程数与并行粒度
6.3.1 SAD计算
6.3.2 最佳运动向量的选择
6.3.3 小结
6.4 帧内编码:开发多级并行
6.4.1 开发多级并行
6.4.2 存储模型
6.4.3 优化
6.4.4 小结
6.5 分量优先的CAVLC
6.5.1 分量优先的CAVLC体系结构
6.5.2 基于CUDA的并行CAVLC实现
6.5.3 小结
6.6 方向优先的去块滤波
6.6.1 方向优先去块滤波结构
6.6.2 滤波顺序的调度
6.6.3 小结
6.7 实验结果与性能分析
6.7.1 并行编码器的性能
6.7.2 编码器特征分析
6.7.3 小结
第7章 展望与未来的研究方向
7.1 视频编码发展趋势
7.1.1 基于内容的视频编码
7.1.2 多视角视频编码
7.1.3 分布式视频编码
7.2 三维视频编码流化并行研究
7.3 面向媒体的并行计算
参考文献
|
|