新書推薦:
《
电影导演安东尼奥尼:一位有远见的诗人
》
售價:NT$
449.0
《
殷墟甲骨:从安阳走向世界的中国名片
》
售價:NT$
230.0
《
斫琴法
》
售價:NT$
592.0
《
大匠天工:样式雷笔下的皇家园林
》
售價:NT$
449.0
《
探知无界·气候变化的危机与应对 北大名师讲科普系列
》
售價:NT$
245.0
《
中国文化第一课·典籍里的礼
》
售價:NT$
296.0
《
思想的光照:马寅初先生诞辰140周年纪念文集
》
售價:NT$
398.0
《
入门级AI机器人制作与图形化编程
》
售價:NT$
347.0
|
編輯推薦: |
本书面向对视频行为分析感兴趣的学生和研究人员。阅读本书需要具备一定的高等代数、线性代数、概率论、图像处理、机器学习、深度学习等方面的基础知识。对于本科生而言需要补充图像处理、机器学习、深度学习等知识后阅读本书。
|
內容簡介: |
本书较为全面的介绍了行为定义、人体关键点检测、三维人体网格重建、行为识别、行为检测、人-物交互、应用实例。
本书从实际应用出发,以模式识别、机器学习、深度学习等理论为基础,开展了一系列创新性的研究,并针对行为数据提取、行为特征提取、行为识别检测等方面给出了相应的解决方案。
本书面向对视频行为分析感兴趣的学生和研究人员。阅读本书需要具备一定的高等代数、线性代数、概率论、图像处理、机器学习、深度学习等方面的基础知识。对于本科生而言需要补充图像处理、机器学习、深度学习等知识后阅读本书。
|
關於作者: |
徐晓刚,博士,1967年生。之江实验室人工智能研究院研究员。研究方向:信号处理,视频分析。先后主持完成国家重大专项子课题、国家自然科学基金、军队重大专项等项目20余项,发表论文100多篇,曾任多项国家重大专项专家组成员,主持研发的可视化产品和视频分析产品已经应用于百余家单位。
|
目錄:
|
第1章深度学习基础知识
1.1深度学习的发展历程
1.2卷积神经网络
1.2.1卷积层
1.2.2池化层
1.2.3全连接层
1.2.4激活函数
1.2.5损失函数
1.2.6Dropout
1.2.7数据预处理
1.2.8批归一化
1.2.9优化方法
1.3代表性网络架构
1.3.1LeNet
1.3.2AlexNet
1.3.3GoogLeNet
1.3.4VGGNet
1.3.5ResNet
1.3.6DenseNet
1.3.7LSTM
1.3.8GAN
1.4深度学习框架
1.4.1Caffe
1.4.2PyTorch
1.4.3TensorFlow
1.4.4Theano
1.4.5MXNet
1.4.6PaddlePaddle
1.4.7MindSpore
1.4.8之江天枢人工智能开源平台
第2章超分辨重建技术
2.1引言
2.2超分辨重建技术简介
2.3超分辨数据集
2.4超分辨质量评价方法
2.5有监督超分辨技术
2.5.1超分辨主流框架
2.5.2典型的超分辨网络结构
2.5.3损失函数设计
2.6无监督超分辨技术
2.6.1零样本超分辨
2.6.2弱监督超分辨
2.7特定领域超分辨技术
2.7.1深度图像超分辨重建
2.7.2人脸超分辨重建
2.7.3视频超分辨重建
2.8超分辨未来发展趋势
第3章目标检测
3.1引言
3.2目标检测常用数据集及评价指标
3.2.1常用目标检测数据集
3.2.2常用目标检测评价指标
3.3传统目标检测算法
3.4基于深度学习的双阶目标检测算法
3.4.1双阶目标检测网络发展历程
3.4.2双阶目标检测网络的样本不平衡处理方法
3.5基于深度学习的单阶目标检测算法
3.5.1单阶目标检测网络发展历程
3.5.2单阶目标检测网络关键技术
3.5.3基于Anchor-free的新型检测技术
3.6目标检测难点与前沿问题
3.6.1域自适应目标检测
3.6.2基于小样本学习的目标检测
3.6.3基于零样本学习的目标检测
3.7目标检测应用场景与展望
3.7.1目标检测在安防领域的应用
3.7.2目标检测在军事领域的应用
3.7.3目标检测在医学领域的应用
3.7.4目标检测在交通领域的应用
第4章视频多目标跟踪
4.1引言
4.1.1单目标跟踪简介
4.1.2多目标跟踪研究的背景与意义
4.1.3多目标跟踪的评价指标
4.2经典的传统多目标跟踪技术
4.2.1基于轨迹预测的多目标跟踪算法
4.2.2基于数据关联的多目标跟踪算法
4.3基于深度学习的多目标跟踪技术
4.3.1基于深度学习的特征提取与运动预测
4.3.2检测与跟踪融合的深度学习网络
4.4多目标跟踪技术的未来展望
第5章跨镜行人重识别
5.1引言
5.2基于局部特征的Re-ID方法
5.2.1图像切块的方法
5.2.2利用人体姿态估计的方法
5.2.3人体部位对齐的方法
5.3基于表征学习的Re-ID方法
5.3.1基于注意力机制的方法
5.3.2引入行人属性特征的多任务学习方法
5.3.3基于图像分割的方法
5.4跨域迁移
5.4.1基于弱监督学习的方法
5.4.2基于无监督学习的方法
5.4.3基于GAN的方法
5.5基于视频序列的Re-ID方法
5.5.1利用运动信息建模的方法
5.5.2利用时序信息建模的方法
5.5.33D卷积建模方法
5.6基于造图的Re-ID方法
第6章行为分析
6.1引言
6.2人体关键点检测
6.2.1背景
6.2.2研究难点
6.2.3数据集和评价标准
6.2.4传统方法
6.2.5基于深度学习的方法
6.3行为识别
6.3.1背景
6.3.2研究难点
6.3.3数据集介绍
6.3.4传统方法iDT
6.3.5深度学习方法
6.4行为检测
6.4.1背景
6.4.2研究难点
6.4.3数据集介绍
6.4.4基于深度学习的方法
6.5本章小结
第7章基于视频分析的生理信号的检测
7.1引言
7.2光电容积脉搏波
7.2.1传统的PPG波形特征及检测原理
7.2.2基于视频的rPPG检测原理
7.3基于视频PPG信号的心率检测
7.3.1PPG信号计算心率背景
7.3.2心率相关信号预处理
7.3.3心率计算方法
7.4基于视频PPG信号的血压检测
7.4.1PPG信号计算血压原理
7.4.2血压计算方法
7.5基于视频PPG信号的血糖监测
7.5.1基于视频监测血糖的原理
7.5.2血糖相关信号处理及特征提取
7.5.3血糖计算方法
第8章卷积神经网络模型压缩与加速
8.1引言
8.2模型剪枝
8.2.1非结构化剪枝
8.2.2结构化剪枝
8.3模型量化
8.4知识蒸馏
8.5其他压缩与加速技术
8.5.1低秩分解
8.5.2简洁结构设计
8.5.3神经网络架构搜索
第9章非配合环境下视频智能分析算法平台
9.1引言
9.1.1视频智能分析算法与平台功能
9.1.2视频分析相关标准
9.2视频智能分析算法库
9.2.1视频智能分析算法库架构
9.2.2视频智能分析算法工程化实现
9.2.3视频智能分析算法验证方法
9.3基于微云的视频智能分析平台架构设计
9.3.1Kubernetes微云系统设计
9.3.2资源调度策略
9.3.3存储与管理策略
9.3.4服务部署策略
9.4视频智能分析算法平台系统
9.4.1视频智能分析算法平台人机界面
9.4.2视频智能分析算法平台操作流程
参考文献
中英文术语对照
|
內容試閱:
|
得益于深度学习技术的快速发展以及计算能力和数据的爆发式增长,近些年来人工智能领域迈入了蓬勃发展的时期,并在人脸识别、城市智能交通管理、智慧医疗等诸多领域取得了令人瞩目的成果。其中,视频内容智能分析作为人工智能领域的重要组成部分,在智慧城市的建设中有着极大的应用价值,得到了业界广泛的关注。本书重点涵盖了视频内容智能分析相关技术,旨在帮助人工智能相关方向的学生、技术人员及兴趣爱好者们更好地了解和掌握其中涉及的理论知识,并能够进行深入的应用实践。
视频内容智能分析涉及的内容十分广泛,本书将重点介绍其中的超分辨率重建、目标检测及跟踪、跨镜行人重识别、行为及生理信号分析等方面,并对作者团队在这些技术的基础上所开发的“非配合环境下视频智能分析算法与平台”进行具体讲解。这些核心技术的背后有着诸多经典的机器学习方法和深度学习理论,考虑到这些理论所涉及的专业知识对初学者来说具有一定的困难,本书试图尽可能避免复杂的数学证明和推导,在每章中尽量采用相对通俗易懂的语言来描述具体的应用背景和技术原理。此外,本书还开源了部分实战案例的代码,希望将理论与实践相结合,以更好地让读者理解并掌握其中的技术实现细节。
本书从视频内容智能分析的研究和应用背景开始讲起,然后逐步延伸到其中涉及的几大重要方向,并有选择性地对各个方向的经典思想、技术路线以及最新的方法进行深入介绍。本书紧密结合学术及业界的技术前沿,通过由浅入深、图文并茂的方式,完整地剖析了传统经典理论及深度学习方法在视频内容智能分析领域中各个维度的重要成果,而不仅仅停留在简单的理论阐述和结果展示上。
具体地,本书从以下几个方面来阐述视频内容智能分析技术。
第1章概述了视频内容智能分析的研究背景、常用数据集以及代表性的模型训练策略,让读者对本书内容有一个初步的了解。
第2章介绍了视频超分辨重建技术,包括问题定义、现有基于深度学习方法的超分辨简介,并对未来的超分辨技术发展方向进行了探讨。
第3章分析了视频目标检测所涉及的关键技术和应用场景,并对其中的挑战性问题进行了总结。
第4章讲解了视频中的多目标跟踪技术,包括现有技术方法的类型、存在的问题以及技术发展趋势等。
第5章着眼于跨镜行人重识别,对基于局部特征、表征学习、跨域迁移、视频序列和图论的行人重识别理论和实践案例进行了详细介绍。
第6章探讨了人体行为分析的相关技术,从研究背景和难点问题出发,循序渐进地展现了行为识别和行为检测等技术的发展路线和未来方向。
第7章呈现了基于视频分析的生理信号检测技术,以光电容积脉搏波理论为基础重点介绍基于视频的非接触式人体心率、血压、血糖等生理信号的捕获及分析。
第8章介绍了卷积神经网络模型的压缩与加速技术,重点叙述主流的模型剪枝、模型量化、知识蒸馏等方法,并简要讲解了其他压缩与加速方法。
第9章在前述章节技术的基础上,对作者团队所开发的“非配合环境下视频智能分析算法与平台”进行了详细的介绍,旨在让读者对视频内容智能分析各项技术的实战应用及架构设计有更加深入的理解。
本书工作得到了之江实验室重大项目(2019KD0AC02)和国家自然科学基金(62103380)的支持,之江实验室与浙江工商大学智能视觉团队成员参与了编写,包括孙立剑、唐乾坤、章依依、徐芬、张逸、张文广、贺菁菁、吴翠玲、李玲、李悦、魏日令、王小龙、曹卫强、何鹏飞、王军、徐冠雷、张锦明、陈少辉等。本书在编写过程中得到了领域内深耕多年的学者和工业界资深工程师们的指导和帮助,经过深刻的讨论和完善,本书从理论到实战的不同层面都有了极大的升华,能够满足不同人群的实际需求。但考虑到本书所涉及的智能分析技术内容庞杂、发展日新月异,且作者才疏学浅,书中难免有不当之处,恳请读者批评指正,不胜感激。
作者
2023年12月12日于杭州
|
|