新書推薦:
《
不被他人左右:基于阿德勒心理学的无压力工作法
》
售價:NT$
301.0
《
SDGSAT-1卫星热红外影像图集
》
售價:NT$
2030.0
《
股市趋势技术分析(原书第11版)
》
售價:NT$
1010.0
《
汉匈战争全史
》
售價:NT$
454.0
《
恶的哲学研究(社会思想丛书)
》
售價:NT$
500.0
《
当你沉默时(悬疑推理 反PUA 反家暴 女性独立小说,揭秘情感PUA的真相,女性自我救赎的文学典范)
》
售價:NT$
255.0
《
不止江湖
》
售價:NT$
449.0
《
天才留步!——从文艺复兴到新艺术运动(一本关于艺术天才的鲜活故事集,聚焦艺术史的高光时刻!)
》
售價:NT$
704.0
|
內容簡介: |
本书遵循循序渐进、深入浅出的理念,引领读者夯实相关基础知识,掌握传统目标检测方法,再逐步过渡到深度学习的基本概念及分类用法,进而深入讲解目标检测的两阶段深度学习方法、一阶段学习方法,即从以R-CNN为代表的两阶段深度学习方法、以YOLO系列为代表的一阶段学习方法等,层层揭开深度学习用于目标检测的“神秘面纱”,探究其中的奥秘。本书适合目标检测领域的工程师、研究员阅读,也可作为深度学习相关专业本科生、研究生的重要参考书,还可作为互联网行业IT技术人员转型学习人工智能的参考用书。
|
關於作者: |
翟中华,清华大学硕士,曾就职于中国银行总行信息科技部等,2018开始创立AI火箭营,担任北京洪策元创智能科技有限公司CEO,获软件设计师国家级证书,在计算机视觉、深度学习、机器学习等方向已有多本著作出版。
|
目錄:
|
第1章 计算机视觉及目标检测11.1 计算机视觉原理11.1.1 人类视觉与计算机视觉比较11.1.2 计算机视觉应用展现21.2 目标检测概述91.2.1 计算机视觉三大主要任务91.2.2 目标检测的应用111.2.3 目标检测面临的挑战121.2.4 目标检测方法13第2章 计算机视觉数学、编程基础152.1 向量、矩阵和卷积152.1.1 向量152.1.2 矩阵162.1.3 卷积162.2 函数极值理论与非极大值抑制182.2.1 函数极值理论192.2.2 非极大值抑制212.3 跨平台计算机视觉和机器学习软件库OpenCV 基础242.3.1 OpenCV的历史起源242.3.2 安装OpenCV242.3.3 OpenCV图像和视频的读/写242.3.4 OpenCV基本操作282.3.5 OpenCV颜色空间转换292.3.6 OpenCV几何变换312.3.7 OpenCV图像简单阈值处理342.3.8 OpenCV形态学转换402.3.9 OpenCV图像梯度432.4 PyTorch基础462.4.1 PyTorch简介462.4.2 PyTorch安装472.4.3 张量472.4.4 基本代码操作492.4.5 PIL图像格式转换512.4.6 PyTorch自动求导机制522.4.7 PyTorch的神经网络nn包55第3章 OpenCV目标检测实战603.1 Haar特征与积分图像构建算法603.1.1 Haar特征603.1.2 积分图像构建算法653.2 AdaBoost应用于Haar人脸特征分类663.3 AdaBoost级联应用于Haar特征人脸检测703.4 利用OpenCV进行基于Haar特征的人脸检测实战73第4章 深度学习引入及图像分类实战754.1 卷积神经网络的重要概念754.2 卷积神经网络训练技巧及经典架构794.3 设计卷积神经网络进行图像分类824.4 选择卷积神经网络损失函数及优化器854.5 改进卷积神经网络以提高图像分类准确率88第5章 目标检测的两阶段深度学习方法905.1 R-CNN目标检测思想905.1.1 目标检测数据集915.1.2 从滑动窗口到选择搜索915.1.3 R-CNN网络架构及训练过程935.2 目标检测指标——二分类器975.3 R-CNN目标检测模型评估结果1005.3.1 R-CNN用于细粒度类别检测1085.3.2 R-CNN用于目标检测与分割1095.4 R-CNN的缺陷和Fast R-CNN的改进1105.4.1 R-CNN的缺陷1105.4.2 感兴趣区域池化1115.4.3 Fast R-CNN创新损失函数设计1135.5 Fast R-CNN网络架构和模型评估1155.5.1 Fast R-CNN模型工作流程1155.5.2 Fast R-CNN网络架构1165.5.3 RoI池化反向传播方法1165.5.4 Fast R-CNN结果评估1175.6 Fast R-CNN的创新1185.6.1 Faster R-CNN的创新思想1185.6.2 替代选择搜索的锚框1195.6.3 区域建议网络1205.7 深入剖析Faster R-CNN中边界框回归1235.7.1 为什么使用边界框回归1245.7.2 边界框回归的数学支撑1255.8 Faster R-CNN的全景架构和损失函数1275.9 Faster R-CNN的训练步骤及测试步骤1295.9.1 Faster R-CNN的训练步骤1295.9.2 Faster R-CNN的测试步骤1315.10 详细讲解Faster R-CNN关键部分RoI代码132第6章 目标检测的一阶段学习方法1346.1 YOLO目标检测思想1356.1.1 改进思想1366.1.2 网格单元1376.1.3 YOLO创新细节1386.2 YOLO的网络结构、网络与损失函数1406.2.1 YOLO的网络结构1406.2.2 YOLO的网络训练与损失函数1426.3 YOLO模型评估、优劣势分析1446.3.1 YOLO数据集1456.3.2 YOLO模型评估1456.3.3 YOLO模型优缺点1466.4 YOLOv2实现更好、更快、更强1496.5 YOLOv2改进YOLOv1——更好1496.5.1 批归一化1506.5.2 高分辨率分类器1506.5.3 预设锚框并采用全卷积1506.5.4 框聚类1516.5.5 约束边框位置1536.5.6 细粒度特征1546.5.7 多尺度训练1546.5.8 实验对比1566.6 YOLOv2 使用Darknet-19——更快1586.6.1 Darknet-191586.6.2 三阶段训练1596.6.3 YOLOv2的损失函数1616.7 使用WordTree的YOLO9000——更强1646.7.1 组合两种数据集的必要性1646.7.2 构建WordTree进行分层分类1656.7.3 在组合数据集上训练YOLO9000167第7章 YOLOv3创新思想及整体架构1707.1 YOLOv3的创新改进1707.2 YOLOv3的关键创新点1717.2.1 106层的Darknet-53主干网络架构1717.2.2 三级检测1767.2.3 更擅长检测较小的物体1777.2.4 更多的锚框1777.2.5 损失函数1787.3 YOLOv3的三级检测输出过程1797.4 YOLOv3的非极大值抑制1837.5 YOLOv3的检测效果1847.6 SSD多尺度特征图目标检测思想1857.7 SSD网络架构1917.7.1 SSD网络基础架构1917.7.2 扩张卷积1927.7.3 SSD与YOLOv31937.7.4 SSD网络检测物体方法1937.8 SSD网络损失函数1947.8.1 默认框匹配策略1947.8.2 损失函数1957.9 SSD较YOLOv3的劣势196第8章 构建Darknet-53网络实践1988.1 Darknet-53网络工程结构和配置1988.2 实践代码2008.3 构建Darknet-53网络前向传递过程2038.3.1 构建Darknet-53的模块2038.3.2 Darknet-53的模块详解2058.4 YOLOv3 实现检测层特征图到边界的预测值转变2098.4.1 参数讲解2098.4.2 实现步骤和代码2108.5 YOLOv3 演示边框生成过程2128.6 YOLOv3 处理低阈值边框2148.6.1 思路讲解2158.6.2 代码实践2158.7 YOLOv3 非极大值抑制过程2188.7.1 延续上一节代码讲解NMS过程2198.7.2 NMS后的整理2208.8 YOLOv3演示NMS过程找到最优框2208.8.1 运行检测代码演示2208.8.2 运行结果分析2218.9 YOLOv3实现工业工具检测2248.9.1 YOLOv3工业实践需求分析及目标分析2258.9.2 数据采集标注与数据预处理部分2268.9.3 模型训练部分2308.9.4 模型优化部分239第9章 YOLOv4目标检测方法2409.1 YOLOv4目标检测创新路径及技巧体系2409.1.1 速度与精度双提升2409.1.2 YOLOv4技巧汇总2409.2 YOLOv4大型网络架构及其主要创新改进2469.2.1 空间金字塔结构2469.2.2 路径增强网络2479.2.3 使用YOLOv4的网络详情2489.2.4 CSPDarknet-53网络2549.2.5 YOLOv4网络全景关系2559.3 YOLOv4中的激活函数2569.3.1 各激活函数的比较2569.3.2 keras实现三种激活函数性能比较2609.4 YOLOv4中的损失函数C-IoU2639.4.1 L1和L2损失的缺陷2649.4.2 IoU和IoU损失2649.4.3 G-IoU、D-IoU和C-IoU2659.5 YOLOv4中的新型批标准化2689.5.1 各种批标准化2689.5.2 跨迭代标准化270第10章 EfficientDet目标检测方法27210.1 复合缩放27210.2 双向特征金字塔网络27410.3 EfficientDet体系结构27610.3.1 输入图像分辨率缩放27610.3.2 BiFPN缩放27710.3.3 框/类预测网络缩放27710.3.4 主干网27710.4 EfficientDet推理效果和不足之处27910.4.1 EfficientDet推理效果27910.4.2 EfficientDet不足之处282参考文献284
|
|