新書推薦:
《
人体使用手册3:自愈力的逻辑(全面解读身体面对疾病时的反应逻辑,学习更多有效的系列家庭按摩)
》
售價:NT$
281.0
《
素描简史:从文艺复兴到现代艺术
》
售價:NT$
1989.0
《
智慧宫丛书028·神工智能 诸神与古代世界的神奇造物
》
售價:NT$
398.0
《
街头健身训练指南
》
售價:NT$
1214.0
《
留学早规划
》
售價:NT$
347.0
《
文化的演化:民众动机正在重塑世界
》
售價:NT$
403.0
《
布鲁克林有棵树(孩子喜欢的阅读经典读本 基于真实生活的全球经典成长小说 走出成长困境 追逐梦想 人生励志 自我塑造小说)
》
售價:NT$
347.0
《
构建未来教育图景:实践以学生为中心的育人模式
》
售價:NT$
398.0
|
編輯推薦: |
图像处理作为人工智能领域的重要分支,正在给我们的世界带来翻天覆地的变化。而在深度学习的引领下,图像处理技术正迎来全面升级!
《基于深度学习的图像处理与实践》将带您进入图像视觉技术的精彩世界,从基本概念一直深入到高级应用,涵盖了图像处理、图像增强、目标检测、人脸识别等多个方面。无论是初学者,还是有一定基础的读者,都可以通过本书逐步掌握图像处理与分析的核心技术。让您不仅能够掌握基本原理,更能够运用于实际项目中。
《基于深度学习的图像处理与实践》还为读者提供了丰富的学习资源,主要有视频讲解、PPT课件,以及书中案例源代码,可通过扫描书中二维码获取。
|
內容簡介: |
《基于深度学习的图像处理与实践》循序渐进、深入浅出地讲解了基于深度学习的图像处理的核心知识,并通过具体实例演示了开发深度学习图像处理程序的方法和流程。全书共 14 章,分别讲解了图像识别技术基础,scikit-image数字图像处理,OpenCV 图像视觉处理,dlib机器学习和图像处理,face_recognition人脸识别,采样、变换和卷积处理,图像增强,图像特征提取,图像分割,目标检测,图像分类,国内常用的第三方人脸识别平台,斗转星移换图系统,智能OCR文本检测识别系统等内容。本书语言简洁而不失技术深度,内容全面。
《基于深度学习的图像处理与实践》适用于已经了解了Python语言基础语法,想进一步学习机器学习、深度学习、计算机视觉与图像处理技术的读者,还可以作为大专院校相关专业的师生用书和培训机构的专业性教材。
|
關於作者: |
王卓,华中科技大学计算机硕士。从事深度学习相关工作,擅长前沿人工智能算法的原理分析和应用落地,擅长计算机视觉、自然语言处理等方向的技术, 先后参与并负责了多个深度学习算法在不同场景的业务落地。目前主要负责电商场景下预训练语言模型的研发以及舆情风险的智能识别与治理。
|
目錄:
|
第1章 图像识别技术基础 1
1.1 图像识别概述 2
1.1.1 什么是图像识别 2
1.1.2 图像识别的发展阶段 2
1.1.3 图像识别的应用 3
1.2 图像识别的过程 4
1.3 图像识别技术 4
1.3.1 人工智能 5
1.3.2 机器学习 5
1.3.3 深度学习 6
1.3.4 基于神经网络的图像识别 6
1.3.5 基于非线性降维的图像识别 7
第2章 scikit-image数字图像处理 9
2.1 scikit-image基础 10
2.1.1 安装scikit-image 10
2.1.2 scikit-image中的模块 10
2.2 显示图像 11
2.2.1 使用skimage读入并显示外部图像 11
2.2.2 读取并显示外部灰度图像 12
2.2.3 读取并显示内置星空图片 13
2.2.4 读取并保存内置星空图片 14
2.3 常见的图像操作 14
2.3.1 对内置图片进行二值化操作 15
2.3.2 对内置图片进行裁剪处理 16
2.3.3 将RGB图转换为灰度图 17
2.3.4 使用skimage实现绘制图片功能 18
2.3.5 使用subplot()函数绘制多视图窗口 19
2.3.6 改变指定图片的大小 21
2.3.7 使用函数rescale()缩放图片 22
2.3.8 使用函数rotate()旋转图片 22
第3章 OpenCV图像视觉处理 25
3.1 OpenCV基础 26
3.1.1 OpenCV和OpenCV-Python介绍 26
3.1.2 安装OpenCV-Python 26
3.2 OpenCV-Python图像操作 27
3.2.1 读取并显示图像 27
3.2.2 保存图像 29
3.2.3 在Matplotlib中显示图像 30
3.2.4 绘图 31
3.2.5 将鼠标作为画笔 34
3.2.6 调色板程序 36
3.2.7 基本的属性操作 37
3.3 OpenCV-Python视频操作 40
3.3.1 读取视频 40
3.3.2 播放视频 41
3.3.3 保存视频 42
3.3.4 改变颜色空间 43
3.3.5 视频的背景分离 45
第4章 dlib机器学习和图像处理 49
4.1 dlib介绍 50
4.2 dlib基本的人脸检测 50
4.2.1 人脸检测 50
4.2.2 使用命令行进行人脸识别 52
4.2.3 检测人脸关键点 54
4.2.4 基于CNN的人脸检测器 56
4.2.5 在摄像头中识别人脸 58
4.2.6 人脸识别验证 59
4.2.7 全局优化 60
4.2.8 人脸聚类 62
4.2.9 抖动采样和增强 64
4.2.10 人脸和姿势采集 65
4.2.11 物体追踪 66
4.3 SVM分类算法 67
4.3.1 二进制SVM分类器 68
4.3.2 Ranking SVM算法 69
4.3.3 Struct SVM多分类器 72
4.4 自训练模型 75
4.4.1 训练自己的模型 75
4.4.2 自制对象检测器 78
第5章 face_recognition人脸识别 83
5.1 安装face_recognition 84
5.2 实现基本的人脸检测 84
5.2.1 输出显示指定人像人脸特征 84
5.2.2 在指定照片中识别标记出人脸 86
5.2.3 识别出照片中的所有人脸 88
5.2.4 判断照片中是否包含某个人 91
5.2.5 识别出照片中的人是谁 92
5.2.6 摄像头实时识别 93
5.3 深入face_recognition人脸检测 98
5.3.1 检测用户眼睛的状态 99
5.3.2 模糊处理人脸 101
5.3.3 检测两个人脸是否匹配 102
5.3.4 识别视频中的人脸 103
5.3.5 网页版人脸识别器 106
第6章 采样、变换和卷积处理 109
6.1 采样 110
6.1.1 最近邻插值采样 110
6.1.2 双线性插值 112
6.1.3 双立方插值 116
6.1.4 Lanczos插值 118
6.2 离散傅里叶变换 119
6.2.1 为什么使用DFT 119
6.2.2 用库NumPy实现DFT 120
6.2.3 用库SciPy实现DFT 121
6.2.4 用快速傅里叶变换算法计算DFT 122
6.3 卷积 124
6.3.1 为什么需要卷积图像 124
6.3.2 使用库SciPy中的函数
convolve2d()进行卷积 124
6.3.3 使用库SciPy中的函数ndimage.convolve()进行卷积 126
6.4 频域滤波 128
6.4.1 什么是滤波器 128
6.4.2 高通滤波器 128
6.4.3 低通滤波器 130
6.4.4 DoG 带通滤波器 130
6.4.5 带阻滤波器 132
第7章 图像增强 135
7.1 对比度增强 136
7.1.1 直方图均衡化 136
7.1.2 自适应直方图均衡化 138
7.1.3 对比度拉伸 140
7.1.4 非线性对比度增强 142
7.2 锐化 144
7.2.1 锐化滤波 145
7.2.2 高频强调滤波 148
7.2.3 基于梯度的锐化 152
7.3 减少噪声 156
7.3.1 均值滤波器 156
7.3.2 中值滤波器 158
7.3.3 高斯滤波器 158
7.3.4 双边滤波器 159
7.3.5 小波降噪 160
7.4 色彩平衡 161
7.4.1 白平衡 161
7.4.2 颜色校正 163
7.4.3 调整色调和饱和度 164
7.5 超分辨率 165
7.6 去除运动模糊 167
7.6.1 边缘 167
7.6.2 逆滤波 169
7.6.3 统计方法 170
7.6.4 盲去卷积 171
第8章 图像特征提取 173
8.1 图像特征提取方法 174
8.2 颜色特征 174
8.2.1 颜色直方图 174
8.2.2 其他颜色特征提取方法 176
8.3 纹理特征 178
8.3.1 灰度共生矩阵 178
8.3.2 方向梯度直方图 180
8.3.3 尺度不变特征变换 181
8.3.4 小波变换 182
8.4 形状特征 184
8.4.1 边界描述子 184
8.4.2 预处理后的轮廓特征 188
8.4.3 模型拟合方法 190
8.4.4 形状上的变换 193
8.5 基于LoG、DoG和DoH的斑点检测器 196
8.5.1 LoG滤波器 197
8.5.2 DoG滤波器 198
8.5.3 DoH算法 200
第9章 图像分割 203
9.1 图像分割的重要性 204
9.2 基于阈值的分割 204
9.2.1 灰度阈值分割 205
9.2.2 彩色阈值分割 206
9.3 基于边缘的分割 207
9.3.1 Canny边缘检测 207
9.3.2 边缘连接方法 208
9.4 基于区域的分割 209
9.4.1 区域生长算法 209
9.4.2 图割算法 212
9.4.3 基于聚类的分割算法 213
9.5 基于图论的分割 215
9.5.1 图割算法 215
9.5.2 最小生成树算法 215
9.6 基于深度学习的分割 217
9.6.1 FCN 217
9.6.2 U-Net 219
9.6.3 DeepLab 220
9.6.4 Mask R-CNN 220
第10章 目标检测 223
10.1 目标检测概述 224
10.1.1 目标检测的步骤 224
10.1.2 目标检测的方法 224
10.2 YOLO v5 225
10.2.1 YOLO v5的改进 225
10.2.2 基于YOLO v5的训练、验证和预测 226
10.3 语义分割 242
10.3.1 什么是语义分割 242
10.3.2 DeepLab语义分割 244
10.4 SSD目标检测 245
10.4.1 摄像头目标检测 246
10.4.2 基于图像的目标检测 247
第11章 图像分类 249
11.1 图像分类介绍 250
11.2 基于特征提取和机器学习的图像分类 250
11.2.1 图像分类的基本流程 250
11.2.2 基于scikit-learn机器学习的图像分类 251
11.2.3 分类算法 254
11.2.4 聚类算法 257
11.3 基于卷积神经网络的图像分类 259
11.3.1 卷积神经网络的基本结构 259
11.3.2 第一个卷积神经网络程序 262
11.3.3 使用卷积神经网络进行图像分类 267
11.4 基于迁移学习的图像分类 279
11.4.1 迁移学习介绍 279
11.4.2 基于迁移学习的图片分类器 280
11.5 基于循环神经网络的图像分类 284
11.5.1 循环神经网络介绍 284
11.5.2 实战演练 285
11.6 基于卷积循环神经网络的图像分类 286
11.6.1 卷积循环神经网络介绍 286
11.6.2 CRNN图像识别器 287
第12章 国内常用的第三方人脸识别平台 291
12.1 百度AI开放平台 292
12.1.1 百度AI开放平台介绍 292
12.1.2 使用百度AI之前的准备工作 292
12.1.3 基于百度AI平台的人脸识别 296
12.2 科大讯飞AI开放平台 301
12.2.1 科大讯飞AI开放平台介绍 301
12.2.2 申请试用 301
12.2.3 基于科大讯飞AI的人脸识别 302
第13章 斗转星移换图系统 311
13.1 背景介绍 312
13.1.1 CycleGAN的作用 312
13.1.2 CycleGAN的原理 312
13.2 系统模块架构 313
13.3 设置数据集 313
13.4 训练数据 315
13.4.1 加载图像 315
13.4.2 辅助功能 316
13.4.3 生成对抗网络模型 319
13.4.4 训练CycleGAN模型 322
13.5 图像转换 326
13.6 调试运行 328
第14章 智能OCR文本检测识别系统 333
14.1 OCR系统介绍 334
14.1.1 OCR的基本原理和方式 334
14.1.2 深度学习对OCR的影响 335
14.1.3 与OCR相关的深度学习技术 335
14.2 OCR项目介绍 336
14.3 准备模型 337
14.3.1 文本检测模型 337
14.3.2 文本识别模型 337
14.4 创建工程 337
14.4.1 工程配置 338
14.4.2 配置应用程序 338
14.4.3 导入模型 338
14.5 具体实现 339
14.5.1 页面布局 339
14.5.2 实现主Activity 339
14.5.3 图像操作 343
14.5.4 运行OCR模型 347
14.6 调试运行 354
|
內容試閱:
|
当我们回顾人类历史的发展历程时会发现,图像一直是信息传递和交流的重要媒介之一。从古代的壁画和雕刻,到现代的摄影、电影和数字图像,图像在记录时代变迁、传递情感、展示美好瞬间和实现创意方面都扮演着不可或缺的角色。然而,随着科技的进步,我们迈入了一个全新的数字时代,图像的处理和分析也变得日益重要。本书将带领读者进入智能图像处理技术的精彩世界,从基本概念到高级应用,覆盖了图像处理、图像增强、目标检测、人脸识别等多个方面。无论是计算机视觉领域的初学者还是有一定基础的读者,都可以通过本书逐步掌握图像处理与分析的核心技能。
本书特色
本书通过深入的内容讲解、丰富的案例和实用的教程,为读者提供了一个深入了解图像处理和光学字符识别(OCR)技术,并将其应用于实际项目的机会。无论是计算机视觉领域的初学者还是有经验的开发者,都可以从本书中获得有价值的知识和经验。本书的主要特色如下。
1. 广泛涵盖计算机视觉领域
本书涵盖了计算机视觉领域不同方向的两个关键主题,即图像处理和OCR,这使读者能够获得多个领域的实际应用知识。
2. 深入而实用的内容
本书的每个章节都深入探讨了具体技术的背景、原理和实现方式,使读者不仅了解理论,还能够亲自动手实现这些技术。这种实践性的内容有助于读者将知识应用于实际项目。
3. 丰富的案例和示例
本书的每章都有丰富的案例和示例,这些案例和示例都是从实际项目中抽取的,涵盖了不同层面的技术细节和应用场景,能帮助读者更好地理解和应用所学内容。
4. 结合多种技术栈
本书不拘泥于单一技术栈,而是结合了多种流行的工具和框架,如Python、PyTorch、TensorFlow、OpenCV等,让读者能够在实际项目中根据需求选择合适的工具。
5. 详细的步骤和教程
本书的每个章节都提供了详细的步骤和教程,从环境搭建到模型训练再到应用开发,读者可以一步步地跟随指导完成项目。
6. 涵盖了最新技术
本书反映了最新的技术演进趋势,如深度学习在图像处理和OCR中的应用,以及移动端应用的开发等,使读者能够跟上领域内的最新发展趋势。
7. 强调实际问题解决
本书的重点是如何解决实际问题,每个章节都围绕实际应用场景展开讨论,帮助读者更好地理解如何将技术应用于解决实际问题。
8. 提供线上技术支持
本书正文的每一个二级标题右侧都有一个二维码,读者可通过扫描二维码观看视频讲解。除了线上视频讲解以外,本书还为读者提供了全书案例源代码和PPT课件,读者可扫描下方二维码获取。
此外,本书还提供在线技术支持,如果读者在学习中遇到问题,可以向我们的售后团队求助,求助方式见PPT。
本书适合谁看
软件工程师。
人工智能开发工程师。
机器学习和深度学习开发人员。
计算机视觉开发人员。
致谢
本书在编写过程中,得到了清华大学出版社各位专业编辑的大力支持,正是各位专业人士的求实、认真,才使得本书出版。另外,也十分感谢我的家人给予的巨大支持。由于本人水平有限,书中难免存在纰漏之处,恳请读者提出宝贵的意见或建议,以便更正修订。
最后感谢您购买本书,希望本书能成为您编程路上的领航者,祝您阅读愉快!
编 者
|
|