新書推薦:
《
人生解忧:佛学入门四十讲
》
售價:NT$
490.0
《
浪潮将至
》
售價:NT$
395.0
《
在虚无时代:与马克斯·韦伯共同思考
》
售價:NT$
260.0
《
日内交易与波段交易的资金风险管理
》
售價:NT$
390.0
《
自然信息图:一目了然的万物奇观
》
售價:NT$
640.0
《
女性史:古代卷(真正意义上的女性大历史)
》
售價:NT$
560.0
《
跨代伴侣治疗
》
售價:NT$
440.0
《
心理治疗中的真意:心理治疗师的心灵之旅
》
售價:NT$
440.0
|
編輯推薦: |
奇虎360人工智能研究院陌陌深度学习实验室资深工程师力作
凝聚作者6余年的深度学习研究心得,业内4位大咖鼎力推荐
涵盖深度学习核心理论、数据与模型可视化、模型压缩与优化等内容
详解图像分类、图像分割和目标检测的三大核心技术和八大经典案例
赠送10段本书配套视频导读
赠送本书彩图电子手册
如何使用好数据?
深度学习的核心优化技术有哪些?
如何做好图像分类任务?
如何做好图像分割任务?
如何做好目标检测任务?
如何对数据和模型进行可视化分析?
如何压缩和优化一个工业级深度学习模型?
如何理解分类和回归等任务的损失函数?
如何在微信小程序上部署模型?
通过阅读本书,你将了解这些复杂问题背后的原理,甚至你都可以自己解决这些问题。
业内4位大咖力荐:
鲁华祥中科院半导体研究所研究员奇虎360人工智能研究院陌陌深度学习实验室资深工程师力作
凝聚作者6余年的深度学习研究心得,业内4位大咖鼎力推荐
涵盖深度学习核心理论、数据与模型可视化、模型压缩与优化等内容
详解图像分类、图像分割和目标检测的三大核心技术和八大经典案例
赠送10段本书配套视频导读
赠送本书彩
|
內容簡介: |
本书是一本讲述深度学习在计算机视觉领域的书籍,为机器学习和深度学习相关领域中需要学习图像识别和处理技术的读者量身定做。本书非常详尽地讲述了深度学习的各个知识点,包括深度学习卷积神经网络的理论知识、深度学习中的数据,以及图像分类、图像分割和目标检测等三大图像基础应用;另外还介绍了深度学习的数据可视化和模型可视化、深度学习中的常用损失函数、模型压缩以及深度学习模型部署的前后端基础知识。
本书从第4章开始,每章都配置有一到两个难易程度不同的案例,让读者在实践中更好地掌握相关领域的技术细节。读者在读完每章的理论知识后,就可以紧接着进行实践,并在已有代码的基础上进行修改和改进,从而理论与实践结合进行系统性的学习。
|
關於作者: |
言有三 真名龙鹏。2012年本科毕业于华中科技大学,后保研至中国科学院并于2015年毕业。先后在奇虎360人工智能研究院和陌陌深度学习实验室从事与计算机视觉相关的工作,积累了丰富的传统图像处理算法和深度学习项目实战经验。运营微信公众号《有三AI》,内容覆盖深度学习的理论、实战经验、开源框架、模型架构,以及深度学习在各应用领域的技术分析,还提供国内外AI研究院的核心技术报导及AI工程师成长路线的完整规划。在知乎上开设专栏《有三AI学院》和其他子方向专栏。在GitChat和网易云课堂上开设若干图文和视频课程。
|
目錄:
|
前言
第1章神经网络基础1
1.1神经网络的生物基础与数学模型1
1.1.1神经元1
1.1.2感知机2
1.1.3BP算法6
1.2卷积神经网络基础10
1.2.1卷积神经网络的基本结构11
1.2.2卷积与权值共享13
1.2.3感受野与池化14
第2章深度学习优化基础17
2.1深度学习主流开源框架17
2.1.1Caffe简介18
2.1.2TensorFlow简介18
2.1.3PyTorch简介19
2.1.4Theano简介20
2.1.5Keras简介20
2.1.6MXNet简介21
2.1.7Chainer简介21
2.2网络优化参数22
2.2.1常用激活函数22
2.2.2参数初始化方法26
2.2.3最优化方法27
2.2.4归一化方法31
2.2.5正则化方法33
第3章深度学习中的数据36
3.1深度学习通用数据集的发展36
3.1.1MNIST数据集36
3.1.2CIFAR10和CIFAR100数据集37
3.1.3PASCAL数据集38
3.1.4ImageNet数据集38
3.1.5Microsoft COCO数据集39
3.2常见的计算机视觉任务数据集40
3.2.1人脸数据集40
3.2.2自动驾驶数据集52
3.2.3医学数据集55
3.3数据增强59
3.3.1有监督数据增强60
3.3.2无监督数据增强63
3.4数据的收集与标注65
3.4.1数据收集65
3.4.2数据标注67
3.4.3数据清洗与整理68
第4章图像分类70
4.1图像分类基础70
4.1.1图像分类问题70
4.1.2深度学习图像分类发展简史72
4.1.3评测指标与优化目标75
4.1.4图像分类的挑战76
4.2移动端实时表情分类实战77
4.2.1项目背景78
4.2.2数据预处理80
4.2.3项目方案82
4.2.4模型训练与测试84
4.2.5项目总结88
4.3细粒度图像分类实战89
4.3.1项目背景89
4.3.2项目方案90
4.3.3模型训练与测试92
4.3.4参数调试97
4.3.5项目总结102
第5章图像分割103
5.1传统图像分割方法103
5.1.1阈值法103
5.1.2区域生长法与超像素105
5.1.3图切割105
5.1.4活动轮廓模型106
5.2 深度学习图像分割109
5.2.1基本流程110
5.2.2反卷积110
5.2.3多尺度与感受野112
5.2.4CRF方法113
5.2.5Image Matting与图像融合114
5.3移动端实时图像分割项目115
5.3.1项目背景115
5.3.2项目方案116
5.3.3模型训练与总结126
5.4一个实时肖像换背景项目127
5.4.1项目背景127
5.4.2项目方案128
5.4.3模型训练与测试134
5.4.4项目总结138
第6章目标检测139
6.1目标检测基础139
6.1.1检测窗口选择140
6.1.2特征提取141
6.1.3分类器142
6.1.4V-J人脸检测算法143
6.2深度学习目标检测方法145
6.2.1Selective search与R-CNN146
6.2.2RoI Pooling与SPPNet147
6.2.3Fast R-CNN与Faster R-CNN149
6.2.4YOLO方法152
6.2.5SSD方法154
6.2.6目标检测中的关键技术155
6.3实战Faster-R-CNN目标检测157
6.3.1项目背景157
6.3.2py-faster-rcnn框架解读157
6.3.3模型定义与分析170
6.3.4模型训练与测试180
6.3.5项目总结183
第7章数据与模型可视化185
7.1数据可视化185
7.1.1低维数据可视化185
7.1.2高维数据可视化187
7.2模型可视化190
7.2.1模型结构可视化190
7.2.2模型权重可视化198
7.2.3特征图可视化201
7.3可视化案例202
7.3.1项目背景202
7.3.2数据接口定义204
7.3.3网络结构定义205
7.3.4可视化代码添加207
7.3.5可视化训练指标207
第8章模型压缩209
8.1模型压缩方法209
8.1.1模型设计压缩210
8.1.2网络剪枝与量化213
8.1.3张量分解216
8.1.4模型蒸馏与迁移学习216
8.2模型压缩实战218
8.2.1网络分析220
8.2.2输入尺度和第一层卷积设计224
8.2.3网络宽度与深度压缩226
8.2.4弥补通道损失228
8.2.5总结230
第9章损失函数231
9.1分类任务损失231
9.1.1什么是0-1 loss231
9.1.2熵与交叉熵loss231
9.1.3softmax loss及其变种232
9.1.4KL散度237
9.1.5Hinge loss简介237
9.1.6Exponential loss与Logistic loss237
9.1.7多标签分类任务loss238
9.2回归任务损失238
9.2.1L1 loss与L2 loss238
9.2.2L1 loss与L2 loss的改进239
9.3 常见图像任务与loss使用240
9.3.1图像基础任务240
9.3.2风格化与图像复原,超分辨重建240
9.3.3生成对抗网络241
9.3.4总结245
第10章模型部署与上线246
10.1微信小程序前端开发246
10.1.1小程序的技术特点与定位246
10.1.2Web前端基础248
10.1.3小程序开发工具251
10.1.4小程序前端目录252
10.1.5小程序前端开发254
10.2微信小程序服务端开发260
10.2.1域名注册与管理260
10.2.2服务端框架简介261
10.2.3算法搭建与实现262
10.3Caffe环境配置264
10.3.1依赖库安装264
10.3.2Caffe编译安装266
|
內容試閱:
|
机器学习、深度学习、人工智能,这些关键词在最近几年“声名鹊起”。以深度学习为代表的无监督机器学习技术在图像处理、语音识别和自然语言处理等领域里频频取得新的突破。但深度学习其实并不是一门全新的学科,其历史可以追溯到20世纪40年代。
深度学习背后的核心技术包括神经网络的结构设计和最优化方法等,其理论体系虽然有一定进展但是尚不完备。可以说,当前的主流深度学习技术是一门应用性极强的工程技术,这种尚不完备的理论加上具有较高门槛的应用工程特点,对于初学者来说具有一定的困难。如何系统性地了解理论知识,又能够紧随理论进行全面的实践,成为一名合格的图像处理领域的深度学习算法工程师,这是本书所要解决的问题。
笔者有超过6年的图像行业背景,最近几年也多以深度学习技术为基础进行相关项目的开发,在多年的知识积累和项目实践中,总结出了大量的经验,浓缩成了这本书。本书从深度学习的背景和基础理论开始讲起,然后介绍了深度学习中的数据及图像处理中的几大重要方向,并介绍了神经网络的可视化、优化目标、模型的优化和模型的线上部署。
本书内容由浅入深,讲解图文并茂,紧随工业界和学术界的最新发展,理论和实践紧密结合,给出了大量的图表与案例分析。本书抛开了过多的数学理论,完整地剖析了深度学习在图像处理领域中各个维度的重要技术,而不是只停留于理论的阐述和简单的结果展示,更是从夯实理论到完成实战一气呵成。相信读者跟随着本书进行学习,将会对深度学习领域的图像处理技术和其在实际开发中的应用有更深的理解。
本书特色
1.内容全面,紧跟最新技术发展
本书内容涵盖了深度学习的理论知识、数据获取与增强,以及深度学习在图像分类、分割和检测这三大基础研究领域中的发展、数据与模型的可视化、优化目标、模型压缩与部署等相关知识,基本上囊括了深度学习在图像开发中所必须要掌握的大部分基础知识。
2.深度与广度兼具
本书在讲解每个知识点时力求详尽,而且紧密结合了学术界与工业界相关技术的最新发展。这样的安排既注重知识的广度,也兼具知识的深度,可以为图像处理领域中的从业者提供系统性的学习指导。
3.理论与实践案例紧密结合
本书不仅对理论知识进行了阐述,而且还给出了大量的实践内容,以帮助读者提高实际的动手能力。除了第1、2章主要介绍了深度学习的基础理论外,后续章节则大多采用了先系统介绍该章涉及知识的发展现状,然后有针对性地设计了一到两个实践案例带领读者学习,有较好的学习效果。
4.参考了不同层次学习者的意见
本书若干内容的简化版本已在笔者运营的公众号平台上接受了不同层次读者的反馈,力求知识的完备性和准确性;另外,本书有多位编写者参与,他们或理论见长,或善于动手,让本书从不同层面得到了广泛的意见,可以满足不同人群的学习需求。
本书内容
第1章神经网络基础,首先介绍了神经网络的生物基础与数学模型,然后介绍了卷积神经网络的基础知识,这也是当前深度学习模型的基础。
第2章深度学习优化基础,首先介绍了深度学习主流开源框架,如Caffe、TensorFlow、Pytorch和Theano等,并对其特点与性能做了对比;然后介绍了网络优化参数,包括激活函数、正则化方法和归一化方法等。本章旨在让大家对深度卷积神经网络有一个较为全面的认识,给后续章节的学习打好基础。
第3章深度学习中的数据,首先介绍了深度学习发展过程中的几个数据集,给读者展示了数据集对深度学习的重要性;然后介绍了几大重要发展方向中的数据集;接着讲述了数据增强的方法;最后讲述了数据的收集、整理及标注等相关问题。
第4章图像分类,首先介绍了图像分类的基础、基于深度学习的图像分类研究方法及发展现状,以及图像分类任务中的挑战;然后以一个移动端的基准模型为例,展示了图像分类任务的实践流程;最后介绍了一个细粒度级别的图像分类任务,以一个较高的基准模型,展示了较难的图像分类任务训练参数的调试技巧。
第5章图像分割,首先介绍了从阈值法到活动轮廓模型的传统图像分割方法;然后介绍了基于深度学习的图像分割方法的基本原理与核心技术;接着讲述了一个移动端的实时图像分割任务,该任务以MobileNet为基准模型,展示了图像硬分割任务实践的完整流程;最后介绍了一个更加复杂的肖像换背景的任务,展示了图像软分割任务的基本流程和应用场景。
第6章目标检测,首先介绍了目标检测的基础和基本流程,并讲述了一个经典的V-J目标检测框架;然后介绍了基于深度学习的目标检测任务的研究方法与发展现状,并分析了目标检测中的核心技术;最后给出了一个目标检测任务实例,通过分析faster rcnn的源代码,使用该框架自带的VGG CNN 1024网络完成训练和测试,并总结目标检测中的难点。
第7章数据与模型可视化,首先对包括低维与高维数据的可视化做了简单介绍;然后对深度学习中的模型可视化做了详细介绍,包括模型的结构和权重可视化;最后介绍了一个基于Tensorflow和Tensorboard的完整案例。
第8章模型压缩,首先详细介绍了模型压
|
|