新書推薦:
《
读书是一辈子的事(2024年新版)
》
售價:NT$
352.0
《
乐道文库·什么是秦汉史
》
售價:NT$
367.0
《
汉娜·阿伦特与以赛亚·伯林 : 自由、政治与人性
》
售價:NT$
500.0
《
女性与疯狂(女性主义里程碑式著作,全球售出300万册)
》
售價:NT$
500.0
《
药食同源中药鉴别图典
》
售價:NT$
305.0
《
设计中的比例密码:建筑与室内设计
》
售價:NT$
398.0
《
冯友兰和青年谈心系列:看似平淡的坚持
》
售價:NT$
254.0
《
舍不得星星:全2册
》
售價:NT$
356.0
|
編輯推薦: |
本教材的作者是海外引进人才,既有国外学习工作的背景,也有在国内院校教学的经验,本书正是将二者有机结合起来,编写而成的深度学习的入门级教材。通过本书的学习,可以打下扎实基础,为后续了解人工智能前沿做知识储备。
|
內容簡介: |
大约在一百年前,电气化改变了交通运输行业、制造业、医疗行业、通信行业,如今AI带来了同样巨大的改变。AI的各个分支中发展为迅速的方向之一就是深度学习。
本书主要涉及以下内容:第1部分是神经网络的基础,学习如何建立神经网络,以及如何在数据上面训练它们。第2部分进行深度学习方面的实践,学习如何构建神经网络与超参数调试、正则化以及一些高级优化算法。第3部分学习卷积神经网络(CNN),以及如何搭建模型、有哪些经典模型。它经常被用于图像领域,此外目标检测、风格迁移等应用也将涉及。后在第4部分学习序列模型,以及如何将它们应用于自然语言处理等任务。序列模型讲到的算法有循环神经网络(RNN)、长短期记忆网络(LSTM)、注意力机制。
通过以上内容的学习,读者可以入门深度学习领域并打下扎实基础,为后续了解和探索人工智能前沿科技做知识储备。
本书配有电子课件,需要配套资源的教师可登录机械工业出版社教育服务网www.cmpedu.com免费注册后下载。
|
目錄:
|
目 录
前言
第1部分神经网络和深度学习
第1章深度学习简介
1.1神经网络
1.2神经网络的监督学习应用
1.3为什么深度学习会兴起
第2章神经网络的编程基础
2.1二分类
2.2逻辑回归
2.3逻辑回归的代价函数
2.4梯度下降法
2.5计算图
2.6使用计算图求导数
2.7逻辑回归中的梯度下降
2.8m个样本的梯度下降
2.9向量化
2.10向量化逻辑回归
2.11向量化逻辑回归的输出
2.12Python中的广播
2.13numpy向量
2.14logistic损失函数的解释
第3章浅层神经网络
3.1神经网络概述
3.2神经网络的表示
3.3计算一个神经网络的输出
3.4多样本向量化
3.5激活函数
3.6激活函数的导数
3.7神经网络的梯度下降
3.8理解反向传播
3.9随机初始化
第4章深层神经网络
4.1深层神经网络概述
4.2前向传播和反向传播
4.3深层网络中矩阵的维数
4.4为什么使用深层表示
4.5超参数
第2部分改善深层神经网络:超参数调试、正则化以及优化
第5章深度学习的实践
5.1训练、验证、测试集
5.2偏差、方差
5.3机器学习基础
5.4正则化
5.5正则化如何降低过拟合
5.6dropout正则化
5.7理解dropout
5.8其他正则化方法
5.9归一化输入
5.10梯度消失/梯度爆炸
5.11梯度的数值逼近
5.12梯度检验
第6章优化算法
6.1mini-batch梯度下降
6.2理解mini-batch梯度下降法
6.3动量梯度下降法
6.4RMSprop
6.5Adam 优化算法
6.6学习率衰减
6.7局部问题
第7章超参数调试、正则化
7.1调试处理
7.2超参数的合适范围
7.3归一化网络的激活函数
7.4将batch norm拟合进神经网络
7.5batch归一化分析
7.6softmax回归
7.7训练一个softmax分类器
7.8TensorFlow
第3部分卷积神经网络及应用
第8章卷积神经网络
8.1计算机视觉
8.2边缘检测示例
8.3边缘检测内容
8.4填充
8.5卷积步长
8.6三维卷积
8.7单层卷积网络
8.8简单卷积网络示例
8.9池化层
8.10卷积神经网络示例
8.11为什么使用卷积
第9章深度卷积网络:实例探究
9.1经典网络
9.2残差网络
9.3残差网络为什么有用
9.4网络中的1×1卷积
9.5谷歌Inception网络
9.6迁移学习
9.7数据增强
第10章目标检测
10.1目标定位
10.2特征点检测
10.3目标检测
10.4滑动窗口的卷积实现
10.5Bounding Box预测
10.6交并比
10.7非极大值抑制
10.8Anchor Boxes
10.9YOLO算法
第11章特殊应用:人脸识别和神经风格迁移
11.1One-Shot学习
11.2Siamese网络
11.3Triplet损失
11.4人脸验证与二分类
11.5神经风格迁移
11.6深度卷积网络学习什么
11.7代价函数
11.8内容代价函数
11.9风格代价函数
11.10一维到三维推广
第4部分序列模型
第12章循环序列模型
12.1为什么选择序列模型
12.2数学符号
12.3循环神经网络模型
12.4通过时间的反向传播
12.5不同类型的循环神经网络
12.6语言模型和序列生成
12.7对新序列采样
12.8循环神经网络的梯度消失
12.9GRU单元
12.10长短期记忆
12.11双向循环神经网络
12.12深层循环神经网络
第13章序列模型和注意力机制
13.1序列结构的各种序列
13.2选择可能的句子
13.3集束搜索
13.4改进集束搜索
13.5集束搜索的误差分析
13.6注意力模型直观理解
13.7注意力模型
附录
附录A深度学习符号指南
A.1数据标记与上下标
A.2神经网络模型
A.3正向传播方程示例
A.4通用激活公式
A.5损失函数
A.6深度学习图示
附录B线性代数
B.1基础概念和符号
B.2矩阵乘法〖=(〗
|
內容試閱:
|
前 言
不论你是生活在哪里、工作学习于什么领域,可能都已经发现人工智能的时代已经飞快地向人们走来,这种感受就像是浪潮不断涨起,它将过去的一些传统的工作方式革新甚至取代。比如说,人工智能在图像识别、图像生成、自然语言翻译、自动驾驶领域的进步,使得传统的安保、插画、翻译、驾驶等工作受到前所未有的挑战。未来它也将不断改变现代人的生活,并且变革人们的工作内容。
这背后的技术进步正是由于深度学习的人工智能第三次科技浪潮的兴起,它顺应着数据的大爆发与芯片技术的高度发展,孕育了当今时代新的发展机遇,值得年轻的学生与技术工作者去努力学习。然而现有的教材通常侧重理论基础,与实践结合不够,或者实践的讲解不够深入、详细。同时有些国外经典教材是英文撰写,不利于国内英语基础不好的读者学习。
我深入了解到工业界学习者和在校学生的这些学习需求,所以编写了本书。深度学习自身是一个实践性要求极高的领域,需要借助实例去讲解,所以本书参考了吴恩达教授的课程,在编写中详细地介绍了各种深度学习模型的数学运算原理,对各种发展成熟的神经网络都有深入分析,为此阅读本书需要高等数学、线性代数的基础知识,并且会使用Python编程语言进行简单的操作与数据分析。本书主要涉及以下内容:
第1部分是神经网络的基础,学习如何建立神经网络,以及如何在数据上面训练它们。接下来在第2部分进行深度学习方面的实践,学习如何构建神经网络与超参数调试、正则化以及一些高级优化算法。第3部分学习卷积神经网络(CNN),以及如何搭建模型、有哪些经典模型。它经常被用于图像领域,此外目标检测、风格迁移等应用也将涉及。后在第4部分学习序列模型,以及如何将它们应用于自然语言处理等任务。序列模型讲到的算法有循环神经网络(RNN)、长短期记忆网络(LSTM)、注意力机制。通过以上内容的学习,读者可以入门深度学习领域并打下扎实基础,为后续了解和探索人工智能前沿科技做知识储备。
我开始有写一本深度学习教材的想法源于2020年开始在东北大学秦皇岛分校讲机器学习与深度学习相关课程,在实践中积累教学经验,梳理了该领域的知识,虽然内容繁多还有些杂乱,但是对读者应该有用。这个时候正好学院的郭院长组织编写自动化系列教材,能与机械工业出版社合作,我就开始编写本书。这期间科研工作也极为忙碌,所以经历了落笔、停滞、继续重启、再停滞,如此重复。中间想过放弃,但是罗编辑的耐心解答、郭院长的悉心鼓励以及吕同学的大力帮忙,终还是让这本书得以成形,也圆了我编著书籍的梦想。同时也要感谢我的家人在这期间对我的关怀和帮助,他们一直支持着我,无论我是在国外留学还是回国工作。
后,本人能力水平有限,希望读者不吝赐教。
王舒禹
2022年12月
|
|