新書推薦:
《
唯美手编16:知性优雅的编织
》
售價:NT$
250.0
《
情绪的惊人力量:跟随内心的指引,掌控情绪,做心想事成的自己
》
售價:NT$
230.0
《
棉的全球史(历史·文化经典译丛)
》
售價:NT$
500.0
《
超越百岁看这本就够了
》
售價:NT$
254.0
《
亚洲戏剧史·南亚卷
》
售價:NT$
653.0
《
中国历代竹器图谱与数字活化
》
售價:NT$
2540.0
《
EDA技术与设计(第2版)
》
售價:NT$
387.0
《
揉碎浪漫(全两册)
》
售價:NT$
320.0
|
編輯推薦: |
?从基础开始,通过理论简单明了地阐述了人工智能的基本原理?从数理角度进行了明确阐释,并对编入的最新复杂内容作了详尽的说明?选取了一些基础的重要话题实例,并且全面细致地进行了解析?强调系统性、通俗性的同时,又具有较强的前瞻性,并且对所介绍的问题都给出了详尽的分析和数学推导
|
內容簡介: |
深度学习是机器学习研究中的一个活跃领域,《深度学习入门》的宗旨在于为深度 机器学习的初学者提供一本通俗易懂、内容全面、理论深入的学习教材。 本书的内容大体可以分为机器学习基础、顺序传播神经网络的深度学 习、玻尔兹曼机和深度强化学习四个部分,既考虑了通俗性和完整性,又 介绍了深度学习的各个方面。其中机器学习基础部分介绍了神经网络、机 器学习与深度学习的数学基础、典型任务、数据集等;顺序传播神经网络 的深度学习部分介绍了梯度下降法的机器学习、深度学习的正则化、误差 反向传播法、自编码器、卷积神经网络以及循环神经网络等;玻尔兹曼机 部分对图模型神经网络的机器学习进行了深入的介绍;深度强化学习部分 则重点介绍了强化学习中的深度神经网络学习的理论和方法。 通过本书的学习,读者可以快速了解机器学习的全貌,同时在理论上 对其模型和方法进行深入分析和理解,从而为实际的开发打下深厚的理论 基础,为技术创新提供具有启发性的方向和路径。
|
目錄:
|
目 录 译者序 原书序 原书前言 第1章 绪论 1 第2章 机器学习与深度学习 3 2.1 为什么要进行深度学习 3 2.2 什么是机器学习 4 2.2.1 典型任务 4 2.2.2 形式各异的数据集 5 2.3 统计学基础 6 2.3.1 样本和估计 7 2.3.2 点估计 8 2.3.3 极大似然估计 11 2.4 机器学习基础 12 2.4.1 监督学习 13 2.4.2 小二乘法线性回归 13 2.4.3 基于概率的线性回归 15 2.4.4 小二乘法与法 16 2.4.5 过度拟合与泛化 17 2.4.6 正则化 18 2.4.7 分类 19 2.4.8 分类方法 19 2.4.9 logistic回归 20 2.4.10 softmax回归 21 2.5 特征学习与深度学习的进展 23 2.5.1 特征学习 23 2.5.2 深度学习的出现 24 第3章 神经网络 26 3.1 神经细胞网络 26 3.2 形式神经元 27 3.3 感知器 29 3.3.1 由形式神经元到感知器 29 3.3.2 感知器与马文·明斯基 (Marvin Lee Minsky) 30 3.4 顺序传播神经网络的组成 31 3.4.1 神经元和顺序传播神经网络 31 3.4.2 输入层 32 3.4.3 中间层 33 3.4.4 输出层 34 3.4.5 函数模型 34 3.5 神经网络的机器学习 35 3.5.1 回归 35 3.5.2 二元分类 36 3.5.3 多元分类 37 3.6 激活函数 37 3.6.1 sigmoid函数及其变体 38 3.6.2 正则化线性函数 38 3.6.3 maxout 39 3.7 为什么深度学习是重要的 40 第4章 基于梯度下降法的机器学习 41 4.1 梯度下降法 41 4.1.1 梯度下降法寻求小值 42 4.1.2 局部极小值问题 43 4.1.3 随机梯度下降法 44 4.1.4 小批量的制作方法 45 4.1.5 收敛和学习率的调度 45 4.2 改进的梯度下降法 46 4.2.1 梯度下降法的问题 46 4.2.2 动量法 47 4.2.3 Nesterov加速梯度下降法 48 4.2.4 AdaGrad 49 4.2.5 RMSprop 50 4.2.6 AdaDelta 50 4.2.7 Adam 51 4.2.8 自然梯度下降法 53 4.3 权重参数初始值的选取方法 53 4.3.1 LeCun初始化 53 4.3.2 Glorot 54 4.3.3 He初始化 54 4.4 训练预处理 55 4.4.1 数据的规格化 55 4.4.2 数据的白化 55 4.4.3 图像数据的局部对比度 第5章 深度学习的正则化 59 5.1 泛化性能与正则化 59 5.1.1 泛化误差与过度学习 59 5.1.2 正则化 61 5.2 权重衰减 62 5.2.1 权重衰减的效果 62 5.2.2 稀疏正则化和不良条件问题 62 5.3 早期终止 63 5.3.1 什么是早期终止 63 5.3.2 早期终止与权重衰减的关系 64 5.4 权重共享 65 5.5 数据扩增与噪声注入 65 5.5.1 数据扩增与泛化 65 5.5.2 噪声注入与惩罚项 66 5.6 bagging算法 66 5.7 dropout 67 5.7.1 dropout学习 67 5.7.2 dropout学习的预测 69 5.7.3 dropout理论的证明 70 5.8 深度表示的稀疏化 72 5.9 批量规格化 72 5.9.1 内部协变量移位 72 5.9.2 批量规格化 73 第6章 误差反向传播法 74 6.1 Perceptron(感知器)和delta 学习规则 74 6.2 误差反向传播法 76 6.2.1 参数微分的复杂度和模型 76 6.2.2 误差函数的梯度 78 6.2.3 反向传播计算的初始值 81 6.2.4 梯度的计算 81 6.2.5 delta的意义 82 6.3 误差反向传播法的梯度快速 计算 82 6.4 梯度消失与参数爆炸及其 对策 84 6.4.1 预学习 85 6.4.2 ReLU函数 85 第7章 自编码器 87 7.1 数据压缩与主成分分析 87 7.2 自编码器基础及应用 90 7.2.1 计时沙漏型神经网络 90 7.2.2 由重构误差进行的学习 91 7.2.3 编码器的作用 92 7.2.
|
內容試閱:
|
原书前言 真正的深度学习是发生于21世纪的一项科学技术革新,若干年以后这一评价也不会改变。能够遇上科学技术飞速发展的时代,的确是非常幸运的。即使仅此一个理由,对深度学习进行研究也是非常有意义的事情。 关于深度学习,人们常常错误地认为即使理论上不够清楚,只要进行方法的积累,也是行得通的。这一认识从某一侧面反映了深度学习的一些实际情况,但并没有真正地把握研究开发的实际现状。深度学习的研究与开发并不是歪打正着的事情,而是要经过缜密的数理分析进行设计的,也就是说需要有相应的理论依据。想要高水平地进行深度学习的设计,就必须具备这方面的理论背景,因此本书对以往理论研究的方方面面进行了尽可能的介绍。然而,深度学习为什么能够达到如此高的性能,至今还不得而知,特别是还存在训练可能性、表现能力、泛化可能性这三大理论之谜。作为一本入门书籍,本书很难涉及目前世界上正在进行的理论研究,仅就几个重要的问题反复进行介绍,可将其作为加深理解的开端。 在深度学习和机器学习领域,有许多无偿提供的出色框架和教程,并公开了许多这方面的说明与实际运行的结果。本书省略了所有与实际运行有关的内容,但是要想掌握理论知识还需通过TensorFlow和Chainer等进行细致的实际操作和实验。读者可以通过框架边实验边学习。我本人的专业是粒子和超弦理论,但是通过所属的理论科学联合研究推进小组(iTHES)举办的演讲会触发了本人对深度学习的兴趣。之后,经过不断学习,积累了一些学习笔记,被周围的人知道后,建议并支持我将其编辑成书,并向我推荐了讲谈社。这样,本书基于本人之前的学习笔记,并特别选取了一些基础的重要话题编写而成,书中也借鉴了许多学者的论文和著名的教科书的内容。之所以终要出版本书,也是源于自己在学习之初的“如果有这么一本教科书该有多好啊!”这样一个想法,以便将这些内容汇集成书,我想也是非常有价值的。本书的目的就是将读者从没有任何机器学习知识储备的阶段提升到可以窥见前沿研究的高度,这一尝试是否成功,真诚地希望各位读者给予判定。 神经网络研究的核心人物甘利俊一先生通读了本书原稿,并为本书做了详细的点评,还题写了诚挚的序言,本人不胜感激。同事小川轨明博士、田中章词博士、日高义将博士以及本乡优博士等对本书原稿提出了许多有益的建议,日常激烈、深入的讨论也进一步加深了作者对此的理解。若本书有优于其他书籍之处,也是仰仗各位先生的帮助,当然,本书的不当之处完全由我本人负责。另外,讲谈社的科学专员横山真吾先生对不善著书的我给予了耐心的鼓励;日本理化科学研究所的理论科学联合研究推进小组(iTHES)和数理创作计划提供了“科学家自由乐园”这一理想的研究环境。在此,对大家所给予的持续帮助,再一次表示感谢! 后,如果受本书影响,能够涌现一批年轻的深度学习研究开发者的话,作者将不胜荣幸。
|
|