新書推薦:
《
视觉美食家:商业摄影实战与创意解析
》
售價:NT$
602.0
《
中国经济发展的新阶段:机会与选择
》
售價:NT$
454.0
《
DK月季玫瑰百科
》
售價:NT$
959.0
《
为你想要的生活
》
售價:NT$
301.0
《
关键改变:如何实现自我蜕变
》
售價:NT$
352.0
《
超加工人群:为什么有些食物让人一吃就停不下来
》
售價:NT$
454.0
《
历史的教训(浓缩《文明的故事》精华,总结历史教训的独特见解)
》
售價:NT$
286.0
《
不在场证明谜案(超绝CP陷入冤案!日本文坛超新星推理作家——辻堂梦代表作首次引进!)
》
售價:NT$
265.0
|
內容簡介: |
本书深入浅出地介绍了近年来AI领域中十分引人注目的新型人工神经网络——生成对抗网络(GAN)的基本原理、网络结构及其在图像处理领域中的应用;同时,分析了近年来在GAN训练、GAN质量评估及多种改进型GAN方面取得的进展;在实践方面,给出了基于Python的基本GAN编程实例。另外,本书还介绍了支撑GAN模型的基础理论和相关算法,以使读者更好地理解和掌握GAN技术。
|
關於作者: |
朱秀昌,男,1947年生,硕士,江苏丹徒人。曾任南京邮电大学通信与信息工程学院教授,博士生导师,”江苏省图像处理与图像通信重点实验室”主任。长期从事图像和多媒体通信方面的科研和教学工作。曾主持完成了多项国家、省部级科研项目,主讲了多门本科生和研究生的专业课程。先后在5个出版社编著出版了”数字图像处理与图像通信”等书籍17本,发表专业技术论文160余篇。
|
目錄:
|
第1章 绪论11.1 从图像处理到数字视觉21.1.1 数字图像技术31.1.2 数字视觉技术51.1.3 数字视觉的应用71.2 神经网络由浅入深101.2.1 神经网络的发展101.2.2 深度神经网络111.2.3 深度学习的进展121.3 从概率生成到对抗生成131.3.1 概率生成模型141.3.2 概率分布比较161.3.3 对抗生成模型161.4 GAN的应用181.4.1 在图像领域中的应用181.4.2 在其他领域中的应用20第2章 数字图像处理222.1 数字图像基础222.1.1 图像的数学表示222.1.2 图像的数字化232.1.3 数字图像的表示262.1.4 图像的分辨率282.2 传统数字图像处理302.2.1 图像采集和压缩302.2.2 图像去噪和滤波312.2.3 图像增强和复原322.2.4 图像分割332.2.5 图像特征提取和目标检测342.2.6 图像变换和超分辨率重建352.3 ANN图像处理362.3.1 图像分类362.3.2 目标检测与跟踪372.3.3 语义分割和实例分割392.3.4 图像生成402.4 常用的图像数据集43第3章 人工神经网络493.1 ANN简介493.1.1 从生物到人工神经元503.1.2 从感知机到神经网络513.1.3 从浅层到深度543.1.4 ANN的特点和应用553.2 常见的ANN类型573.2.1 RBF网络573.2.2 ART网络583.2.3 SOM网络593.2.4 波尔兹曼机593.2.5 级联相关网络613.3 ANN的关键技术623.3.1 网络类型623.3.2 网络训练623.3.3 激活函数643.3.4 验证和泛化653.4 BP算法663.4.1 数据的正向传播673.4.2 误差的反向传播683.4.3 BP算法流程703.4.4 BP算法的几个问题703.5 ANN的学习方式713.5.1 有监督学习713.5.2 无监督学习723.5.3 半监督学习723.5.4 强化学习73第4章 GAN中常用的ANN744.1 卷积神经网络744.1.1 CNN的结构754.1.2 CNN的核心技术764.1.3 CNN的训练和改进794.1.4 CNN一例804.1.5 图像卷积814.2 循环神经网络844.2.1 RNN的结构854.2.2 RNN与CNN的比较854.3 变分自编码器864.3.1 自编码器864.3.2 VAE概述874.4 深度残差网络914.4.1 深度网络的困境914.4.2 残差块结构924.4.3 残差块的作用924.4.4 ResNet的误差反传93第5章 相关算法965.1 和图像处理有关的算法965.1.1 分类算法965.1.2 聚类算法1045.1.3 降维算法1065.1.4 迁移学习1135.1.5 马尔可夫链和HMM1155.2 和函数优化有关的算法1205.2.1 最小二乘法1205.2.2 梯度下降法1215.2.3 EM算法125第6章 GAN基础1296.1 GAN概要1306.1.1 GAN的数据生成1306.1.2 GAN的网络结构1336.1.3 GAN的优势和不足1376.2 数据分布及其转换1396.2.1 图像数据的高维分布1396.2.2 隐变量和隐空间1416.2.3 分布函数的转换1436.3 生成模型与判别模型1456.3.1 生成模型1456.3.2 判别模型1496.3.3 生成模型和判别模型的关系1506.4 GAN的工作过程1526.4.1 纳什均衡1536.4.2 对抗训练1546.4.3 训练流程157第7章 GAN的目标函数1607.1 数据的信息熵1617.1.1 随机变量1617.1.2 信息量和信息熵1647.1.3 交叉熵1667.2 数据分布的差异:散度1687.2.1 KL散度1687.2.2 JS散度1697.2.3 f散度1697.3 GAN目标函数及其优化1717.3.1 目标函数1717.3.2 判别器优化1787.3.3 生成器优化180第8章 GAN的训练1828.1 GAN训练中常见的问题1838.1.1 收敛不稳定问题1838.1.2 梯度消失问题1848.1.3 模式崩溃问题1898.2 提升GAN训练的稳定性1928.2.1 选择恰当的网络模型1928.2.2 选择恰当的目标函数1948.2.3 选择恰当的优化算法1968.3 GAN训练中的常用技巧1988.3.1 数据规范化1988.3.2 学习率衰减1998.3.3 丢弃技术2008.3.4 批量规范化2038.3.5 激活函数的选择203第9章 GAN的改进2069.1 GAN的改进之路2079.2 C GAN和info GAN2079.2.1 C GAN2079.2.2 info GAN2099.3 DC GAN2119.4 W GAN2139.5 Big GAN214第10章 GAN的图像处理应用21710.1 图像生成21810.1.1 图像生成的三种方式21810.1.2 几种特殊的图像生成22110.2 图像超分辨率重建22110.3 图像修复22210.4 图像翻译22410.4.1 图像至图像的翻译22410.4.2 文本至图像的翻译22510.5 图像风格迁移22610.6 视频预测227第11章 GAN的Python编程22811.1 Python编程语言22811.1.1 Python简介22811.1.2 Python的特点23011.1.3 Python的应用23211.2 常见的Python集成开发环境23311.3 深度学习框架23511.3.1 主流的深度学习框架23511.3.2 主流学习框架的比较23711.4 TensorFlow中的GAN编程23811.4.1 张量和张量流23911.4.2 Python的TensorFlow库24211.4.3 TensorFlow的常用模块243第12章 GAN图像处理实例24512.1 1维GAN编程24512.1.1 1维GAN小程序24612.1.2 数据对齐24812.1.3 训练中的几个问题24912.2 MNIST手写数字的生成24912.2.1 GAN模型的训练程序25012.2.2 GAN模型的生成程序25412.2.3 训练程序的图解25612.2.4 生成程序的图解257
|
|