新書推薦:
《
紫云村(史杰鹏笔下大唐小吏的生死逃亡,新历史主义小说见微之作,附赠5张与小说内容高度契合的宣纸彩插)
》
售價:NT$
449.0
《
现代吴语的研究(中华现代学术名著3)
》
售價:NT$
296.0
《
天下的当代性:世界秩序的实践与想象(新版)
》
售價:NT$
352.0
《
德国天才4:断裂与承续
》
售價:NT$
500.0
《
妈妈的情绪,决定孩子的未来
》
售價:NT$
194.0
《
推拿纲目
》
售價:NT$
1836.0
《
精致考古--山东大学实验室考古项目论文集(一)
》
售價:NT$
1112.0
《
从天下到世界——国际法与晚清中国的主权意识
》
售價:NT$
347.0
|
內容簡介: |
图像搜索和识别是计算机视觉领域一个非常重要且基础的题目。本书对构成图像搜索和识别系统的各个算法基础模块一一做了介绍,并在*后一章以拍立淘为例说明了各个模块是怎样一起工作的。针对每个算法模块,本书不仅深入浅出地解释了算法的工作原理,还对算法背后的演进机理和不同方法的特点进行了说明,在第2至第8章*后均提供了经典算法的PyTorch代码和相关参考资料。本书既适合图像搜索和识别领域的初学者,也适合在某个单一任务方面有经验但是想扩充知识面的读者。
|
關於作者: |
潘攀,花名启磐阿里巴巴达摩院资深算法专家,负责电商领域的视觉技术研发。他是拍立淘以图搜图的负责人和创始人之一,研发的技术应用于拍立淘、淘宝直播&短视频、闲鱼等业务。他博士毕业于美国伊利诺伊大学芝加哥分校,研究领域包括深度学习和计算机视觉等。他曾先后在美国三菱研究院和北京富士通研发中心从事视觉技术研发工作。已发表20余篇论文,拥有10余项授权专利,并获得Webvision分类,COCO检测,DAVIS分割等国际计算机视觉竞赛冠军。
|
目錄:
|
1概述1
1.1图像搜索与识别概述1
1.2图像搜索与识别技术的发展和应用3
1.3深度学习与图像搜索和识别4
1.4本书结构6
2深度卷积神经网络8
2.1概述8
2.1.1深度学习背景8
2.1.2深度卷积神经网络9
2.2CNN基础操作11
2.2.1卷积操作11
2.2.2池化操作12
2.2.3全连接层13
2.2.4激活层14
2.2.5批归一化层14
2.2.6小结16
2.3常见的CNN模型结构16
2.3.1网络结构超参数17
2.3.2单分支网络结构19
2.3.3多分支网络结构24
2.3.4小结38
2.4常见目标损失函数38
2.5本章总结40
2.6参考资料40
3图像分类43
3.1概述43
3.2单标记分类44
3.2.1常用数据集及评价指标44
3.2.2损失函数45
3.2.3提升分类精度的实用技巧47
3.2.4基于搜索的图像分类50
3.3细粒度图像分类51
3.3.1概述51
3.3.2基于部件对齐的细粒度分类方法52
3.3.3基于高阶特征池化的细粒度分类方法55
3.3.4小结56
3.4多标记图像分类56
3.4.1概述56
3.4.2baseline:一阶方法58
3.4.3标记关系建模59
3.4.4小结60
3.5代码实践61
3.6本章总结63
3.7参考资料63
4目标检测66
4.1概述66
4.2两阶段目标检测算法68
4.2.1候选框生成69
4.2.2特征抽取71
4.2.3训练策略73
4.2.4小结76
4.3单阶段目标检测算法76
4.3.1YOLO算法76
4.3.2SSD算法78
4.3.3RetinaNet算法81
4.3.4无锚点框检测算法83
4.3.5小结87
4.4代码实践88
4.5本章总结91
4.6参考资料92
5图像分割95
5.1概述95
5.2语义分割96
5.2.1概述96
5.2.2全卷积神经网络97
5.2.3空洞卷积99
5.2.4U-Net结构100
5.2.5条件随机场关系建模101
5.2.6Look Wider to See Better103
5.2.7Atrous Spatial Pyramid Pooling算法104
5.2.8Context Encoding for Semantic Segmentation104
5.2.9多卡同步批归一化107
5.2.10小结107
5.3实例分割108
5.3.1概述108
5.3.2FCIS109
5.3.3Mask R-CNN111
5.3.4Hybrid Task Cascade框架113
5.3.5小结115
5.4代码实践115
5.5本章总结120
5.6参考资料120
6特征学习124
6.1概述124
6.2基于分类识别的特征训练126
6.2.1Sigmoid函数127
6.2.2Softmax函数128
6.2.3Weighted Softmax函数129
6.2.4Large-Margin Softmax函数130
6.2.5ArcFace函数132
6.2.6小结133
6.3基于度量学习的特征训练134
6.3.1Contrastive损失函数135
6.3.2Triplet损失函数137
6.3.3三元组损失函数在行人再识别中的应用139
6.3.4Quadruplet损失函数140
6.3.5Listwise Learning141
6.3.6组合损失函数142
6.3.7小结142
6.4代码实践143
6.5本章总结143
6.6参考资料144
7向量检索147
7.1概述147
7.2局部敏感哈希算法149
7.2.1预处理150
7.2.2搜索151
7.2.3小结152
7.3乘积量化系列算法152
7.3.1PQ算法153
7.3.2IVFPQ算法155
7.3.3OPQ算法156
7.3.4小结157
7.4图搜索算法157
7.4.1NSW算法158
7.4.2Kgraph算法161
7.4.3HNSW算法163
7.4.4图搜索算法实验对比165
7.4.5小结165
7.5代码实践166
7.6本章总结167
7.7参考资料168
8图文理解171
8.1概述171
8.2图文识别172
8.2.1概述172
8.2.2数据集和评测标准174
8.2.3特征融合方法176
8.2.4小结182
8.3图文搜索182
8.3.1概述182
8.3.2数据集和评测标准184
8.3.3Dual Attention Networks185
8.3.4Bottom-Up Attention187
8.3.5图文搜索的损失函数189
8.3.6小结190
8.4代码实践191
8.5本章总结194
8.6参考资料194
9阿里巴巴图像搜索识别系统197
9.1概述197
9.2背景介绍198
9.3图像搜索架构200
9.3.1类目预测模块200
9.3.2目标检测和特征联合学习201
9.3.3图像索引和检索205
9.4实验和结果分析207
9.5本章总结210
9.6参考资料211
|
|