新書推薦:
《
历史的教训(浓缩《文明的故事》精华,总结历史教训的独特见解)
》
售價:NT$
286.0
《
不在场证明谜案(超绝CP陷入冤案!日本文坛超新星推理作家——辻堂梦代表作首次引进!)
》
售價:NT$
265.0
《
明式家具三十年经眼录
》
售價:NT$
2387.0
《
敦煌写本文献学(增订本)
》
售價:NT$
1010.0
《
耕读史
》
售價:NT$
500.0
《
地理计算与R语言
》
售價:NT$
551.0
《
沈括的知识世界:一种闻见主义的实践(中华学术译丛)
》
售價:NT$
398.0
《
大思维:哥伦比亚商学院六步创新思维模型
》
售價:NT$
332.0
|
編輯推薦: |
(1)作者背景权威:嬴图是一家国际领先的图数据库团队,拥有50多项图数据库专利,100%自主研发并拥有全部底层架构,服务于多家大型央企、国企及世界500强企业。
|
內容簡介: |
内容简介这是一本全面讲解当下主流图算法原理与工程实践的著作,旨在帮助读者在分析和处理各种复杂的数据关系时能更好地得其法、善其事、尽其能。全书共10章:第1~3章主要介绍图的思维方式、图算法基础以及如何评估图算法的效率;第4~9章主要讲解6类经典图算法,包括中心性算法、相似度算法、连通性和紧密度算法、传播与分类算法、拓扑链接预测算法、图嵌入算法等,一共20余种算法,详细讲解了这些算法的原理、参数以及行业应用。第10章以案例的方式讲解了图算法在金融、生物医药等领域的深度应用,旨在为广大图数据库的使用者、开发者提供启发性思考。本书概念清晰、内容丰富、实用性强、语言流畅,深入浅出、重点突出,既适合入门读者阅读,又适合有一定图数据库基础的进阶人员阅读。
|
關於作者: |
业界知名数据存储与大数据库专家、图数据库专家、图算法专家及学者;Ultipa联合创始人。拥有丰富的产品、技术、算法工程经验;持有十多项图数据库领域的技术成果和专利;作为Ultipa的嬴图团队的成员之一,参与著有《图数据库原理、架构与应用》《揭秘云计算与大数据》等多部科技畅销书。
|
目錄:
|
Contents 目 录
前言
第1章 图思维方式1
1.1 什么是图1
1.1.1 人类到底是如何思考的2
1.1.2 由一道面试题引发的思考6
1.2 图论与图计算10
1.2.1 图论及其发展史10
1.2.2 图计算概述15
第2章 图算法基础22
2.1 图算法的分类23
2.2 图分析与数据科学30
第3章 如何评估图算法的效率38
3.1 什么是算法效率38
3.2 查询模式、数据结构和计算效率40
3.2.1 查询模式41
3.2.2 数据结构与计算效率46
3.3 并发设计与加速58
第4章 中心性算法67
4.1 节点度中心性67
4.1.1 算法历史和原理67
4.1.2 算法复杂度与算法参数70
4.1.3 行业应用:零售信贷消费预测71
4.2 接近中心性72
4.2.1 算法历史和原理72
4.2.2 算法复杂度与算法参数74
4.2.3 行业应用:功能性场所选址75
4.3 中介中心性76
4.3.1 算法历史和原理76
4.3.2 算法复杂度与算法参数78
4.3.3 行业应用:交通枢纽评估79
4.4 网页排名79
4.4.1 算法历史和原理79
4.4.2 算法复杂度与算法参数82
4.4.3 行业应用:互联网网页排名82
4.5 虚假账号排名83
4.5.1 算法历史和原理83
4.5.2 算法复杂度与算法参数85
4.5.3 行业应用:社交网络恶意账号
识别85
第5章 相似度算法86
5.1 杰卡德相似度86
5.1.1 算法历史和原理86
5.1.2 算法复杂度与算法参数88
5.1.3 行业应用:度量学习模型的预测
准确性89
5.2 重叠相似度89
5.2.1 算法历史和原理89
5.2.2 算法复杂度与算法参数90
5.2.3 行业应用:文本相似度比较91
5.3 余弦相似度92
5.3.1 算法历史和原理92
5.3.2 算法复杂度与算法参数94
5.3.3 行业应用:人脸识别95
5.4 欧几里得距离 95
5.4.1 算法历史和原理95
5.4.2 算法复杂度与算法参数97
5.4.3 行业应用:异常检测97
5.5 皮尔森相关系数98
5.5.1 算法历史和原理98
5.5.2 算法复杂度与算法参数99
5.5.3 行业应用:构建相关性网络99
第6章 连通性和紧密度算法101
6.1 全图k邻101
6.1.1 算法历史和原理101
6.1.2 算法复杂度与算法参数105
6.1.3 行业应用:企业影响力分析
(工商和供应链图谱)106
6.2 三角形计算109
6.2.1 算法历史和原理109
6.2.2 算法复杂度与算法参数113
6.2.3 行业应用:社交网络紧密性114
6.3 二分图115
6.3.1 算法历史和原理115
6.3.2 算法复杂度与算法参数120
6.3.3 行业应用:地图着色问题121
6.4 连通分量122
6.4.1 算法历史和原理122
6.4.2 算法复杂度与算法参数128
6.4.3 行业应用:中继器网络安全系数
计算128
6.5 最小生成树129
6.5.1 算法历史和原理129
6.5.2 算法复杂度与算法参数134
6.5.3 行业应用:电力、网络线路
规划135
第7章 传播与分类算法137
7.1 标签传播137
7.1.1 算法历史和原理137
7.1.2 算法复杂度与算法参数142
7.1.3 行业应用:社交网络用户兴趣
分类143
7.2 k最近邻144
7.2.1 算法历史和原理144
7.2.2 算法复杂度与算法参数148
7.2.3 行业应用:手写识别与离群点
检测149
7.3 k均值150
7.3.1 算法历史和原理150
7.3.2 算法复杂度与算法参数153
7.3.3 行业应用:基于向量聚类的图像
颜色缩减153
7.4 鲁汶识别154
7.4.1 算法历史和原理154
7.4.2 算法复杂度与算法参数159
7.4.3 行业应用:用户社交关系
分类159
第8章 拓扑链接预测算法161
8.1 基于节点低阶相似性163
8.1.1 共同邻居163
8.1.2 AA指标164
8.1.3 资源分配166
8.1.4 优先连接168
8.2 基于节点高阶相似性170
8.2.1 最短距离170
8.2.2 Katz指标172
8.2.3 重启型随机游走174
8.2.4 SimRank指标177
8.3 行业应用:推荐系统180
第9章 图嵌入算法182
9.1 图嵌入的目的182
9.2 基于随机游走186
9.2.1 随机游走概述187
9.2.2 Skip-gram模型191
9.2.3 负采样196
9.2.4 损失函数198
9.3 基于图神经网络200
9.3.1 图神经网络概述200
9.3.2 图卷积网络201
9.3.3 GraphSAGE207
9.4 行业应用:药物不良反应预测210
第10章 图算法实战212
10.1 在流动性风险管理中的创新
应用213
10.1.1 应用背景概述214
10.1.2 传
|
內容試閱:
|
Preface 前 言
为何要写本书
近几年,全球科技的发展进入了从“数据化”到“智能化”的时代。各行各业涌现出了大量数据,这些数据种类繁多、来源各异、数量庞大,需要借助算法来发掘其中隐藏的巨大价值。其中,图算法提供了一种有效地分析和连接数据的方法。
本书作为市面上为数不多的面向数据科学应用的图算法书籍,是嬴图团队继《图数据库原理、架构与应用》(已由机械工业出版社出版,书号为978-7-111-70810-0)之后的又一部力作,旨在介绍有实用价值的图算法,并详解其中每个算法的历史、原理以及在实践中的应用等。
本书主要内容
本书主要介绍多种重要而实用的图算法。全书共10章,从图技术的历史、原理、架构到图算法的分类、原理、参数等进行介绍,并揭示了每个算法背后的行业应用。第1章阐述图是一种描述数据关系的新方式,它通过对数据的查询、演算和推理,能够更好地描述数据间的逻辑结构。第2章介绍图算法的分类、图分析以及数据科学。第3章具体介绍如何评估图算法的效率。第4~9章分门别类地介绍6类经典算法的原理、参数及行业应用。第10章着重介绍图算法在金融、生物医药等领域的深度应用,旨在启发广大图数据库使用者、开发者的进一步思考。
本书还提供了丰富的算法资料,大家可以通过网站https://www.ultipa.cn/document/ultipa-graph-analytics-algorithms进行阅读。
|
|