新書推薦:
《
打好你手里的牌(斯多葛主义+现代认知疗法,提升当代人的心理韧性!)
》
售價:NT$
301.0
《
新时代硬道理 广东寻路高质量发展
》
售價:NT$
352.0
《
6S精益管理实战(精装版)
》
售價:NT$
458.0
《
异域回声——晚近海外汉学之文史互动研究
》
售價:NT$
500.0
《
世界文明中的作物迁徙:聚焦亚洲、中东和南美洲被忽视的本土农业文明
》
售價:NT$
454.0
《
无端欢喜
》
售價:NT$
347.0
《
股票大作手操盘术
》
售價:NT$
245.0
《
何以中国·何谓唐代:东欧亚帝国的兴亡与转型
》
售價:NT$
398.0
|
內容簡介: |
《大数据复杂查询技术研究》比较全面地介绍云数据管理中多维索引与复杂查询、云环境下针对物联网数据的多维索引技术、可扩展的空间关键字查询、基于Map Reduce的概率集合相似性连接查询、大规模高维向量相似性连接查询、Top-k相似性连接查询、基于随机映射的相似性连接查询、相似性连接查询其他问题、大数据复杂查询面临的挑战等内容。力求向读者系统展示大数据复杂查询领域的最新研究动态,希望能够为从事相关研究的广大读者提供有益的参考和帮助,同时能够为大数据复杂查询相关理论与技术的发展起到一定的促进作用。
|
目錄:
|
目录前言第1章 绪论 1第2章 云数据管理中多维索引与复杂查询 42.1 概述 42.2 云数据管理中多维索引技术 42.2.1 云数据管理索引技术研究概述 52.2.2 基于分布式文件系统的索引 62.2.3 基于key-value存储的索引 142.2.4 针对不同数据类型的索引技术 192.3 空间关键字查询 272.3.1 两阶段索引 272.3.2 空间文本混合索引 282.3.3 空间关键字查询扩展 302.4 可扩展的相似性连接查询 312.4.1 集合相似性连接查询 322.4.2 向量相似性连接查询 362.4.3 空间数据相似性连接查询 402.4.4 概率数据相似性连接查询 412.4.5 字符串相似性连接查询 432.4.6 图数据相似性连接查询 432.5 本章小结 44第3章 云环境下针对物联网数据的多维索引技术 453.1 概述 453.2 MLM-Index 473.2.1 MLM-Index概述 473.2.2 MLM-Index关键技术 493.2.3 MLM-Index索引实现 533.2.4 基于MLM-Index的查询处理 553.2.5 实验分析 583.3 混合索引 653.3.1 混合索引概述 653.3.2 全局索引 663.3.3 局部索引 673.3.4 基于混合索引的查询处理 683.3.5 实验分析 713.4 本章小结 74第4章 可扩展的空间关键字查询 754.1 概述 754.2 空间关键字查询的定义 774.3 基于空间和文本的混合索引方案 784.3.1 STbHI结构 784.3.2 查询处理 804.3.3 优化方案 824.4 基于词聚类的倒排空间索引方案 834.5 实验分析 874.5.1 实验设置 874.5.2 改变数据集大小 884.5.3 改变查询词个数 904.5.4 改变查询范围 904.6 本章小结 91第5章 基于MapReduce的概率集合相似性连接查询 925.1 概述 925.2 集合相似性连接查询的相关工作 935.3 问题定义 945.3.1 集合级的概率集合数据库 945.3.2 概率集合相似性连接查询 945.4 基本的嵌套循环连接算法 955.4.1 BNLJ算法描述 955.4.2 代价分析 965.5 基于概率的前缀过滤算法 975.5.1 概率计算分析 975.5.2 基于概率的项频度排序 985.5.3 联合前缀过滤 995.5.4 基于Map端过滤的相似性连接查询算法 1005.5.5 基于Reduce端过滤的相似性连接查询算法 1025.5.6 基于混合过滤的相似性连接查询算法 1035.6 实验分析 1035.7 本章小结 107第6章 大规模高维向量相似性连接查询 1086.1 概述 1086.2 问题定义及基础知识 1106.2.1 问题定义 1106.2.2 基础知识 1106.3 基于SAX的高维向量相似性连接查询算法 1136.3.1 SAX-HDSJ算法概述 1136.3.2 SAX-HDSJ算法详细流程 1136.3.3 SAX-HDSJ算法代价分析 1176.4 高维向量相似性连接查询改进算法 1206.4.1 改进的SAX-HDSJ算法概述 1216.4.2 基于SAX的数据划分 1216.5 实验分析 1226.5.1 实验环境设置 1226.5.2 不同维度下的性能 1236.5.3 不同阈值下的性能 1246.5.4 不同数据规模下的性能 1256.5.5 均匀数据集和倾斜数据集上的性能 1276.6 基于多PAA过滤的相似性连接查询算法 1286.6.1 基于单PAA的向量相似性连接查询 1286.6.2 基于多PAA的向量相似性连接查询 1306.6.3 基于SAX的多PAA的向量相似性连接查询 1326.6.4 参数选择 1346.6.5 实验分析 1386.7 本章小结 142第7章 Top-k相似性连接查询 1437.1 概述 1437.2 问题定义 1437.3 基于阈值的Top-k相似性连接查询 1447.4 基于SAX的Top-k相似性连接查询 1447.4.1 查询框架 1447.4.2 实现流程 1457.4.3 实验分析 1497.5 基于阈值估计的Top-k相似性连接查询 1547.5.1 海量高维向量相似度分布直方图估计 1547.5.2 Top-k阈值估计 1557.5.3 基于阈值估计的Top-k相似性连接查询算法 1567.5.4 实验分析 1577.6 本章小结 161第8章 基于随机映射的相似性连接查询 1628.1 概述 1628.2 问题定义与基础知识 1628.3 基于单映射的并行相似性连接查询 1678.4 基于多映射的并行相似性连接查询 1698.5 基于映射空间划分的并行相似性连接查询 1728.5.1 基于映射空间划分的相似性连接查询框架 1728.5.2 基于MapReduce的相似性连接查询实现 1738.6 面向倾斜数据的相似性连接查询 1758.6.1 面向负载均衡的相似性连接查询 1758.6.2 基于距离划分树的相似性连接查询 1778.6.3 基于二维映射空间划分的相似性连接查询 1818.7 本章小结 182第9章 相似性连接查询其他问题 1839.1 概述 1839.2 负载均衡 1839.2.1 相似度计算负载评估模型 1839.2.2 相似性连接负载均衡策略 1849.3 多源数据相似性连接查询 1849.3.1 相似性连接查询结果大小估计 1859.3.2 多源数据相似性连接顺序选择策略 1859.3.3 多源高维大数据相似性连接查询算法 1869.4 基于LSH的KNN相似性连接查询 1869.4.1 LSH函数学习 1879.4.2 基于LSH的并行近似KNN连接查询 1889.4.3 KNN相似性连接查询改进方案 1899.5 本章小结 190第10章 大数据复杂查询面临的挑战 19110.1 大数据多维索引技术 19110.2 大数据复杂查询处理技术 193参考文献 195
|
|