新書推薦:
《
创客精选项目设计与制作 第2版 刘笑笑 颜志勇 严国陶
》
售價:NT$
281.0
《
佛山华家班粤菜传承 华家班59位大厨 102道粤菜 图文并茂 菜式制作视频 粤菜故事技法 佛山传统文化 广东科技
》
售價:NT$
1010.0
《
武人琴音(十周年纪念版 逝去的武林系列收官之作 形意拳一门三代:尚云祥、韩伯言、韩瑜的人生故事 凸显百年武人命运)
》
售價:NT$
199.0
《
剑桥斯堪的纳维亚戏剧史(剑桥世界戏剧史译丛)
》
售價:NT$
704.0
《
禅心与箭术:过松弛而有力的生活(乔布斯精神导师、世界禅者——铃木大拙荐)
》
售價:NT$
301.0
《
先进电磁屏蔽材料——基础、性能与应用
》
售價:NT$
1010.0
《
可转债投资实战
》
售價:NT$
454.0
《
王氏之死(新版,史景迁成名作)
》
售價:NT$
250.0
|
內容簡介: |
《大数据复杂查询技术研究》比较全面地介绍云数据管理中多维索引与复杂查询、云环境下针对物联网数据的多维索引技术、可扩展的空间关键字查询、基于Map Reduce的概率集合相似性连接查询、大规模高维向量相似性连接查询、Top-k相似性连接查询、基于随机映射的相似性连接查询、相似性连接查询其他问题、大数据复杂查询面临的挑战等内容。力求向读者系统展示大数据复杂查询领域的最新研究动态,希望能够为从事相关研究的广大读者提供有益的参考和帮助,同时能够为大数据复杂查询相关理论与技术的发展起到一定的促进作用。
|
目錄:
|
目录前言第1章 绪论 1第2章 云数据管理中多维索引与复杂查询 42.1 概述 42.2 云数据管理中多维索引技术 42.2.1 云数据管理索引技术研究概述 52.2.2 基于分布式文件系统的索引 62.2.3 基于key-value存储的索引 142.2.4 针对不同数据类型的索引技术 192.3 空间关键字查询 272.3.1 两阶段索引 272.3.2 空间文本混合索引 282.3.3 空间关键字查询扩展 302.4 可扩展的相似性连接查询 312.4.1 集合相似性连接查询 322.4.2 向量相似性连接查询 362.4.3 空间数据相似性连接查询 402.4.4 概率数据相似性连接查询 412.4.5 字符串相似性连接查询 432.4.6 图数据相似性连接查询 432.5 本章小结 44第3章 云环境下针对物联网数据的多维索引技术 453.1 概述 453.2 MLM-Index 473.2.1 MLM-Index概述 473.2.2 MLM-Index关键技术 493.2.3 MLM-Index索引实现 533.2.4 基于MLM-Index的查询处理 553.2.5 实验分析 583.3 混合索引 653.3.1 混合索引概述 653.3.2 全局索引 663.3.3 局部索引 673.3.4 基于混合索引的查询处理 683.3.5 实验分析 713.4 本章小结 74第4章 可扩展的空间关键字查询 754.1 概述 754.2 空间关键字查询的定义 774.3 基于空间和文本的混合索引方案 784.3.1 STbHI结构 784.3.2 查询处理 804.3.3 优化方案 824.4 基于词聚类的倒排空间索引方案 834.5 实验分析 874.5.1 实验设置 874.5.2 改变数据集大小 884.5.3 改变查询词个数 904.5.4 改变查询范围 904.6 本章小结 91第5章 基于MapReduce的概率集合相似性连接查询 925.1 概述 925.2 集合相似性连接查询的相关工作 935.3 问题定义 945.3.1 集合级的概率集合数据库 945.3.2 概率集合相似性连接查询 945.4 基本的嵌套循环连接算法 955.4.1 BNLJ算法描述 955.4.2 代价分析 965.5 基于概率的前缀过滤算法 975.5.1 概率计算分析 975.5.2 基于概率的项频度排序 985.5.3 联合前缀过滤 995.5.4 基于Map端过滤的相似性连接查询算法 1005.5.5 基于Reduce端过滤的相似性连接查询算法 1025.5.6 基于混合过滤的相似性连接查询算法 1035.6 实验分析 1035.7 本章小结 107第6章 大规模高维向量相似性连接查询 1086.1 概述 1086.2 问题定义及基础知识 1106.2.1 问题定义 1106.2.2 基础知识 1106.3 基于SAX的高维向量相似性连接查询算法 1136.3.1 SAX-HDSJ算法概述 1136.3.2 SAX-HDSJ算法详细流程 1136.3.3 SAX-HDSJ算法代价分析 1176.4 高维向量相似性连接查询改进算法 1206.4.1 改进的SAX-HDSJ算法概述 1216.4.2 基于SAX的数据划分 1216.5 实验分析 1226.5.1 实验环境设置 1226.5.2 不同维度下的性能 1236.5.3 不同阈值下的性能 1246.5.4 不同数据规模下的性能 1256.5.5 均匀数据集和倾斜数据集上的性能 1276.6 基于多PAA过滤的相似性连接查询算法 1286.6.1 基于单PAA的向量相似性连接查询 1286.6.2 基于多PAA的向量相似性连接查询 1306.6.3 基于SAX的多PAA的向量相似性连接查询 1326.6.4 参数选择 1346.6.5 实验分析 1386.7 本章小结 142第7章 Top-k相似性连接查询 1437.1 概述 1437.2 问题定义 1437.3 基于阈值的Top-k相似性连接查询 1447.4 基于SAX的Top-k相似性连接查询 1447.4.1 查询框架 1447.4.2 实现流程 1457.4.3 实验分析 1497.5 基于阈值估计的Top-k相似性连接查询 1547.5.1 海量高维向量相似度分布直方图估计 1547.5.2 Top-k阈值估计 1557.5.3 基于阈值估计的Top-k相似性连接查询算法 1567.5.4 实验分析 1577.6 本章小结 161第8章 基于随机映射的相似性连接查询 1628.1 概述 1628.2 问题定义与基础知识 1628.3 基于单映射的并行相似性连接查询 1678.4 基于多映射的并行相似性连接查询 1698.5 基于映射空间划分的并行相似性连接查询 1728.5.1 基于映射空间划分的相似性连接查询框架 1728.5.2 基于MapReduce的相似性连接查询实现 1738.6 面向倾斜数据的相似性连接查询 1758.6.1 面向负载均衡的相似性连接查询 1758.6.2 基于距离划分树的相似性连接查询 1778.6.3 基于二维映射空间划分的相似性连接查询 1818.7 本章小结 182第9章 相似性连接查询其他问题 1839.1 概述 1839.2 负载均衡 1839.2.1 相似度计算负载评估模型 1839.2.2 相似性连接负载均衡策略 1849.3 多源数据相似性连接查询 1849.3.1 相似性连接查询结果大小估计 1859.3.2 多源数据相似性连接顺序选择策略 1859.3.3 多源高维大数据相似性连接查询算法 1869.4 基于LSH的KNN相似性连接查询 1869.4.1 LSH函数学习 1879.4.2 基于LSH的并行近似KNN连接查询 1889.4.3 KNN相似性连接查询改进方案 1899.5 本章小结 190第10章 大数据复杂查询面临的挑战 19110.1 大数据多维索引技术 19110.2 大数据复杂查询处理技术 193参考文献 195
|
|