登入帳戶  | 訂單查詢  | 購物車/收銀台(0) | 在線留言板  | 付款方式  | 聯絡我們  | 運費計算  | 幫助中心 |  加入書簽
會員登入   新用戶註冊
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2023年度TOP分類閱讀雜誌 香港/國際用戶
最新/最熱/最齊全的簡體書網 品種:超過100萬種書,正品正价,放心網購,悭钱省心 送貨:速遞 / 物流,時效:出貨後2-4日

2024年10月出版新書

2024年09月出版新書

2024年08月出版新書

2024年07月出版新書

2024年06月出版新書

2024年05月出版新書

2024年04月出版新書

2024年03月出版新書

2024年02月出版新書

2024年01月出版新書

2023年12月出版新書

2023年11月出版新書

2023年10月出版新書

2023年09月出版新書

『簡體書』概率数据结构与算法:面向大数据应用

書城自編碼: 3781622
分類: 簡體書→大陸圖書→計算機/網絡计算机理论
作者: 安德烈·加霍夫
國際書號(ISBN): 9787111710547
出版社: 机械工业出版社
出版日期: 2022-08-01

頁數/字數: /
書度/開本: 16开 釘裝: 平装

售價:NT$ 403

我要買

share:

** 我創建的書架 **
未登入.



新書推薦:
真需求
《 真需求 》

售價:NT$ 505.0
阿勒泰的春天
《 阿勒泰的春天 》

售價:NT$ 230.0
如见你
《 如见你 》

售價:NT$ 234.0
人格阴影  全新修订版,更正旧版多处问题。国际分析心理学协会(IAAP)主席力作
《 人格阴影 全新修订版,更正旧版多处问题。国际分析心理学协会(IAAP)主席力作 》

售價:NT$ 305.0
560种野菜野果鉴别与食用手册
《 560种野菜野果鉴别与食用手册 》

售價:NT$ 305.0
中国官僚政治研究(一部洞悉中国政治制度演变的经典之作)
《 中国官僚政治研究(一部洞悉中国政治制度演变的经典之作) 》

售價:NT$ 286.0
锂电储能产品设计及案例详解
《 锂电储能产品设计及案例详解 》

售價:NT$ 505.0
首辅养成手册(全三册)(张晚意、任敏主演古装剧《锦绣安宁》原著小说)
《 首辅养成手册(全三册)(张晚意、任敏主演古装剧《锦绣安宁》原著小说) 》

售價:NT$ 551.0

建議一齊購買:

+

NT$ 435
《 一本书读懂物联网(第3版) 》
+

NT$ 352
《 机器人简史(第三版)(全彩) 》
+

NT$ 866
《 泛函分析导论及应用 》
+

NT$ 498
《 GD&T几何公差入门与提高 》
+

NT$ 413
《 区块链技术及应用(第二版) 》
+

NT$ 768
《 DK图解计算机科学 儿童STEM创新思维培养 》
內容簡介:
本书共6章。每章都专门针对大数据应用中的一个特定问题,首先对该问题进行深入的解释,然后介绍可用于有效解决该问题的数据结构和算法。第1章简要概述了概率数据结构中广泛使用的散列函数和散列表。第2章专门介绍近似成员查询,这是概率数据结构*著名的用例之一。第3章讨论了用来辅助估算元素基数的概率数据结构。第4章和第5章讨论流式场景下与频数和排序相关的重要指标的计算。第6章包含用于解决相似性问题的数据结构和算法,尤其是近邻搜索问题。
目錄
译者序前言第1章 散列11.1 加密散列函数21.2 非加密散列函数51.3 散列表71.4 总结13本章参考文献13第2章 成员查询152.1 布隆过滤器162.2 计数布隆过滤器242.3 商数过滤器272.4 布谷过滤器382.5 总结46本章参考文献46第3章 基数493.1 线性计数513.2 概率计数553.3 LogLog和HyperLogLog633.4 总结74本章参考文献74第4章 频数774.1 多数投票算法804.2 频繁算法824.3 Count Sketch864.4 CountMin Sketch964.5 总结105本章参考文献105第5章 排序1075.1 随机采样1095.2 q-摘要1165.3 t-摘要1255.4 总结135本章参考文献136第6章 相似性1396.1 局部敏感散列1496.2 MinHash1536.3 SimHash1656.4 总结174本章参考文献174
內容試閱
大数据特征可从三个基本维度来刻画,体量(volume)、速度(velocity)和多样性(variety),即大数据的三个v。其中,体量表示数据的总量,速度描述数据到达和被处理的速度,多样性指数据类型的个数。数据无处不在,包括社交媒体、各种传感器、金融交易等。IBM曾声称人们每天创造的数据总量达2.5 EB(2.5 quintillion byte)。这一数字仍然在持续增长,而且大部分数据不能被存储,这些数据经常未经处理就被丢弃。现如今,需要处理TB或PB数量级的语料库以及千兆位速率的数据流的应用场景并不罕见。另一方面,当下每个公司都想要完全理解所拥有的数据,以便发现其中的价值并做出相应决策。这导致了大数据软件市场的迅猛发展。然而,包含数据结构和算法在内的传统技术在处理大数据时是低效的。因此,许多软件从业人员不断地在计算机科学中寻找合适的解决方案。其中一种可选的解决方案就是使用概率数据结构和算法。概率数据结构是一类主要基于不同散列技巧的数据结构的统称。不同于常规数据结构(又称确定性数据结构),概率数据结构总是提供近似的答案,但通过可靠的方式估计可能存在的误差。幸运的是,这些潜在的损失和误差可以被极低的内存需求、恒定的查询时间和良好的可扩展性充分弥补。这些因素在大数据应用中是至关重要的。关于本书本书面向技术从业人员,包括软件架构师、开发人员以及技术决策者,介绍概率数据结构和算法。通过阅读本书,你将能够对概率数据结构有理论和实践级别的了解,同时了解它们常见的使用场景。本书不面向科学家,但是要想充分使用本书,你需要具备基本的数学知识,并且需要对数据结构和算法的一般理论有一定的了解。如果你没有任何“计算机科学”的经验,我们强烈推荐你阅读由Thomas H. Cormen,Charles E. Leiserson,Ronald L.Rivest和Clifford Stein(MIT)所撰写的《算法导论》,其中有对计算机算法现代研究的全面介绍。本书虽然不可能涵盖当前所有的出色解决方案,但将重点介绍它们的共同思想和重要的应用领域,包括成员查询、基数估计、流挖掘和相似性估计。全书组织结构本书共6章。每章前面都有引言,后面都有一个简短的总结和参考文献,以供读者进一步阅读与该章有关的内容。每章都专门针对大数据应用中的一个特定问题,首先对该问题进行深入的解释,然后介绍可用于有效解决该问题的数据结构和算法。第1章简要概述概率数据结构中广泛使用的散列函数和散列表。第2章专门介绍近似成员查询,这是概率数据结构最著名的用例之一。第3章讨论用来辅助估算元素基数的概率数据结构。第4章和第5章讨论流式场景下与频数和排序相关的重要指标的计算。第6章包含用于解决相似性问题的数据结构和算法,尤其是近邻搜索问题。网络上的本书你可以在https://pdsa.gakhov.com上找到本书的勘误、示例和其他信息。如果你对本书有任何评论与技术问题,想报告发现的错误或任何其他问题,请发送电子邮件至pdsa@gakhov.com。如果你对本书中很多数据结构和算法的Cython实现感兴趣,请在https://github.com/gakhov/pdsa上查看我们的免费开放源代码Python库PDSA。欢迎大家随时做出贡献。关于作者Andrii Gakhov是一名数学家和软件工程师,拥有数学建模和数值方法方向的博士学位。他曾在乌克兰的哈尔科夫国立大学计算机科学学院任教多年,目前是Ferret go GmbH的软件从业人员,后者是德国领先的社区审核、自动化和分析公司。他的研究兴趣包括机器学习、流挖掘和数据分析。与作者联系的最佳方式是通过推特账户@gakhov或访问他的个人主页https://www.gakhov.com。致谢感谢Asmir Mustafic、Jean Vancoppenolle和Eugen Martynov为审阅本书做出的贡献以及他们的有益建议。感谢学术评论家Kateryna Nesvit博士和Dharavath Ramesh博士的宝贵建议和意见。特别感谢t-摘要算法的作者Ted Dunning。Ted Dunning对相应章节进行了精准的审阅,提出了有见地的问题和许多有益的意见。最后,感谢所有提供反馈并帮助本书成功出版的各位。

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 台灣用户 | 香港/海外用户
megBook.com.tw
Copyright (C) 2013 - 2024 (香港)大書城有限公司 All Rights Reserved.