新書推薦:
《
万千心理·儿童心理治疗中的心智化:临床实践指导
》
售價:NT$
398.0
《
自我囚禁的人:完美主义的心理成因与自我松绑(破除你对完美主义的迷思,尝试打破自我评价过低与焦虑的恶性循环)
》
售價:NT$
301.0
《
周易
》
售價:NT$
203.0
《
东南亚的传统与发展
》
售價:NT$
306.0
《
乾隆制造
》
售價:NT$
398.0
《
资治通鉴臣光曰辑存 资治通鉴目录(司马光全集)(全二册)
》
售價:NT$
1316.0
《
明代社会变迁时期生活质量研究
》
售價:NT$
1367.0
《
律令国家与隋唐文明
》
售價:NT$
332.0
|
編輯推薦: |
本书除了系统方法的理论讲解之外,在每一章给出了每种方法的R语言实现的实例,提供PPT、源代码、实验手册、课程与实验大纲、按照知识点结构的学习参考视频(可通过微信扫一扫功能观看)等,均可到清华大学出版社官网下载使用。
|
內容簡介: |
本书详细介绍了大数据挖掘技术,全书分为3篇,共12章。第1篇为大数据分析基础,包括第1~4章,分别为大数据概述、大数据相关技术、数据预处理、R语言工具的使用。第2篇为大数据挖掘技术,包括第5~11章,分别为线性分类方法、分类方法、聚类分析、关联规则、预测方法与离群点诊断、时间序列分析、大数据挖掘可视化。第3篇为大数据挖掘案例,包括第12章,介绍了大数据挖掘应用案例。 本书既可作为高等学校计算机科学与技术、数据科学与大数据技术、统计学、数据分析等专业的高等教育教材,也可作为科研人员、从事大数据相关工作的技术人员的参考书。
|
內容試閱:
|
为什么要写这本书
大数据时代的到来,使我们的生活在政治、经济、社会、文化等各个领域都发生了很大的变化。如何从大数据中挖掘出隐含的丰富知识与价值,更好地得出结论并作出智能决策已成为相关工作者面临的机遇与挑战。
本书基于教育部2016年产学合作协同育人项目普开数据教学内容和课程体系改革项目,作为项目成果公开出版。
读者对象
本书适合作为高等教育大数据处理与大数据分析课程的教材,也可作为其他领域有数据分析需求的人员培训教材以及大数据从业人员的参考书。
如何阅读本书
本书首先介绍大数据,包括大数据的业务应用场景、云计算与大数据挖掘以及大数据挖掘过程。介绍了大数据相关技术,包括大数据获取、预处理、存储和处理、查询和分析、可视化技术以及主流大数据分析平台、R语言工具的使用。接着介绍了大数据挖掘常用的分类模型和算法,包括最基础的线性分类方法,分类器性能评价标准以及主要分类方法,内容包括K近邻分类器、贝叶斯分类、神经网络与深度学习、支持向量机等,着重介绍了聚类分析、关联规则、时间序列分析、预测方法与离群点诊断以及大数据挖掘可视化常用技术。最后对各行各业的大数据挖掘应用案例进行了详细介绍。除了系统方法的理论讲解之外,我们在每一章给出了每种方法的R语言实现的实例。每一章的小结处按知识点提供了参考学习视频,可通过微信APP的扫一扫功能扫描观看。
作者分工与感谢
本书由赵志升撰写第1章、第2章、第12章,李静撰写第3~5章,梁俊花撰写第6章、第8章、第10章,赵志升、刘洋合写第7章、第9章、第11章。最终由赵志升、梁俊花统稿校对。感谢河北省人口健康工程技术研究中心医疗大数据研究室的人员参与本书的写作与实例算法实现,他们是靳晓松、王秀苹、吴仪、韩冰月、高雅静、李凯璇、李佳垚、樊亚宁、贾晓莹、傅轩昂、张艺璇、郭明磊、刘恬恬等。在编写的过程中也得到了刘艳霞、宋玉玺老师的帮助。本书参考了国内外学者的大量成果文献,在此一并表示诚挚的谢意。
勘误和支持
由于大数据挖掘是一个正在蓬勃发展的学科领域,涉及的内容宽泛且变化迅速,鉴于作者水平有限,在本书内容的安排、表述、推导等方面各种不当之处在所难免,敬请作者在阅读本书的过程中不吝赐教,以改进此书,读者的意见和建议请发至邮箱zzsbigdata@sina.com。
编者2018年11月
|
|