新書推薦:
《
乐道文库·什么是秦汉史
》
售價:NT$
367.0
《
汉娜·阿伦特与以赛亚·伯林 : 自由、政治与人性
》
售價:NT$
500.0
《
女性与疯狂(女性主义里程碑式著作,全球售出300万册)
》
售價:NT$
500.0
《
药食同源中药鉴别图典
》
售價:NT$
305.0
《
设计中的比例密码:建筑与室内设计
》
售價:NT$
398.0
《
冯友兰和青年谈心系列:看似平淡的坚持
》
售價:NT$
254.0
《
舍不得星星:全2册
》
售價:NT$
356.0
《
汉字理论与汉字阐释概要 《说解汉字一百五十讲》作者李守奎新作
》
售價:NT$
347.0
|
內容簡介: |
本书以管理和应用视角解读大数据,以大数据分析全生命周期为主线,从大数据的采集、存储、预处理、分析、可视化、治理等环节切入,对大数据管理与应用的理论、方法、工具和应用进行科学合理的组织。本书包含十六章,分为四篇:概念篇主要介绍大数据管理与应用的基本概念、分析的基本思路;基础篇主要介绍大数据管理与应用的数学基础和机器学习基础;技术篇主要介绍大数据管理应用的数据采集与存储技术、数据预处理技术、数据回归分析技术、数据分类分析技术、数据聚类分析技术、数据关联分析技术、深度学习技术、文本分析技术、Web分析技术、可视化技术、数据治理技术;平台与发展篇介绍大数据计算平台和综述大数据管理与应用的新进展。 本书可作为高等学校大数据管理与应用、信息管理与信息系统、数据科学与大数据技术等管理类、信息类专业本科生教材,还可以作为各行各业的管理者与实践者的培训用书和参考读物。
|
關於作者: |
王刚,复旦大学管理学博士,教授,博士生导师,入选国家级人才计划。国际著名期刊DSS副主编,国际标准化组织ISO/IEC TC268工作组专家,入选2021年、2022年爱思唯尔(Elsevier)中国高被引学者。科学研究方面,主要从事信息管理与信息系统,数据科学与大数据技术相关领域的研究工作。主持国家自然科学基金项目5项,安徽省杰出青年基金等省部级课题10余项。在科学出版社出版学术专著2部,在MIS Quarterly,DSS,IEEE会刊等国内外学术期刊发表研究论文100余篇。多项成果获自然科学奖,数据空间大会优秀科技成果奖以及省部级以上领导批示。教育教学方面,主持产学合作协同育人项目“工程管理与智能制造虚拟仿真联合实验室”(实践条件和实践基地建设(200万新工科)),安徽省质量工程项目6项。主持“基于工业大数据分析的工程机械高端装备智能运维”国家级一流本科课程(虚拟仿真实验教学课程)。获安徽省教学成果特等奖4项,一等奖3项。
|
目錄:
|
第一部分概念篇
第一章绪论/
第一节大数据时代/
第二节数据和大数据/
第三节大数据的管理与应用概述/
第四节大数据管理与应用的理论、技术
和应用体系/
第五节应用案例/
思考与练习/
本章扩展阅读/
第二部分基础篇
第二章大数据管理与应用的数学基础/
第一节线性代数基础/
第二节优化基础/
第三节统计基础/
第四节应用案例/
思考与练习/
本章扩展阅读/
第三章大数据管理与应用的机器学习
基础/
第一节机器学习概述/
第二节机器学习的分类/
第三节模型评估与选择/
第四节计算学习理论/
第五节应用案例/
思考与练习/
本章扩展阅读/
第三部分技术篇
第四章数据采集与数据存储/
第一节数据采集/
第二节关系型数据存储/
第三节非关系型数据存储/
第四节数据仓库/
第五节应用案例/
思考与练习/
本章扩展阅读/
第五章数据预处理/
第一节数据质量/
第二节数据清洗/
第三节数据变换/
第四节数据集成/
第五节其他预处理方法/
第六节应用案例/
思考与练习/
本章扩展阅读/
第六章数据回归分析/
第一节数据回归分析概述/
第二节线性回归分析/
第三节岭回归分析和LASSO回归分析/
第四节广义线性回归分析/
第五节非线性回归分析/
第六节应用案例/
思考与练习/
本章扩展阅读/
第七章数据分类分析/
第一节数据分类分析概述/
第二节基于函数的分类分析/
第三节基于概率的分类分析/
第四节基于最近邻的分类分析/
第五节基于决策树的分类分析/
第六节基于规则的分类分析/
第七节集成分类分析/
第八节应用案例/
思考与练习/
本章扩展阅读/
第八章数据聚类分析/
第一节数据聚类分析概述/
第二节基于层次的聚类分析/
第三节基于划分的聚类分析/
第四节基于密度的聚类分析/
第五节基于网格的聚类分析/
第六节基于模型的聚类分析/
第七节集成聚类分析/
第八节应用案例/
思考与练习/
本章扩展阅读/
第九章数据关联分析/
第一节数据关联分析概述/
第二节关联规则分析/
第三节序列模式分析/
第四节应用案例/
思考与练习/
本章扩展阅读/
第十章深度学习/
第一节深度学习概述/
第二节神经网络/
第三节深度前馈网络/
第四节卷积神经网络/
第五节循环神经网络/
第六节应用案例/
思考与练习/
本章扩展阅读/
第十一章文本分析/
第一节文本分析概述/
第二节文本预处理/
第三节特征提取和文本表示方法/
第四节文本分类分析/
第五节文本聚类分析/
第六节应用案例/
思考与练习/
本章扩展阅读/
第十二章Web分析/
第一节Web分析概述/
第二节Web内容分析/
第三节Web结构分析/
第四节Web使用分析/
第五节应用案例/
思考与练习/
本章扩展阅读/
第十三章可视化技术/
第一节可视化概述/
第二节可视化主要类型 /
第三节可视化主要方法/
第四节可视化评测/
第五节应用案例 /
思考与练习/
本章扩展阅读/
第十四章数据治理/
第一节数据治理概述/
第二节元数据治理/
第三节数据质量治理/
第四节数据安全治理/
第五节数据治理评估/
第六节应用案例/
思考与练习/
本章扩展阅读/
第四部分平台与发展篇
第十五章大数据计算平台/
第一节大数据计算平台概述/
第二节基于Hadoop的大数据计算平台/
第三节基于Spark的大数据计算平台/
第四节应用案例/
思考与
|
內容試閱:
|
随着信息技术的不断发展,特别是由于信息技术的不断普及以及互联网延伸,无处不在的信息技术应用带来了数据的不断增长,而且是超几何增长,数据日益成为重要的战略资源和新生产要素,对数据进行充分的挖掘和有效利用,能够对全球生产、流通、分配、消费活动以及经济运行机制、社会生活方式和国家治理能力产生重要影响。
大数据是以容量大、类型多、存取速度快、应用价值高为主要特征的数据集合,正快速发展为对数量巨大、来源分散、格式多样的数据进行采集、存储和关联分析,并从中发现新知识、创造新价值、提升新能力的新一代信息技术和服务业态。大数据一方面给我们带来了重要机遇——数据资产和洞察未来的能力,另一方面也对我们提出了巨大的挑战——大数据中价值信息的提取、大数据的信息安全以及大数据相关人才的缺乏等。在此背景下,系统地学习和掌握大数据管理与应用的基础知识和理论是高等学校学生适应科学技术和社会发展的必然要求。
本书从管理和应用的视角来解读大数据,以大数据分析全生命周期为主线,从大数据的采集、存储、预处理、分析、可视化、治理等环节切入,对大数据管理与应用的理论、方法、工具和应用进行科学合理的组织,形成了注重介绍大数据理论与方法、强调理论联系实践的教材特色。通过对本书的学习,学生可以理解大数据管理与应用的基本概念和基础理论,掌握大数据管理与应用的核心技术和方法,学生运用大数据分析工具解决具体问题的能力也能得到有针对性的培养。在编写过程中,我们积极吸取国内外同类教材的先进性,同时注意形成自身的特色。
第一,注重学科融合。大数据管理与应用涉及管理、信息等学科内容,在教材编写过程中,我们注重将相关学科知识有机地融为一体,重构了大数据管理与应用的知识体系。
第二,教材内容的先进性。在内容选取时,我们参阅了大量的相关文献,并将其与我们自身的最新研究成果相结合,整合后融入教材之中,力争反映大数据管理与应用的前沿知识。
第三,理论与实践相结合。书中除大数据理论知识和技术基础外,我们还精选了多个大数据应用案例进行分析。在案例选择上,以本土案例为主,并尽可能选自不同的行业和领域,帮助学生理解大数据分析技术在企业中的具体应用。
本书包含十六章,分为四个部分:概念篇主要介绍大数据管理与应用的基本概念、分析的基本思路;基础篇主要介绍大数据管理与应用的数学基础和机器学习基础;技术篇主要介绍大数据管理应用的数据采集与存储技术、数据预处理技术、数据回归分析技术、数据分类分析技术、数据聚类分析技术、数据关联分析技术、深度学习技术、文本分析技术、Web分析技术、可视化技术、数据治理技术;平台与发展篇介绍大数据计算平台并综述大数据管理与应用的新进展。
本书由合肥工业大学管理学院王刚教授任主编,刘婧副教授、邵臻副教授任副主编,凌海峰副教授、董骏峰副教授、倪丽萍副教授参编。各章的编写工作分工如下:王刚负责本书的统稿,并负责编写第一、三、六、七、八、十五、十六章,刘婧负责编写第九、十、十三章,邵臻负责编写第二、五章,凌海峰负责编写第十二、十四章,董骏峰负责编写第四章,倪丽萍负责编写第十一章。另外,合肥工业大学博士研究生张峰、马敬玲、张亚楠、王含茹、卢明凤、夏平凡、魏娜,硕士研究生黄晶丽、李慧、祝贺功、孟祥睿、徐旺、陈星月、周秀娜、昂瑞、杨雨蝶、韩钧、王晓莹、孙文君、贵丽等在书稿的编写过程中做了大量资料搜集整理、文档编辑等工作。在此,谨向他们表示最诚挚的谢意。
在本书的编写过程中,我们参考了大量的国内有关研究成果,在此对所涉及的专家、学者表示衷心感谢。
大数据管理与应用是一门日新月异的学科,且涉及管理科学和信息科学中的多个领域,作者水平有限,书中难免有疏漏或不妥之处,恳请广大读者不吝赐教,以便再版时及时更正。
编者
2022年9月3日
|
|