新書推薦:
《
亚洲戏剧史·南亚卷
》
售價:NT$
653.0
《
中国历代竹器图谱与数字活化
》
售價:NT$
2540.0
《
EDA技术与设计(第2版)
》
售價:NT$
387.0
《
揉碎浪漫(全两册)
》
售價:NT$
320.0
《
古籍善本
》
售價:NT$
2448.0
《
人民币国际化报告2024:可持续全球供应链体系与国际货币金融变革
》
售價:NT$
398.0
《
道德经新注 81幅作者亲绘哲理中国画,图文解读道德经
》
售價:NT$
653.0
《
清俗纪闻
》
售價:NT$
449.0
|
內容簡介: |
本书从大数据的基础知识介绍开始,逐步引领读者了解大数据管理与应用的前沿技术,系统地介绍了大数据管理与应用的体系化流程,包括数据采集与融合、数据存储与管理、大数据处理与分析、大数据决策支持及其案例和实验。本书内容深入浅出,提供了丰富的大数据案例并配套详细的代码,旨在帮助读者更加清晰地理解大数据基础知识,掌握大数据技术在管理学科中的应用。
本书可作为大数据学科本科生和研究生的教材,还可供大数据产业从业者使用。
|
目錄:
|
前言
第1章大数据管理与应用概述
1.1什么是大数据
1.2大数据管理与应用
1.3大数据管理与应用前沿
1.4大数据管理与应用技术
参考文献
第2章大数据技术基础知识
2.1Hadoop生态系统简介
2.2Linux简介
2.3Python基础知识
实验一Python环境搭建
实验二基于Python语言的Spark实战
参考文献
第3章数据采集与融合
3.1数据资源
3.2常见数据采集途径
3.3多源数据融合
实验三网络爬虫
实验四Kafka操作
参考文献
第4章数据存储与管理
4.1数据存储简介
4.2分布式文件系统
4.3数据库和数据仓库
4.4数据管理
实验五HBase操作
实验六弹性搜索应用实例
参考文献
第5章大数据处理与分析技术
5.1大数据计算框架概述
5.2文本数据处理与分析
5.3图像数据处理与分析
5.4音频数据处理与分析
5.5视频数据处理与分析
参考文献
第6章大数据决策支持
6.1大数据决策概述
6.2可视化分析方法
6.3机器学习方法
6.4计量经济学方法
参考文献
第7章大数据应用研究案例
7.1大数据机器学习研究案例
7.2大数据计量模型研究案例
参考文献
第8章大数据决策支持实验
8.1大数据机器学习实验
8.2大数据计量经济分析实验
参考文献
|
內容試閱:
|
近年来,大数据技术逐步深入到人们社会生活及经济发展的各个方面,目前已经广泛应用于医疗服务、零售、金融、物流等行业。通过获取、存储、处理数量巨大、来源分散、格式多样的海量数据,人们可以从中发现新知识,创造新价值,提升新能力,在管理实践方面,通过对海量数据进行处理与分析,人们可以实时监控企业运营数据、识别业务异常点,支持大数据驱动的管理决策,帮助企业实现价值增值,提高核心竞争力。在管理学术研究中,大数据环境下的理论研究与应用是目前研究的一个热点,通过ABI、INFORM商业管理数据库检索发现,在2009年至2019年间,共有2153篇与大数据相关的论文,其中管理领域顶级期刊Management Science上有596篇,Organization Science上有295篇,Information Systems Research上有196篇。
基于此背景,西安交通大学管理学院于2018年开设大数据管理与应用本科专业,以市场的发展需求为导向,培养掌握基本管理学理论及信息技术方法并能将其应用于商业管理及决策的复合型人才。在一个全新的专业中,如何为管理类专业学生寻找合适的大数据教材仍是现在面临的难题。现有的大数据教材关注基础理论的推导、实现及工程化的过程,缺少培养学生基于大数据技术解决复杂商业问题能力的知识体系,更适合数学、计算机等学科的学生使用。
本书在保留传统大数据理论与方法的基础上,针对管理类专业学生的特点,简化大数据环境的配置问题,增加了丰富的实验案例及详细的操作步骤,使学生兼具理工科思维与管理思维。
本书共分为8章。
第1章:大数据管理与应用概述。本章主要讲述了大数据的相关概念,包括其发展历程、特点与分类、应用价值与前沿应用等。通过学习本章,读者可以了解目前大数据管理与应用的背景、现状及发展前景,熟悉大数据环境下的商业思维,了解大数据价值实现的一般流程。
第2章:大数据技术基础知识。本章首先介绍了Hadoop大数据软件生态系统,包括HDFS、Hive、HBase等Hadoop组件以及Spark Streaming等流式数据处理方式,并附以详细的环境搭载步骤,降低读者配置大数据环境的难度;其次介绍了大数据环境下需要掌握的Linux和Python基础知识,旨在使读者可以根据本书内容直接着手处理大数据。
第3章:数据采集与融合。本章期望拓宽读者的数据视野,使其在面临复杂商业问题时具有甄别合适数据源的能力。本章着重介绍了6种不同源数据的获取方式及数据融合的方法,用Python爬虫实例和Kafka实例帮助读者掌握数据获取的一般流程。
第4章:数据存储与管理。本章围绕大数据的存储问题主要介绍了分布式文件系统、数据库、数据仓库等数据存储方式,以及数据质量、安全和隐私问题。本章旨在使读者对数据存储管理的基础知识有一定程度的掌握。通过本章的学习,读者可熟练掌握常用数据库的基本操作,并对数据质量、安全和隐私管理有较为深入的理解。
第5章:大数据处理与分析技术。本章首先介绍了大数据计算框架的两种类型,随后分别介绍了文本数据、图像数据、音频数据、视频数据的处理与分析。本章旨在使读者对大数据处理与分析技术有一定程度的掌握。通过本章的学习,读者可熟练掌握大数据处理和分析的基本技术,并且可直接上手处理文本数据、图像数据、音频数据和视频数据。
第6章:大数据决策支持。本章首先介绍了大数据环境下决策的特点和趋势,然后介绍了大数据决策支持中主要的3种技术方法——可视化分析方法、机器学习方法和计量经济学方法。
第7章:大数据应用研究案例。本章选取了近年来人工智能和管理科学领域中6个有典型意义的应用研究作为案例,解读和分析其中的研究思路和使用方法,让读者了解大数据环境下的研究主题,掌握如何从海量数据中挖掘有价值的微观行为特征。
第8章:大数据决策支持实验。本章包含两个实验——大数据机器学习实验和大数据计量经济分析实验,让读者可以对大数据应用与决策支持有较为深入的掌握,从而学会运用大数据处理和分析技术对实际问题建立模型,提升解决实际问题的能力。
本书作者均来自西安交通大学。在本书成稿过程中,从材料收集、内容设计、案例实现到文字整理等方面,离不开以下同学的付出:蔡旭东、姜晓薇、杨晓恬、刘佳璠、张淼、毛敏加、李振宇、魏宇、王乐、王琰欣、任一民、杨康、郑乃颂、付梁毓、田文斌、何瑞欣、董菊萌、李家钊、马琳、李简、李顺、刘浩、褚启伍。
此外,学校发展教育教学的决心和行动也给予了我们莫大的支持。限于水平,不足之处在所难免,敬请读者和同行批评指正。电子邮件地址是zhaoxi1@mailxjtueducn。
赵玺
|
|