新書推薦:
《
王阳明大传:知行合一的心学智慧(精装典藏版)
》
售價:NT$
1010.0
《
失衡与重塑——百年变局下的中国与世界经济
》
售價:NT$
602.0
《
不被定义的年龄:积极年龄观让我们更快乐、健康、长寿
》
售價:NT$
352.0
《
南方谈话:邓小平在1992
》
售價:NT$
367.0
《
纷纭万端 : 近代中国的思想与社会
》
售價:NT$
500.0
《
中国古代文体形态研究(第四版)(中华当代学术著作辑要)
》
售價:NT$
765.0
《
朋党之争与北宋政治·大学问
》
售價:NT$
454.0
《
甲骨文丛书·波斯的中古时代(1040-1797年)
》
售價:NT$
403.0
|
內容簡介: |
本书通过两个基本项目介绍了Scala语言的基本语法、函数式编程、高阶函数、模式匹配等相关知识和技术;通过12个实训项目,介绍了Spark的技术栈,内容涵盖Spark Core、Spark SQL、Spark结构化流和Spark机器学习库等相关模块和技术。每个项目相对独立、完整,分为若干个任务,围绕具体的任务来介绍相关的理论知识,并进行应用分析,有利于读者更好地理解、掌握课程知识。考虑到职业教育的特点以及大数据发展的趋势,本书的理论知识以实用、够用为主,不追求面面俱到,同时又保持一定的技术先进性和前瞻性。本书适合作为高职高专院校计算机及相关专业的教材或参考书,也可作为程序员、数据分析师、相关专业学生以及想进入大数据处理技术行业的读者学习的参考用书。本书配有电子课件、源代码等教学资源。教师可登录机械工业出版社教育服务网(www.cmpedu.com)注册后免费下载或联系编辑(010-88379807)咨询。
|
目錄:
|
前 言学习单元 1........................................................1项目1 搭建Scala开发环境......................................................................3项目2 实现一个简单的商品管理系统(CMS).......................................11单元小结.................................................................................................44学习单元 2.....................................................47项目1 搭建Spark standalone集群.......................................................49项目2 部署和运行Spark作业................................................................55项目3 安装和使用基于Web的notebook开发工具..................................61项目4 安装和使用IntelliJ IDEA集成开发环境.........................................66单元小结.................................................................................................81学习单元 3.....................................................83项目1 电商网站用户行为分析................................................................85项目2 分析电影评分数据集...................................................................96单元小结...............................................................................................102学习单元 4...................................................105项目1 分析电影数据集........................................................................107项目2 分析银行客户数据.....................................................................121单元小结...............................................................................................127学习单元 5...................................................129项目1 实时检测与分析物联网设备故障................................................131项目2 股票仪表板实现........................................................................140单元小结...............................................................................................149学习单元 6....................................................151项目1 数据探索 ...............................................................................153项目2 数据准备 ...............................................................................165单元小结...............................................................................................179参考文献......................................................180
|
內容試閱:
|
本书特点:考虑到职业教育的特点,本书的理论知识以实用、够用为主,不追求理论深度和面面俱到。本书以项目为驱动,采用项目任务式的编写方式,每个基本项目相对独立、完整,分为若干个子任务来完成,有相关的理论知识介绍,有知识的应用分析,还有具体的任务实施步骤和关键代码。又兼顾到大数据技术的快速发展,本书的内容又有一定的前瞻性,以保持技术领先。本书共6个单元。学习单元1介绍Spark的主流开发语言Scala,深度以支撑Spark学习为限,包括Scala的基本语法、函数式编程、高阶函数使用、模式匹配等相关内容,通过两个项目让读者掌握Scala开发环境搭建以及Scala编程应用。学习单元2介绍Spark的集群搭建和开发环境准备,包括Spark Shell、Spark submit、Zeppelin、IntelliJ IDEA等各种开发工具的使用,通过4个项目让读者能够独立搭建Spark大数据开发和运行环境。学习单元3通过“电商网站用户行为分析”和“分析电影评分数据集”项目,介绍了Spark的核心—— RDD,以及对RDD进行的操作和各种算子。学习单元4包括两个项目,分别是“分析电影数据集”和“分析银行客户数据”,分别介绍了Spark SQL中DataFrame数据结构的使用,应用SQL对大数据进行分析,并介绍了如何对分析结果进行可视化的技术。学习单元5着重介绍Spark中的实时处理模块,即结构化流处理技术,通过“实时检测与分析物联网设备故障”和“股票仪表板实现”项目,介绍了如何将Spark结构化流应用到实时计算场景,并掌握Kafka和Spark流整合的技术。学习单元6则通过两个项目让读者掌握应用Spark进行探索性数据分析和探索性数据可视化的技术,以及对数据进行整合、清洗和转换的处理技术和流程。读者对象:本书面向高职高专计算机、信息管理和大数据等相关专业的学生,可以作为专业必修课或选修课的教材。另外本书也适合各大中专院校、培训机构以及想通过自学掌握大数据处理与分析技术的读者。配套资源:本书配有电子课件、源代码等教学资源。教学建议:单 元理 论 学 时操 作 学 时学习单元144学习单元244学习单元344学习单元444学习单元544学习单元644编写队伍:本书由辛立伟、唐中剑任主编,唐美霞、张磊、任刚、饶志凌任副主编,参与编写的还有余姜德、熊建、陈位妮、向冲、郜广兰和王晶晶。其中,唐中剑编写了学习单元2,唐美霞和张磊编写了学习单元3,任刚和郜广兰编写了学习单元1,饶志凌和陈位妮编写了学习单元4,余姜德、熊建和向冲编写了学习单元6,辛立伟和王晶晶编写了学习单元5。北京西普阳光教育科技股份有限公司在教材编写过程中提供了大量技术支持和真实的案例。由于编者水平有限,书中难免存在错误和不妥之处,恳请读者批评指正。编 者
|
|