登入帳戶  | 訂單查詢  | 購物車/收銀台( 0 ) | 在線留言板  | 付款方式  | 聯絡我們  | 運費計算  | 幫助中心 |  加入書簽
會員登入 新註冊 | 新用戶登記
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2023年度TOP分類閱讀雜誌 香港/國際用戶
最新/最熱/最齊全的簡體書網 品種:超過100萬種書,正品正价,放心網購,悭钱省心 送貨:速遞 / EMS,時效:出貨後2-3日

2024年08月出版新書

2024年07月出版新書

2024年06月出版新書

2024年05月出版新書

2024年04月出版新書

2024年03月出版新書

2024年02月出版新書

2024年01月出版新書

2023年12月出版新書

2023年11月出版新書

2023年10月出版新書

2023年09月出版新書

2023年08月出版新書

2023年07月出版新書

『簡體書』Spark 3.x综合项目实战

書城自編碼: 3975697
分類: 簡體書→大陸圖書→教材高职高专教材
作者: 马卫花、张文胜、段毅
國際書號(ISBN): 9787302658030
出版社: 清华大学出版社
出版日期: 2024-03-01

頁數/字數: /
書度/開本: 16开 釘裝: 平装

售價:NT$ 313

我要買

share:

** 我創建的書架 **
未登入.



新書推薦:
寻路:走向西南联大(西南联大文库)
《 寻路:走向西南联大(西南联大文库) 》

售價:NT$ 302.0
短视频Vlog全流程:镜头脚本+运镜技巧+场景主题+后期剪辑
《 短视频Vlog全流程:镜头脚本+运镜技巧+场景主题+后期剪辑 》

售價:NT$ 406.0
英国小史
《 英国小史 》

售價:NT$ 426.0
影响力原则
《 影响力原则 》

售價:NT$ 354.0
德川家康(全十三册)(他用30年活了下来,建立起300年基业)
《 德川家康(全十三册)(他用30年活了下来,建立起300年基业) 》

售價:NT$ 4155.0
新知文库·动人的北平
《 新知文库·动人的北平 》

售價:NT$ 155.0
萧条中的生存策略
《 萧条中的生存策略 》

售價:NT$ 260.0
银色瀑布:美国兵工厂与中途岛海战
《 银色瀑布:美国兵工厂与中途岛海战 》

售價:NT$ 359.0

建議一齊購買:

+

NT$ 297
《 中医美容技术(活页)(医学美容技术专业双元育人教材系列) 》
+

NT$ 196
《 新能源汽车电气技术 》
+

NT$ 244
《 水利工程制图与识图(高等职业教育水利类“十三五”系列教材 湖南省示范特色专业群建设系列成果) 》
+

NT$ 283
《 外贸单证操作(第五版)(换封面) 》
+

NT$ 442
《 用药护理(第2版) 》
+

NT$ 510
《 数据标注实训(初级) 》
編輯推薦:
《Spark 3 x综合项目实战》力求做到每个任务都有可见的结果,给学生以成就感,激发学生继续学习的热情。每个任务的内
容适合一次课程完成。《Spark 3 x综合项目实战》注重实践,突出应用与操作,既可作为高职高专院校、计算机培训学校相关课程的教材
內容簡介:
《Spark 3 x综合项目实战》分为基础篇、案例篇两部分。在基础篇(第1-2章)中首先介绍了Spark运行环境的搭建、Spark的生态体系、编程模型、Scala基本语法、高阶函数、集合等方面的基础知识;在案例篇(第3-7章)中的5个综合案例详实的介绍了如何使用Spark实现音乐、房地产、气象、电商等领域大数据分析与挖掘的技巧。主要目的是通过Spark综合应用项目,帮助读者食味知髓,领悟Spark项目的精妙而步步渐悟,修炼成Spark高手。同时,本书还提供了详细的实训指导、数据源和程序代码等配套资源。
《Spark 3 x综合项目实战》既可以作为普通高等院校大数据、计算机、人工智能等相关专业的本科生、研究生的实验实训教材,也可以作为大学生竞赛、毕业论文的重要素材和参考读物。同时,也可满足数据分析从业人员及数据挖掘爱好者的需要。
關於作者:
马卫花,西安五润信息技术有限公司项目经理,高级工程师。主持参与银行、旅游、交通等多个大型企业项目和大数据项目的研发,主要研究方向为大数据、移动开发、项目管理等,承担众多985和211学校的大数据和人工智能的实践课程的实习实训。
张文胜,西安欧亚学院教师,副教授。主要研究方向为移动应用开发,大数据等,主持多项省部级项目,主编教材10余部。
段毅,西安电子科技大学教师,副教授,软件工程硕士,具有二十余年软件工程实践教学工作经验,主要研究方向为软件工程,大数据,指导学生参加ACM-ICPC等程序设计类竞赛获得国际国内金银奖多项。
目錄
基 础 篇
第1 章 Spark 概述 2
1.1 认识Spark 2
1.2 了解Spark 生态系统 3
1.3 Spark 环境安装 4
1.3.1 安装JDK 5
1.3.2 Hadoop 集群搭建 6
1.3.3 Spark 安装及配置 9
1.4 Spark 初体验 12
1.5 掌握Spark 编程模型 14
本章小结 16
本章练习 16
第2 章 Spark 基础 17
2.1 Scala 初识 17
2.1.1 学习使用Scala 解释器 18
2.1.2 Scala 变量定义 18
2.1.3 Scala 数据类型 19
2.1.4 Scala 算术运算符 20
2.1.5 Scala 关系运算符 21
2.1.6 Scala 逻辑运算符 22
2.1.7 Scala 选择结构 22
2.1.8 Scala 循环结构 23
2.1.9 Scala 数组 25
2.1.10 Scala 函数 26
2.1.11 Scala 元组 30
2.1.12 Scala 集合 30
2.2 计算淡旺季飞机票的价格 36
2.3 按班级计算学生平均分 37
2.4 计算城市气温的均值 38
本章小结 38
本章练习 39
案 例 篇
第3 章 流行音乐数据分析 42
3.1 项目背景 42
3.2 分析任务 42
3.3 技术准备 43
3.3.1 实验环境 43
3.3.2 Spark RDD 43
3.3.3 Spark 编程入门 49
3.3.4 Spark 运行架构 53
3.3.5 Spark 运行模式 53
3.4 任务实现 58
3.4.1 数据源 58
3.4.2 架构设计 59
3.4.3 设计思路 60
3.4.4 数据分析 61
3.4.5 可视化展示 68
3.5 部署运行 74
本章小结 77
本章练习 77
第4 章 区域性房屋交易数据分析 79
4.1 项目背景 79
4.2 分析任务 79
4.3 技术准备 80
4.3.1 实验环境 80
4.3.2 Spark SQL 80
4.4 任务实现 88
4.4.1 数据源 88
4.4.2 架构设计 89
4.4.3 设计思路 91
4.4.4 统计分析 91
4.4.5 可视化展示 96
4.5 部署运行 105
本章小结 107
本章练习 107
第5 章 基于数据挖掘的气象分析 109
5.1 项目背景 109
5.2 分析任务 109
5.3 技术准备 109
5.3.1 实验环境 109
5.3.2 HBase 110
5.3.3 Spark MLlib 机器学习 118
5.4 任务实现 122
5.4.1 数据源导入HBase 122
5.4.2 架构设计 124
5.4.3 设计思路 125
5.4.4 数据分析 125
5.4.5 可视化展示 131
5.4.6 气温预测分析 135
5.5 部署运行 140
本章小结 141
本章练习 141
第6 章 基于广告流量数据的实时分析 143
6.1 项目背景 143
6.2 实现任务 143
6.3 技术准备 144
6.3.1 实验环境 144
6.3.2 Kafka 144
6.3.3 Spark Streaming 149
6.3.4 Spark Streaming 整合Kafka 操作 151
6.4 任务实现 152
6.4.1 数据源 152
6.4.2 架构设计 153
6.4.3 设计思路 154
6.4.4 数据实时发送 154
6.4.5 实时分析 158
6.4.6 可视化展示 165
6.5 部署运行 169
本章小结 170
本章练习 171
第7 章 基于多元分析的电影智能推荐系统 172
7.1 项目背景 172
7.2 实现任务 172
7.3 技术准备 172
7.3.1 实验环境 172
7.3.2 交替最小二乘推荐算法 173
7.4 过程实现 175
7.4.1 架构设计 175
7.4.2 设计思路 176
7.4.3 电影数据分析 176
7.4.4 电影智能推荐 181
7.5 部署与运行 187
本章小结 188
本章练习 188
参考文献 190
內容試閱
人工智能的应用离不开数据、算力和大模型基础。最近较为火热的ChatGPT 就采用了
“大数据 大算力 强算法=大模型”路线,使用了45 TB 的数据、近1 万亿个单词来训练
模型,从中可见大数据作为AI 算法“饲料”,在人工智能不断进化中的重要作用。而Spark
作为目前最为流行的开源大数据处理平台,对MapReduce 进行了很多改进,使得其性能大
大提升,被广泛应用于各种大数据处理场合,能够高效地处理海量数据,因此备受关注。
熟练掌握和应用Spark 技术对于初学者(特别是自学者)来说主要有以下两大痛点。
一是知识头绪太多,不知道从哪儿学起。从Spark 的技术栈可以看到,涉及的技术包括从
操作系统到外部组件、Spark 框架、交互工具、编程语言等多个层次,每个层次又包括多个
技术和知识点,初学者可能只是对其中的部分技术有一些模糊的认识,并不会形成全面、
清晰的层次。二是处处掣肘,起步艰难。Spark 初学者在起步阶段会遇到各种各样的问题,
往往是费尽精力地解决了一个问题,结果又冒出了更多的问题,这种心力交瘁且看不到尽
头的感觉在起步阶段十分常见。
快速掌握Spark 除了下功夫把相关技术基础打好,剩下的任务就是不断地进行项目实
践,桃子是什么味道,只有亲口尝一尝才知道。本书提供了5 个大型的Spark 综合应用项
目,可以帮助读者食味知髓,领悟Spark 项目的精妙,修炼成Spark 高手,待全部学完后,
一定会有“会当凌绝顶,一览众山小”的感觉。
本书从教学实际和市场对大数据人才的需求出发,合理安排知识结构,由浅入深,循
序渐进,以综合案例为主,提高学生的兴趣和动手实践能力,缩小高等院校在人才培养上
和软件公司在人才需求上的差距。
本书共包括7 章,各章节主要内容及要求如下。
第1 章:Spark 概述,了解和掌握Spark 的生态系统和开发环境。
第2 章:Spark 基础,掌握编程语言Scala 的基本使用方法。
第3 章:以流行音乐数据分析项目为载体,掌握使用Spark RDD 进行数据挖掘、数据
分析和分析结果的可视化展示。
第4 章:以区域性房屋交易数据分析项目为主线,掌握利用Spark SQL 对已售和在售
房源的数据进行多维度的分析并对分析结果进行图表展示。
第5 章:以基于数据挖掘的气象分析项目为基础,掌握采用Spark SQL 实现对存储在
HBase 数据库中的气象数据进行分析,利用机器学习算法Spark MLlib 预测未来天气。
第6 章:以基于广告流量数据的实时分析项目为引线,掌握使用Spark Streaming 实时
分析某电商平台的广告点击量。从三个维度进行统计分析,根据分析结果进行优化,以达
到最优广告的效果。
第7 章:以基于多元分析的电影智能推荐系统项目为引导,掌握采用Spark ALS 协同
过滤推荐算法来实现个性化的电影推荐。
本书图文并茂,条理清晰,案例项目内容丰富,对每个知识点都配有相应的实例,力
求使读者能从本书中获得很多实用的知识。本书由校企联合完成,由马卫花主持编写,张
文胜和段毅参与编写并负责策划、审校和定稿,马卫花进行了统稿。
此外,在编写本书的过程中,杨清勇、赵向梅、刘沙沙等同人给予了很大的帮助,清
华大学出版社的邓艳老师也提出了很多宝贵的意见和建议,为本书的出版付出了很多的努
力,在此编者对他们表示衷心的感谢。由于作者水平有限,本书难免存在不足之处,欢迎
广大读者批评指正。
编 者

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 香港用户  | 台灣用户 | 海外用户
megBook.com.tw
Copyright (C) 2013 - 2024 (香港)大書城有限公司 All Rights Reserved.