《Flink实时大数据处理技术刘月峰》 - 台灣·大書城 - 刘月峰 - 机械工业出版社

	登入帳戶　 \|　訂單查詢　 \|　購物車/收銀台(0)　\|　在線留言板　 \|　付款方式　 \|　聯絡我們　 \|　運費計算　 \|　幫助中心　\|　加入書簽
		會員登入新用戶註冊

HOME

新書上架

暢銷書架

好書推介

2024年度TOP

香港／國際用戶

最新/最熱/最齊全的簡體書網

品種：超過100萬種書，正品正价，放心網購，悭钱省心

送貨：速遞 / 物流，時效：出貨後2-4日

『簡體書』Flink实时大数据处理技术刘月峰

書城自編碼： 4000125
分類：簡體書→大陸圖書→教材→高职高专教材
作者：刘月峰
國際書號(ISBN)： 9787111752004
出版社：机械工业出版社
出版日期： 2024-06-01

頁數/字數： /
書度/開本： 16开釘裝：平装

售價：NT$ 407

我要買件

** 我創建的書架 **
未登入.

新書推薦：

《耳鼻喉科诊断指南（第二版）》
售價：NT$ 857.0

《物联网在行业转型中的应用》
售價：NT$ 505.0

《低空经济数字基础设施关键技术与规划方法》
售價：NT$ 509.0

《声与色（未来哲学系列）》
售價：NT$ 204.0

《深度说服力：影响和改变一个人的超级方法》
售價：NT$ 352.0

《 2025年中国自助游地图自驾游游遍中国深度旅游规划指南专业实用精彩旅游攻略景点介绍线路规划》
售價：NT$ 449.0

《教育的抉择》
售價：NT$ 254.0

《 DK灵动盎然的飞鸟》
售價：NT$ 806.0

建議一齊購買：

NT$ 230
《建筑艺术欣赏第2版鲁毅》

NT$ 337
《无人机飞行控制技术活页式》

NT$ 356
《车联网技术与应用》

NT$ 199
《航空法理论与实务》

NT$ 352
《财务大数据分析》

NT$ 250
《现代物流管理基础（第二版·含活页练习册）（新编21世纪高等职业教育精品教材·物流类）》

編輯推薦：

配套资源：电子课件、习题答案、教学大纲、教案、源代码、试卷。
本书特色：
★逐步引导读者了解Flink的架构、API和应用，帮助读者掌握实时数据处理的核心概念和技能。
★详细讲解Scala语言的集合、函数式编程及面向对象编程等内容。
★提供丰富的实例，帮助读者深入了解Flink的内部工作原理并掌握实际应用技巧。
★引导读者从项目的需求分析和设计开始，逐步构建具有实时处理能力的数据仓库系统。

內容簡介：

本书从实践的角度出发，介绍了Flink实时大数据处理框架开发的技术知识，包括实时处理系统的相关概念、开发方法、分布式计算的体系结构，以及面向事件驱动的编程技术。书中详细探讨了Flink的流式处理和批处理融合的能力，以及它在大规模数据流处理中的优势，并通过一个具体的实例介绍大数据实时处理系统的开发方法和开发过程。此外，本书还介绍了实时数据仓库的设计与实现，包括数据抽取、数据转换、数据存储和数据可视化等方面的内容，以帮助读者构建强大而可扩展的实时数据处理系统。除第10章外，其余各章配有习题，以指导读者深入地进行学习。
本书既可作为高等学校计算机软件技术课程的教材，也可作为大数据开发人员的技术参考书。

關於作者：

刘月峰，内蒙古科技大学信息工程学院副教授，博士，硕士生导师，大数据与软件工程系主任。主要研究方向为人工智能、大数据、知识图谱等。近3年主持了省部级项目4项，国家项目2项，横向课题多项。在国内外高水平期刊及重要学术会议上发表论文30余篇，SCI二区3篇，EI期刊5篇，核心期刊多篇，授权国家发明专利2项。作为课程负责人，《C语言程序设计A》获批自治区线上线下混合式一流课程，并入选第二批国家线上线下混合式一流课程的推荐名单。作为课程负责人，主讲的内蒙古高校精品在线开放课程《深度学习之瑞士军刀—PyTorch入门》获批自治区线上一流课程，并于2022年3月入选国家高等教育智慧教育平台。一直致力于大数据与人工智能的相关应用研究，包括大数据与人工智能在故障预测方法中的应用，基于计算机视觉的人工智能应用，基于大数据的知识图谱应用等。

前言
第1章Apache Flink概述
11Flink是什么
111Flink的起源
112Flink的发展过程和主要版本
113Flink的定义
114编程语言的选择
12Flink层次架构
121架构设计
122API和Libraries层
123Runtime核心层
124物理部署层
13大数据处理架构的发展
131Lambda架构
132Kappa架构
133流处理框架的发展
14Flink应用场景
141事件驱动型应用
142数据分析应用
143数据管道应用
144行业应用
15Flink生态系统和社区
151Flink的生态系统和相关工具
152Flink的社区和贡献者
16Flink与其他大数据框架的
关系
161Flink与Hadoop
162Flink与Hive
163Flink与Spark Streaming
164Flink与Storm
17习题
第2章Scala语言
21Scala语言概述
211Scala简介
212开发环境配置
213创建项目
22Scala语言入门
221类型体系结构
222变量的定义与使用
223字面量与插值表达式
224运算符
225流程控制语句
23集合
231集合概述
232Array和ArrayBuffer
233Tuple
234List和ListBuffer
235Set
236Map
237集合操作符号
24函数式编程
241函数的定义与使用
242匿名函数
243高阶函数
244柯里化与闭包
25面向对象编程
251类与对象
252构造器
253继承
254伴生类与伴生对象
255多态
256泛型
257隐式转换
26模式匹配
261基本使用
262条件守卫
263常用匹配
264样例类
27习题
第3章环境搭建和应用部署
31Flink开发环境搭建
311CentOS环境准备
312项目初始化
313项目结构与依赖
32Flink词频统计
321批处理方式
322流处理方式
323两种方式对比
324向集群提交作业
33Flink 集群部署
331Flink集群核心组件
332部署模式
333Standalone模式
334YARN模式
34YARN模式的部署与应用提交
341环境准备
342会话模式
343单作业模式
344应用模式
35习题
第4章Flink流处理架构与原理
41流处理模型与原理
411数据流的概念
412流处理和批处理
413流处理的原理
414流处理的模型
415流处理的优化策略
42Flink流处理架构
421Flink的数据流模型
422算子
423Flink的状态管理
424Flink的容错机制
425Flink在流计算中的优化
43Flink 集群架构
431集群组件的协作
432Task和算子链
433Task Slots和资源管理
44习题
第5章流处理API
51基本使用
511DataStream是什么
512基础程序
513并行度的设置
52DataStream 数据源
521内置Data Source
522自定义 Data Source
53DataStream 转换算子
531数据流转换
532RichFunction
533物理分区
534算子链
535资源组
54DataStream Sink
541Data Sinks
542自定义Sink
55用户行为实时分析
56习题
第6章时间和窗口
61时间与窗口的概念
611Flink中的时间
612窗口
613水位线
62窗口的基本使用
621窗口分配器
622内置窗口分配器
623窗口触发器
624内置触发器
63窗口函数
631ReduceFunction
632AggregateFunction
633ProcessWindowFunction
634增量聚合的ProcessWindow
Function
64习题
第7章处理函数与状态管理
71处理函数
711ProcessFunction
712KeyedProcessFunction
713定时器
72多流操作
721Union
722Connect
723Window Join
724Interval Join
725侧输出流
726处理迟到数据
73状态管理
731有状态的流处理
732键控状态
733算子状态
74状态持久化
741Checkpoint
742StateBackend
743Savepoint
75习题
第8章Table API和SQL API
81Table API和SQL API概述
811程序基本结构
812TableEnvironment创建
813创建Table
814Table查询
815Table输出
816Table与DataStream的转换
82Flink SQL使用
821基本使用
822DDL创建表
823查询表
824插入数据
83窗口处理
831窗口表值函数
832窗口聚合
833窗口连接
834Top-N
835去重
84函数
841标量函数
842表值函数
843聚合函数
844表值聚合函数
85习题
第9章Flink Kafka 连接器
91Kafka概述
911基本概念
912环境准备
92生产者与消费者
921Topic操作
922消息发送及消费
923容错机制
93Flink集成Kafka
931DataStream API集成Kafka
932Table API集成Kafka
94数据实时清洗与可视化
941数据模拟
942数据清洗处理
943将数据写入ClickHouse
944数据可视化
95习题
第10章Flink 数据仓库项目

內容試閱：

大数据实时处理是一个不断发展的新兴领域，深刻地改变着数据处理和决策方式。随着数据规模的快速增长和实时决策需求的增加，大数据实时处理已经成为企业和组织中至关重要的关键技术。在这个快节奏和高竞争的时代，及时捕捉、分析和应用实时数据的能力对于企业的竞争力至关重要。
在实时数据处理领域，Apache Flink凭借其优越的性能、高可靠性和丰富的功能集成成为首选解决方案，拥有广泛的市场优势和地位。作为本书重点介绍的内容，Apache Flink是一种强大而灵活的实时处理框架。在如今的大数据技术生态系统中，Flink凭借其独特之处，成为实时数据处理领域的首选解决方案。
与其他流处理框架相比，Flink的独特之处在于其支持真正的流式处理，并能够处理具有低延迟和高吞吐量要求的大规模数据流。这使得Flink在各行各业得到了广泛应用。
举例来说，在金融领域，Flink被用于实时风险管理、交易监控和欺诈检测等关键业务场景。其强大的处理能力和低延迟的特性使得金融机构能够更及时地发现和应对风险，并保护客户资产的安全。在电子商务领域，Flink可以实时处理用户行为数据，为个性化推荐、实时广告投放和库存管理等提供支持。通过实时数据处理，电子商务企业能够更好地了解用户需求，并提供更精准和个性化的服务。在物联网领域，Flink能够处理海量的传感器数据，并实时进行数据分析和决策。这使得物联网设备能够及时响应和适应不同的环境条件，为智能城市、智能工厂等场景提供关键支持。在电信行业，Flink可以应对高速的实时流量数据，实现实时网络监控和故障预测。这对于提供高质量的通信服务以及及时解决网络问题至关重要。
为了帮助读者更好地学习和应用Flink，本书将逐步引导读者了解Flink的架构、API和应用案例，帮助读者掌握实时数据处理的核心概念和技能。
第1章详细介绍了Flink的基本概念、Flink层次架构、大数据处理架构的发展等内容。通过这一章的学习，读者能建立起对Flink整体架构和功能的全面认知，为后续章节的学习打下坚实的基础。
第2章专注介绍Scala编程语言。作为本书示例代码的主要编写语言，Scala与Java兼容，并具备强大的函数式编程特性。书中详细讲解了Scala语言的集合、函数式编程及面向对象编程等内容。通过学习Scala，读者将能够更灵活地编写Flink应用程序，充分利用Scala的函数式编程能力，提高代码的表达力和开发效率，发挥Flink框架的优势。
第3、4章重点讨论Flink开发和生产环境的配置与搭建，以及深入探究Flink的内部架构和工作原理。通过这些内容的学习，读者将对Flink的部署和运行有更深入的理解，为后续章节的学习奠定坚实的基础，并能够更好地优化和调优Flink应用程序。
第5~9章是本书的关键章节，深入介绍Flink的核心功能和API，详细探讨流处理API、时间和窗口、处理函数与状态管理、Table API和SQL API，以及Flink Kafka连接器。这些章节将帮助读者熟悉Flink的不同编程接口和数据处理模式，并掌握在实际场景中应用Flink的技巧等内容。
第10章提供了一个实时数据仓库的项目实战案例。实时数据仓库是大数据领域的一个重要应用，可以帮助企业和组织实现实时数据分析与决策，提高业务的竞争力和效益。通过这个案例，读者能够将之前章节中学到的概念、原理和技术应用到一个真实的数据仓库项目中。本章将引导读者从项目的需求分析和设计开始，逐步构建起一个具有实时处理能力的数据仓库系统。本章将介绍如何合理地组织和管理数据流，如何定义时间窗口和处理函数进行实时计算，以及如何利用Flink流处理API进行数据处理和分析等内容。同时，还会介绍一些常见的实时数据仓库架构，帮助读者构建高性能和可扩展的实时数据仓库系统。
本书还提供了丰富的实例，旨在帮助读者在实践中掌握Flink的应用技巧。读者可以通过实例代码，深入了解 Flink 的内部工作原理并掌握实际应用技巧。
所有实例都在Flink 115版本下进行了调试和运行验证，确保其可行性和有效性。从应用程序的设计到部署和监控，读者均可以按照书中的内容开展实施，以更好地理解和应用所学知识。为了巩固所学，除第10章外，其余各章最后都附有习题，以供读者进行练习和思考，帮助读者加深对 Flink 的理解并提升实际应用能力。
本书由刘月峰编写第2、5、6章，刘伟编写第9、10章，顾瑞春编写第1、4章，刘立新编写第3章，祝铁芳编写第7章，陈大伟编写第8章，全书由刘月峰负责统稿。荆明明和肖莉娟参与了本书的部分内容整理工作。
虽然在编写本书时已尽量保证准确性和完整性，但由于水平有限，难免存在不妥之处，恳请读者提出宝贵的意见和反馈，以帮助我们改进和完善本书。

書城介紹　 \|　合作申請　\|　索要書目　 \|　新手入門　\|　聯絡方式　 \|　幫助中心　\|　找書說明　 \|　送貨方式　\|　付款方式	台灣用户　\|　香港/海外用户

megBook.com.tw
Copyright (C) 2013 - 2025 （香港）大書城有限公司　All Rights Reserved.