|
內容簡介: |
《数据采集与预处理项目实战》主要涉及八个项目:通过“数据采集与处理初识”学习数据采集与处理的多种方式和相关知识;通过“Flume日志文件数据采集”学习Flume两种文件通道的基本使用方法和HDFS接收器的相关配置:通过“Kafka日志文件数据采集”学习Kafka集群环境搭建和。Kafka生产者消费者模型;通过“Scrapy网页数据采集”学习Scrapy框架配置及使用;通过“Requests客户端数据采集”学习Requests库的使用;通过“Kettle学生数据处理”学习Kettle工具的安装和基本使用;通过“NumPy股票数据处理”学习NumPy库的安装和使用;通过“Pandas旅游数据处理”学习Pandas库的安装和使用。《数据采集与预处理项目实战》按照由浅入深的思路对知识体系进行编排,从数据采集组件、数据采集模块、数据采集框架、数据处理工具以及数据处理模块的使用几方面对知识点进行讲解。
|
目錄:
|
项目一 数据采集与处理初识
学习目标
学习路径
任务描述
任务技能
任务实施
任务总结
英语角
任务习题
项目二 Flume日志文件数据采集
学习目标
学习路径
任务描述
任务技能
任务实施
任务总结
英语角
任务习题
项目三 Kafka日志文件数据采集
学习目标
学习路径
任务描述
任务技能
任务实施
任务总结
英语角
任务习题
项目四 Scrapy网页数据采集
学习目标
学习路径
任务描述
任务技能
任务实施
任务总结
英语角
任务习题
项目五 Requests客户端数据采集
学习目标
学习路径
任务描述
任务技能
任务实施
任务总结
英语角
任务习题
项目六 Kettle学生数据处理
学习目标
学习路径
任务描述
任务技能
任务实施
任务总结
英语角
任务习题
项目七 NumPy股票数据处理
学习目标
学习路径
任务描述
任务技能
任务实施
任务总结
英语角
任务习题
项目八 Pandas旅游数据处理
学习目标
学习路径
任务描述
任务技能
任务实施
任务总结
英语角
任务习题
|
|