登入帳戶  | 訂單查詢  | 購物車/收銀台(0) | 在線留言板  | 付款方式  | 聯絡我們  | 運費計算  | 幫助中心 |  加入書簽
會員登入   新用戶註冊
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2023年度TOP分類閱讀雜誌 香港/國際用戶
最新/最熱/最齊全的簡體書網 品種:超過100萬種書,正品正价,放心網購,悭钱省心 送貨:速遞 / 物流,時效:出貨後2-4日

2024年10月出版新書

2024年09月出版新書

2024年08月出版新書

2024年07月出版新書

2024年06月出版新書

2024年05月出版新書

2024年04月出版新書

2024年03月出版新書

2024年02月出版新書

2024年01月出版新書

2023年12月出版新書

2023年11月出版新書

2023年10月出版新書

2023年09月出版新書

『簡體書』数据清洗-微课视频版

書城自編碼: 3662110
分類: 簡體書→大陸圖書→教材研究生/本科/专科教材
作者: 黄源 何婕 著
國際書號(ISBN): 9787302577478
出版社: 清华大学出版社
出版日期: 2021-08-01

頁數/字數: /
書度/開本: 16开 釘裝: 平装

售價:NT$ 289

我要買

share:

** 我創建的書架 **
未登入.



新書推薦:
汉末晋初之际政治研究
《 汉末晋初之际政治研究 》

售價:NT$ 602.0
强者破局:资治通鉴成事之道
《 强者破局:资治通鉴成事之道 》

售價:NT$ 367.0
鸣沙丛书·鼎革:南北议和与清帝退位
《 鸣沙丛书·鼎革:南北议和与清帝退位 》

售價:NT$ 551.0
从康德到黑格尔的发展:兼论宗教哲学(英国观念论名著译丛)
《 从康德到黑格尔的发展:兼论宗教哲学(英国观念论名著译丛) 》

售價:NT$ 275.0
突破不可能:用特工思维提升领导力
《 突破不可能:用特工思维提升领导力 》

售價:NT$ 352.0
王阳明大传:知行合一的心学智慧(精装典藏版)
《 王阳明大传:知行合一的心学智慧(精装典藏版) 》

售價:NT$ 1010.0
失衡与重塑——百年变局下的中国与世界经济
《 失衡与重塑——百年变局下的中国与世界经济 》

售價:NT$ 602.0
不被定义的年龄:积极年龄观让我们更快乐、健康、长寿
《 不被定义的年龄:积极年龄观让我们更快乐、健康、长寿 》

售價:NT$ 352.0

建議一齊購買:

+

NT$ 488
《 生理学(第9版/本科临床/配增值) 》
+

NT$ 715
《 诊断学(第9版/本科临床/配增值) 》
+

NT$ 1188
《 经济学原理(第8版)(套装微观经济学分册+宏观经济学分册 曼昆) 》
+

NT$ 458
《 物权法(第七版)根据《民法典》全面修订 》
+

NT$ 533
《 妇产科学(第9版/本科临床/配增值) 》
+

NT$ 282
《 数学分析(第五版)(上册) 》
編輯推薦:
本书可作为高等学校大数据、人工智能、云计算等专业的教材,可也作为大数据爱好者的参考书。
本书配套资源丰富,包括教学大纲、教学课件、电子教案、程序源码、习题答案、期末试卷和在线作业,作者还为本书精心录制了微课视频。
內容簡介:
本书的编写目的是向读者介绍数据清洗技术的基本概念与应用。全书共10章,分别为数据清洗概述、文件格式、Web数据抽取、网络爬虫、Kettle数据清洗、数据迁移、文本数据处理、Python数据清洗、DataCleaner数据分析与清洗以及数据清洗综合实训。本书将理论与实践操作相结合,通过大量的案例帮助读者快速了解和应用数据清洗相关技术,并对书中重要的、核心的知识点加大练习力度,以达到熟练应用的目的。 本书可作为高等学校大数据、人工智能、云计算等专业的教材,可也作为大数据爱好者的参考书。
關於作者:
黄源,男,计算机专业研究生,研究方向为计算机软件与理论,2003年至今在重庆航天职业技术学院计算机系担任专职教师,副教授,主要教授计算机网络、计算机软件等专业的专业课程。
目錄
第1章数据清洗概述
1.1数据清洗基础
1.1.1数据清洗的定义
1.1.2数据清洗的原理
1.1.3数据清洗的流程
1.1.4数据清洗的常用方法
1.1.5数据清洗的评估描述
1.1.6数据清洗中的常用评测数据集
1.2数据质量与数据仓库
1.2.1数据质量的定义
1.2.2常见的数据质量问题
1.2.3数据质量与数据清洗
1.2.4数据仓库与ETL
1.2.5数据映射
1.2.6主数据与元数据
1.3数据清洗中的统计基础
1.3.1描述性统计
1.3.2推论统计
1.3.3随机变量
1.4数据清洗环境与常用工具
1.4.1数据清洗环境介绍
1.4.2数据清洗常用工具
1.5本章小结
1.6实训
习题1
第2章文件格式
2.1文件格式概述
2.2Kettle中文件格式的转换
2.2.1文本文件转换
2.2.2CSV文件转换
2.2.3XML文件转换
2.2.4JSON文件转换
2.2.5Excel文件转换
2.2.6生成记录转换
2.3本章小结
2.4实训
习题2
第3章Web数据抽取
3.1Web数据抽取基础
3.2Web数据抽取的实现
3.2.1Kettle数据抽取原理
3.2.2Kettle数据抽取实现
3.3本章小结
3.4实训
习题3


第4章网络爬虫
4.1网络爬虫基础
4.2Python3网络爬虫实现
4.2.1urllib模块
4.2.2Requests库
4.2.3BeautifulSoup库
4.3Python3网络爬虫实例
4.3.1urllib实例
4.3.2requests实例
4.4本章小结
4.5实训
习题4
第5章Kettle数据清洗
5.1Kettle数据清洗概述
5.2Kettle数据清洗实现
5.2.1清洗简单数据
5.2.2清洗复杂数据
5.3本章小结
5.4实训
习题5
第6章数据迁移
6.1数据迁移概述
6.2数据迁移实现技术
6.2.1基于主机的迁移方式
6.2.2备份恢复的迁移方式
6.2.3基于存储的迁移方式
6.2.4基于文件系统的迁移方式
6.2.5基于数据库的迁移方式
6.3数据迁移实现
6.3.1数据库安装与使用
6.3.2Kettle数据迁移
6.4本章小结
6.5实训
习题6
第7章文本数据处理
7.1文本分词
7.2文本数据处理方法
7.3jieba分词的应用
7.3.1jieba概述
7.3.2jieba应用实例
7.4本章小结
7.5实训
习题7
第8章Python数据清洗
8.1Python数据清洗概述
8.1.1Python数据清洗相关库
8.1.2Python数据清洗库的安装
8.2NumPy使用
8.2.1数组的创建与使用
8.2.2计算模块与随机模块的使用
8.2.3NumPy数据清洗实例
8.3Pandas使用
8.3.1Pandas数据类型概述
8.3.2Pandas数据类型应用
8.3.3Pandas数据清洗
8.4matplotlib使用
8.4.1matplotlib的介绍
8.4.2matplotlib的应用
8.5Python数据清洗实例
8.5.1清洗内部数据
8.5.2清洗外部数据
8.6本章小结
8.7实训
习题8
第9章DataCleaner数据分析与清洗
9.1DataCleaner简介
9.1.1DataCleaner概述
9.1.2DataCleaner界面认识
9.2DataCleaner应用
9.2.1认识DataCleaner
9.2.2DataCleaner数据分析实例
9.3本章小结
9.4实训
习题9
第10章数据清洗综合实训
10.1Python数据分组与显示
10.2Python数据清洗与显示
10.3Kettle分组排序
10.4Kettle模糊匹配
参考文献
內容試閱
当前,发展大数据已经成为国家战略,大数据在引领经济社会发展中的新引擎作用更加明显。2014年,“大数据”首次出现在我国《政府工作报告》中。报告中指出: “要设立新兴产业创业创新平台,在大数据等方面赶超先进,引领未来产业发展。”“大数据”逐渐在国内成为热议的词汇。2015年,国务院正式印发《促进大数据发展行动纲要》,明确指出要不断地推动大数据发展和应用,在未来打造精准治理、多方协作的社会治理新模式,建立运行平稳、安全高效的经济运行新机制,构建以人为本、惠及全民的民生服务新体系,开启大众创业、万众创新的创新驱动新格局,培育高端智能、新兴繁荣的产业发展新生态。
数据清洗是整个数据分析过程中不可缺少的一个环节,其结果质量直接关系到模型效果和终结论。在大数据的体系中,只有获取准确无误的数据才能有效地支持终的决策,因此,系统地学习关于数据清洗的知识十分必要。
本书以理论与实践操作相结合的方式深入讲解了数据清洗的基本知识和实现方法,在内容设计上既有上课时老师的讲述部分(包括详细的理论与典型的案例),又有大量的实训环节,双管齐下,极大地激发了学生在课堂上的学习积极性与主动创造性,让学生在课堂上跟上老师的思维,从而学到更多有用的知识和技能。
全书共10章,分别为数据清洗概述、文件格式、Web数据抽取、网络爬虫、Kettle数据清洗、数据迁移、文本数据处理、Python数据清洗、DataCleaner数据分析与清洗以及数据清洗综合实训。
本书特色如下。
(1) 采用“理实一体化”教学方式,课堂上既有老师的讲述,又有学生独立思考、上机操作的内容。
(2) 注重技术变化,书中既包含使用Python进行数据清洗的讲解,也包含的数据清洗的开源工具的使用。
(3) 本书的编者具有多年的教学经验,书中重点和难点突出,能够激发学生的学习热情。

(4) 提供丰富的教学资源,包含教学大纲、教学课件、电子教案、习题答案、程序源码和期末试卷。
(5) 对本书中的重点知识和难点知识配有200分钟的微课视频,方便学生课后学习。
(6) 提供了在线题库。为每章提供在线习题,包括填空题、选择题、判断题、简答题和论述题,并提供习题解答。

资源下载提示
课件等资源: 扫描封底的“课件下载”二维码,在公众号“书圈”下载。
素材(源码)等资源: 扫描目录上方的二维码下载。
在线作业: 扫描封底作业系统二维码,登录网站在线做题及查看答案。
视频等资源: 扫描封底刮刮卡中的二维码,再扫描书中相应章节中的二维码,可以在线学习。
本书建议教学学时为72学时,具体分布如下所示。
章节建议学时
数据清洗概述4
文件格式4
Web数据抽取6
网络爬虫6
Kettle数据清洗16
数据迁移6
文本数据处理6
Python数据清洗16
DataCleaner数据分析与清洗4
数据清洗综合实训4
本书由黄源和何婕编写。其中,黄源编写了第1章、第3章、第5~10章; 何婕编写了第2章和第4章; 全书由黄源负责统稿工作。
本书是校企合作共同编写的结果,在编写过程中得到了重庆誉存大数据有限公司黄远江博士的大力支持!
在编写过程中,我们参阅了大量的相关资料,在此表示感谢!
由于编者水平有限,书中难免出现疏漏之处,衷心希望广大读者批评指正。
编者
2021年4月于重庆

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 台灣用户 | 香港/海外用户
megBook.com.tw
Copyright (C) 2013 - 2024 (香港)大書城有限公司 All Rights Reserved.