新書推薦:

《
红豆生南国,王维最相思(超人气古人王维国风美书出炉!历史知识+诗词雅赏+颜值新高,一个都不少!)
》
售價:NT$
305.0

《
货币的反噬
》
售價:NT$
454.0

《
怪谈游戏设计师·泗水公寓
》
售價:NT$
269.0

《
老头我,负责收拾一切
》
售價:NT$
254.0

《
智慧的觉醒
》
售價:NT$
356.0

《
资本神庙与炼金游戏
》
售價:NT$
398.0

《
浮世长安:唐代的民俗与人文
》
售價:NT$
653.0

《
怀忧终年岁:中国古代女子生存实录
》
售價:NT$
250.0
|
編輯推薦: |
本书以培养大数据管理、分析和应用能力为主线 , 将理论与案例、理论与实践、理论与应用充分结合 , 以电力系统为应用背景精心设计了案例 , 为广大读者 , 特别是具有电力背景的读者提供解决大数据相关问题的思路。本书配套丰富的资源供读者线上学习。
|
內容簡介: |
本书为全国电力行业“十四五”规划教材。全书共分 3 部分 12 章 , 主要内容包括大数据基础(大数据简介、大数据来源、大数据特征、大数据研究策略、大数据技术、大数据应用)、大数据管理及分析(大数据准备、大数据管理、大数据分析)、大数据应用及实践(大数据挑战、大数据开发平台、大数据实践)。本书以培养大数据管理、分析和应用能力为主线 , 将理论与案例、理论与实践、理论与应用充分结合 , 以电力系统为应用背景精心设计了案例 , 为广大读者 , 特别是具有电力背景的读者提供解决大数据相关问题的思路。本书配套丰富的资源供读者线上学习。
|
目錄:
|
前言
第 1 部分 大 数 据 基 础
学习目标 1
第 1 章 大数据简介 2
1.1 大数据发展历程 2
1.2 大数据时代 5
1.3 大数据定义 6
第 2 章 大数据来源 7
2.1 大数据的类别 7
2.2 机器生成的大数据 8
2.3 人类生成的大数据 11
2.4 组织生成的大数据 14
2.5 数据集成 18
第 3 章 大数据特征 20
3.1 大数据特征综述 20
3.2 大数据的特征—大量性(Volume) 21
3.3 大数据的特征—多样性(Variety) 22
3.4 大数据的特征—高速性(Velocity) 23
3.5 大数据的特征—准确性(Veracity) 25
3.6 大数据的特征—关联性(Valence) 27
3.7 大数据的特征—价值性(Value) 28
目 录
第 4 章 大数据研究策略 30
4.1 数据科学 30
4.2 建立大数据研究策略 32
4.3 大数据研究策略框架和工作流程 34
第 5 章 大数据技术 39
5.1 大数据技术架构 39
5.2 大数据的两大关键技术 40
5.3 大数据平台 Hadoop 43
第 6 章 大数据应用 45
6.1 大数据的价值何在 45
6.2 大数据应用领域 47
测试题及答案 53
第 2 部分 大数据管理及分析
学习目标 57
第 7 章 大数据准备 58
7.1 大数据的结构 58
7.2 大数据的标识 62
7.3 大数据的关联 69
7.4 大数据的注释 75
第 8 章 大数据管理 83
8.1 数据集成和软件互操作性 83
8.2 不变性和永恒性 87
第 9 章 大数据分析 92
9.1 数据验证 92
9.2 大数据初步分析 95
9.3 大数据分析方法 1139.4 大数据分析中的特殊注意事项 127
9.5 大数据分析步骤 132
9.6 大数据分析的失败 138
测试题及答案 145
第 3 部分 大数据应用及实践
学习目标 147
第 10 章 大数据挑战 148
10.1 法律问题 148
10.2 社会问题 158
10.3 大数据的未来 164
第 11 章 大数据开发平台 169
11.1 可扩展计算的基本概念 169
11.2 Hadoop 生态系统 172
第 12 章 大数据实践 185
12.1 下载和安装 Cloudera 虚拟机映像 185
12.2 HDFS 实践:将数据复制到 Hadoop 分布式文件系统中 187
12.3 MapReduce 实践:运行 WordCount 程序 189
测试题及答案 192
参考文献 194
|
內容試閱:
|
随着信息技术与经济社会的发展和交汇融合,全球数据量正在剧烈地扩展和增加,大数据时代已经到来,这不仅改变了人们对数据和信息处理的认知和方法,而且在社会、经济和文化等多个方面产生了深远的影响。大数据的高速增长、复杂多样等诸多特征,使得在对大数据进行分析并应用于各个领域学科时,在数据获取、管理、处理、分析和应用等方面遇到了很多挑战和问题亟待解决。我国在 2015 年首次提出“国家大数据战略”,并相继发布了《促进大数据发展行动纲要》《中华人民共和国数据安全法》等一系列政策文件和法律法规,其目的是持续推动数字产业化和产业数字化的创新发展,发展以数据为关键要素的数字经济新形态,利用大数据更好地服务我国经济社会发展和人民生活改善。因此,系统地学习大数据管理、分析及应用的基础知识,是适应科学技术与社会发展的必然要求。本书系统全面地描述大数据分析及应用所涉及的基本概念、遇到的机遇与挑战,以及已有的解决方案、相关理论和技术,同时结合大量实践案例,使用化繁为简、深入浅出、由浅入深的叙述方式来阐述知识点。书中将其中蕴含的科学创新、脚踏实地、分享合作的精神,以及在技术创新发展进程中科技人员所体现和保持的对数据科学的热情和好奇心等思政点,通过润物细无声的方式传递给读者 , 在提升大数据管理、分析和应用实践等方面能力的同时,激发读者思考进取、勇于创新、团结共享的科学意识。 全书内容共分三个部分十二章。第 1 部分“大数据基础”介绍大数据相关的基本内容,包括大数据的发展历程、来源、特征、研究策略、技术架构以及大数据的应用领域;第 2部分“大数据管理及分析”描述了对大数据进行标注、集成、管理、预处理、分析以及可视化的基本理论、技术、方法和工具;第 3 部分“大数据应用及实践”从应用的角度来阐述大数据在法律和社会等方面遇到的挑战及解决方案,探讨大数据的发展趋势及其产生的影响,并介绍大数据平台 Hadoop 生态系统的常用组件和基本原理,最后基于一个词频统计的实例来进行 Hadoop 大数据实践。全书由王辉、梁春燕、张依依、关志涛编写,彭可欣、朱琳、殷朵、曾贾斌、李若彤、杨宇等同学进行了大量的文献整理、资料翻译、案例收集和编程实践等工作。全书由黄敏芳教授审阅 , 提出很多宝贵意见,在此表示衷心感谢 ! 本书在编写过程中参考了相关教材、文献和网络资源 , 在此向所有的作者表示诚挚的感谢。
|
|