登入帳戶  | 訂單查詢  | 購物車/收銀台( 0 ) | 在線留言板  | 付款方式  | 聯絡我們  | 運費計算  | 幫助中心 |  加入書簽
會員登入 新註冊 | 新用戶登記
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2023年度TOP分類閱讀雜誌 香港/國際用戶
最新/最熱/最齊全的簡體書網 品種:超過100萬種書,正品正价,放心網購,悭钱省心 送貨:速遞 / EMS,時效:出貨後2-3日

2024年08月出版新書

2024年07月出版新書

2024年06月出版新書

2024年05月出版新書

2024年04月出版新書

2024年03月出版新書

2024年02月出版新書

2024年01月出版新書

2023年12月出版新書

2023年11月出版新書

2023年10月出版新書

2023年09月出版新書

2023年08月出版新書

2023年07月出版新書

『簡體書』数据分析实用技术——阿里云大数据分析师ACP认证培训教程

書城自編碼: 3862604
分類: 簡體書→大陸圖書→考試计算机考试
作者: 赵强
國際書號(ISBN): 9787121419232
出版社: 电子工业出版社
出版日期: 2023-04-01

頁數/字數: /
釘裝: 平塑

售價:NT$ 325

我要買

share:

** 我創建的書架 **
未登入.



新書推薦:
谢谢你来到我的生命:狗狗带给我们的治愈与改变
《 谢谢你来到我的生命:狗狗带给我们的治愈与改变 》

售價:NT$ 234.0
情感觉醒:揭秘亲密关系背后的真相
《 情感觉醒:揭秘亲密关系背后的真相 》

售價:NT$ 311.0
诸葛亮
《 诸葛亮 》

售價:NT$ 359.0
解密:梦的诞生
《 解密:梦的诞生 》

售價:NT$ 874.0
课长,这不是恋爱,这就是性骚扰!
《 课长,这不是恋爱,这就是性骚扰! 》

售價:NT$ 208.0
人文与社会译丛:我们中的我(承认理论研究)
《 人文与社会译丛:我们中的我(承认理论研究) 》

售價:NT$ 359.0
(守望者·人间世)自我:与齐格蒙特·鲍曼对谈
《 (守望者·人间世)自我:与齐格蒙特·鲍曼对谈 》

售價:NT$ 374.0
白蛇:浮生艺术画集
《 白蛇:浮生艺术画集 》

售價:NT$ 874.0

內容簡介:
本书关注大数据分析师所需掌握的重要的基础能力。首先,本书阐述了大数据分析师的职业特点。其次,根据数据分析经常涉及的技术要求,按顺序介绍了什么是数据库,如何使用数据库,大数据环境下的分布式数据库Hadoop、阿里云MaxCompute,以及相对应的数据库查询语言SQL、MapReduce、Hive、Pig等基本的编程技术。为了提高数据分析工作的质量与效率,本书还详细介绍了数据项目质量控制的理论和实践,其中涉及了数据预处理、数据脱敏和脏数据处理的技能知识,同时介绍了在数据项目中SQL编程的优秀实践方法。作为一本介绍数据分析的入门书籍,本书详细介绍了数据分析中常见的方法(如EDA),包括指标计算的一些常见形式。在企业环境中,数据分析常常以项目的形式出现,本书也向读者介绍了数据分析项目是如何承接、分解和实施的。后,本书还向读者介绍了常用的数据挖掘技术,如决策树、聚类分析和关联分析,让读者对算法在数据分析中的应用有直观的了解。本书可作为阿里云大数据分析师ACP认证培训的教材,也可作为高校大数据相关专业的学生教材,还可供希望从事大数据分析工作的读者阅读参考。
關於作者:
赵强,杭州决明数据科技有限公司负责人,从事大数据应用与教育近20年,现为加拿大约克大学舒立克商学院MBA特聘教授,阿里云大学特聘专家教授。曾服务于世界500强企业中的零售、银行、电信企业和全球性的管理咨询公司,参与了众多国际企业营销和数据战略规划的制定和决策。对云计算与大数据应用结合有深刻体会,了解企业的需求,能够帮助企业制定优化的云计算大数据应用方案,乐于交流,愿意分享,在培训教育行业有一定知名度。
目錄
目 录第1章 大数据分析领域职业介绍1.1 职业路径1.1.1 大数据职业生态1.1.2 大数据工程师职业方向1.1.3 大数据分析师职业方向1.1.4 大数据工作入门1.2 技能要求1.2.1 基本职业素养1.2.2 从数据中挖掘金矿1.2.3 大数据工程师的技能要求1.2.4 大数据分析师的技能要求1.3 工作情况1.3.1 典型的工作状态1.3.2 大数据职业的现状1.4 职业前景1.4.1 大数据职业的发展1.4.2 大数据的未来1.4.3 大数据职业的规划第2章 初识大数据2.1 大数据的基础知识2.1.1 什么是大数据2.1.2 大数据为什么重要2.1.3 大数据的维度2.2 大数据的类型2.2.1 结构化数据与非结构化数据2.2.2 几个大数据的例子2.3 大数据的行业应用2.4 企业面临的大数据挑战类型2.4.1 大数据从何而来2.4.2 企业如何获取大数据2.4.3 大数据的存储问题2.4.4 大数据对分析人才的要求2.4.5 大数据带来的挑战类型第3章 数据库基础3.1 数据库简介3.1.1 数据管理技术发展史3.1.2 数据库的应用3.1.3 数据库系统概述3.2 关系型数据库3.2.1 数据模型概述3.2.2 关系数据模型3.2.3 E-R数据模型3.2.4 关系型数据库的设计原则3.3 数据仓库3.3.1 数据仓库的历史3.3.2 数据仓库系统的组成3.3.3 ETL3.3.4 数据仓库与操作型数据库的关系3.4 Hadoop与分布式数据存储3.4.1 大数据对存储技术的挑战和Hadoop的起源3.4.2 Hadoop生态圈及系统架构3.4.3 Hadoop应用场景3.4.4 Hadoop局限性3.5 阿里云MaxCompute3.5.1 MaxCompute简介3.5.2 MaxCompute的基本概念3.5.3 MaxCompute数据的导入导出3.5.4 MaxCompute SQL3.5.5 函数3.5.6 MaxCompute MapReduce3.5.7 MaxCompute权限与安全3.6 常用Linux指令简介3.6.1 安装和登录指令3.6.2 文件处理指令3.6.3 系统管理相关指令3.6.4 网络操作指令3.6.5 系统安全相关指令3.6.6 其他指令第4章 数据分析工具与语言4.1 SQL基础4.1.1 SQL简介4.1.2 MySQL数据类型4.1.3 数据定义语言4.1.4 数据操作语言4.1.5 join4.1.6 数据表的合并、交集4.1.7 SQL实用函数4.2 MapReduce4.2.1 MapReduce Job4.2.2 MapReduce主程序4.2.3 MapReduce主程序运行详解4.2.4 MapReduce数据流与控制流详解4.2.5 MapReduce小结4.3 Hive4.4 Pig4.5 HDFS4.5.1 HDFS的相关概念4.5.2 HDFS的基本操作4.5.3 HDFS常用的Java API介绍第5章 数据可视化5.1 数据可视化概念5.1.1 数据可视化的定义与原则5.1.2 数据可视化的设计思路5.2 数据可视化元素5.2.1 表格5.2.2 柱状图5.2.3 折线图5.2.4 饼图5.2.5 地图5.2.6 散点图5.2.7 其他常见图5.3 数据可视化设计原则5.4 DataV设计5.5 BI报表设计第6章 数据项目质量控制6.1 数据质量控制理论6.1.1 数据质量的五个维度6.1.2 脏数据类型6.2 评估数据的质量及其对项目的影响6.2.1 数据如何创造价值——DIK6.2.2 数据质量问题对企业创造价值的影响6.3 数据预处理6.3.1 数据预处理的五大步骤6.3.2 数据清洗场景6.3.3 脏数据清洗过程6.3.4 脏数据与脏数据清洗的基本方法6.3.5 脏数据处理的案例6.3.6 SQL处理脏数据示例6.4 数据脱敏6.4.1 确定数据脱敏对象6.4.2 隐私数据泄露类型6.4.3 隐私数据脱敏的要求6.4.4 常见的数据脱敏算法6.5 数据项目质量控制的类型第7章 数据编程基础7.1 面向分析的数据编程范例7.1.1 数据项目的特点7.1.2 数据项目编程的流程7.1.3 面向分析的数据编程范例7.2 编程效率和程序运行效率7.2.1 编程效率7.2.2 程序运行效率7.3 编程质量控制流程第8章 数据项目设计与执行8.1 数据分析项目计划管理流程8.2 数据项目设计方法8.2.1 项目目标8.2.2 背景调查8.2.3 分析范围8.2.4 分析结果交付形式8.3 数据分析项目的分类8.4 项目前分析和项目绩效考评第9章 数据分析技术9.1 指标体系9.1.1 绩效指标(KPI)的定义9.1.2 企业构建指标体系9.1.3 平衡计分卡常见指标9.2 数据分析9.2.1 数据分析的定义9.2.2 数据分析的目的9.2.3 数据分析的作用9.3 探索性数据分析(EDA)9.3.1 EDA简介9.3.2 单一变量探索性分析9.3.3 多变量探索性分析9.4 探索性数据分析应用案例9.4.1 情况介绍9.4.2 数据介绍9.4.3 EDA探索分析遵循银行政策情况9.4.4 EDA探索分析懒惰的银行客户代表9.4.5 EDA探索分析银行客户代表是否执行了有效的沟通9.5 EDA中的指标变换形式9.5.1 总量指标9.5.2 相对指标第10章 常用数据挖掘技术10.1 决策树10.1.1 决策树概述10.1.2 信息熵10.1.3 ID3算法10.1.4 C4.5算法10.1.5 CART算法10.2 聚类分析10.2.1 聚类概述10.2.2 样本间距离10.2.3 K-means聚类10.2.4 群体距离10.2.5 层次聚类10.2.6 聚类算法的评估10.3 关联分析10.3.1 关联规则量化指标10.3.2 Apriori算法

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 香港用户  | 台灣用户 | 海外用户
megBook.com.tw
Copyright (C) 2013 - 2024 (香港)大書城有限公司 All Rights Reserved.