新書推薦:
《
DK月季玫瑰百科
》
售價:NT$
959.0
《
为你想要的生活
》
售價:NT$
301.0
《
关键改变:如何实现自我蜕变
》
售價:NT$
352.0
《
超加工人群:为什么有些食物让人一吃就停不下来
》
售價:NT$
454.0
《
历史的教训(浓缩《文明的故事》精华,总结历史教训的独特见解)
》
售價:NT$
286.0
《
不在场证明谜案(超绝CP陷入冤案!日本文坛超新星推理作家——辻堂梦代表作首次引进!)
》
售價:NT$
265.0
《
明式家具三十年经眼录
》
售價:NT$
2387.0
《
敦煌写本文献学(增订本)
》
售價:NT$
1010.0
編輯推薦:
本教材是《大数据工具应用》在线开放课程对应的教材。《大数据工具应用》在线开放课程于2018年初在智慧树平台上线,2018年底面向全国开放共享。该课程于2018年获得广东省本科高校质量工程建设项目立项,2019年底获得广东省精品在线开放课程。课程展示请见以下网址:https:coursehome.zhihuishu.comcourseHome2067507
內容簡介:
本课程面向非计算机专业学生,以普及大数据基础知识和工具为目标,力图构建一门新的大数据入门学习课程。课程包括数据获取、数据挖掘、数据呈现和数据思维等四部分内容。课程立足应用入门,突出八爪鱼、Weka和Tableau等主流工具应用,强调案例教学。通过本课程学习,学生们能够掌握一定的数据获取、分析与呈现技能,初步建立数据思维。而且,学习先决条件仅为熟练使用Word和Excel,教学与学习中都无需编程,可视为基本无门槛。 截止目前为止,在国内众多在线开放课程平台和教材市场上,未发现有同类型的课程。
關於作者:
钟雪灵,博士,广东金融学院互联网金融与信息工程学院教授,副院长。主持和参与多项国家自然科学基金项目和国家社会科学基金项目。在Naval Research Logistics,European Journal of Operational Research等期刊发表论文数十篇。主编《Python程序设计基础》和《算法基础与实验》两部教材。主持《大数据工具应用》在线开放课程。
目錄 :
第1章 大数据基本概念及其应用00
1.1 大数据应用概况00
1.1.1 大数据的定义00
1.1.2 大数据的特点00
1.1.3 大数据的结构00
1.1.4 相关技术00
1.1.5 现状与趋势00
1.2 大数据处理步骤00
1.2.1 数据获取00
1.2.2 数据存储00
1.2.3 数据管理00
1.2.4 数据分析0
1.3 应用案例0
1.3.1 商品推荐服务0
1.3.2 公共信息服务0
1.3.3 数据呈现服务0
第2章 数据获取0
2.1 格式转换与数据清洗整理0
2.2 网页数据获取0
2.2.1 八爪鱼采集原理与安装0
2.2.2 模板采集任务0
2.2.3 自定义采集模式0
第3章 数据分析入门0
3.1 Weka简介与数据预处理0
3.1.1 软件下载 0
3.1.2 文件与数据格式0
3.1.3 Weka程序界面0
3.1.4 数据预处理0
3.2 数据分类0
3.2.1 J48决策树分类器0
3.2.2 LinearRegression分类器0
3.2.3 M5P分类器0
3.3 数据聚类0
3.3.1 SimpleKMeans聚类器0
3.3.2 EM聚类器0
3.3.3 DBSCAN聚类器0
3.4 数据关联0
3.4.1 关联规则相关概念0
3.4.2 Apriori算法介绍0
3.4.3 Weka中Apriori关联规则挖掘0
3.5 选择属性0
3.5.1 属性选择概述0
3.5.2 Weka中Select attributes标签页0
3.5.3 选择属性模式介绍0
3.5.4 Weka中选择属性操作示例0
3.6 数据可视化0
3.6.1 Visualize标签页0
3.6.2 数值型类别属性可视化0
第4章 数据分析进阶0
4.1 贝叶斯网络0
4.1.1 贝叶斯公式简介0
4.1.2 贝叶斯网络简介
4.1.3 创建贝叶斯网络
4.1.4 使用贝叶斯网络进行推理
4.2 神经网络
4.2.1 神经网络介绍
4.2.2 Weka神经网络选项设置
4.2.3 编辑神经网络
4.2.4 神经网络参数调整
4.3 时间序列分析及预测
第5章 Tableau数据可视化
5.1 Tableau概述与入门
5.1.1 概述
5.1.2 下载与安装
5.1.3 数据类型
5.1.4 Tableau Desktop软件界面
5.1.5 文件类型
5.2 初级可视化分析
5.2.1 条形图
5.2.2 直方图
5.2.3 饼图
5.2.4 折线图
5.2.5 压力图
5.2.6 树地图
5.2.7 气泡图
5.3 地图分析
5.3.1 认识地图
5.3.2 创建地图
5.4 高级数据操作
5.4.1 分层结构
5.4.2 组
5.4.3 集
5.4.4 参数
5.4.5 计算字段
5.5 分析图表整合
5.6 案例一: 无锡市宜居时间分析
5.6.1 创建计算字段
5.6.2 空气质量
5.6.3 气温
5.6.4 宜居时间
5.6.5 制作仪表板
5.7 案例二: 佛山市纳税企业增长情况分析
5.7.1 创建字段
5.7.2 预测
5.7.3 剖析行业
5.7.4 剖析区域
5.7.5 制作仪表板
5.7.6 分析
第6章 数据分析拓展
6.1 数据分析拓展引言
6.1.1 研究背景及实验数据
6.1.2 研究方法
6.2 k最近邻算法
6.2.1 k最近邻算法的基本原理
6.2.2 Weka中k最近邻算法kNN应用实践
6.3 支持向量机
6.3.1 支持向量机算法基本原理
6.3.2 Weka中SVM算法应用实践
6.4 逻辑回归算法
6.4.1 逻辑回归算法基本原理
6.4.2 Weka中的逻辑回归算法应用实践
6.5 随机森林算法
6.5.1 随机森林算法基本原理
6.5.2 Weka中的随机森林算法应用实践
6.6 模型性能评估一
6.7 模型性能评估二
第7章 数据思维
7.1 数据分析基础
7.1.1 相关概念
7.1.2 数据分析可以帮用户做什么
7.1.3 如何做有效的数据分析
7.2 数据分析思维、过程和方法
7.2.1 数据分析思维
7.2.2 数据分析过程
7.2.3 数据分析方法
7.2.4 数据分析结果展示
参考文献
內容試閱 :
数字时代已经来临。移动互联网、云计算、大数据、人工智能、物联网等先进信息技术层出不穷,不断渗透至社会的各个领域,产生了许多新的应用场景,深刻地改变着人们的社交方式、生活方式和工作方式。
数字时代要求有新的教育,新工科、新医科、新农科、新文科的概念应运而生。教育部高教司司长吴岩指出,高等教育创新发展势在必行,要全面推进新工科、新医科、新农科、新文科建设。在推进新工科、新医科、新农科、新文科建设中,普及大数据基础教育非常有必要,但在各个专业的传统教学体系中缺乏此类课程和资源。为此,我们于2017年着手开发入门级的
大数据工具应用在线开放课程。该课程首期成果于2018年初在智慧树平台上线,2018年底面向全国开放共享。经过约两年的逐步建设和完善,该课程构建了教学视频、教学PPT、题库、实验报告、实验数据以及补充学习材料等丰富的教学资源。截至2020年4月,使用该课程的高校超过百所,累计学员超过1.6万人,课程获得各高校师生的一致好评。为了方便大家学习,达到更好的学习效果,课程教学团队集中力量编撰了本书,作为大数据工具应用课程的配套教材。本书的出版是
大数据工具应用课程建设的又一个重要成果。
大数据工具应用课程以讲授大数据基础知识和工具应用为使命,力图构建一门新的大数据入门学习课程。课程包括7章,涵盖数据获取、数据挖掘、数据呈现和数据思维等内容。课程立足应用入门,强调工具操作,突出案例教学。通过本课程的学习,学生们能够掌握一定的数据获取、分析与呈现技能,初步建立数据思维的概念。具体而言,本课程具有以下特色。
1. 属于新工科类课程
本课程讲授新兴的信息技术,围绕大数据的基础知识和工具应用进行课程建设和开发。学习本课程,学生将能拓展所学专业的知识边界,获得一定的大数据知识与技能,建立数据思维的概念。在大数据时代,向各个专业推出此类新工科课程极富意义。
2. 强调工具应用
本课程是一门工具慕课。在数据获取部分引入爬虫工具八爪鱼; 数据挖掘部分引入开源工具Weka; 数据呈现部分引入商业工具Tableau。这三个工具皆是易获取的主流软件。教学中力图将理论与实践相结合,讲解和演示如何基于所学理论使用工具去解决实际问题。工具应用是理论与实践之间的纽带,强调动手操作是课程学习的关键。此外,通过线上教学视频呈现老师们的演示操作,学生们能够无限次观看学习,弥补了线下教学演示难以多次重复的不足。
3. 低门槛学习要求
现有的大数据课程往往要求学生具有一定的编程和算法基础,门槛较高,很多学生难于入门。为此,本课程尽量降低学习门槛,学习先决条件仅为熟练使用Word和Excel,教学实施期间无编程要求。课程的低门槛使得各类学生能够容易踏入大数据之门,揭开大数据的神秘面纱,领略大数据的美妙。
本书由钟雪灵教授和郭艺辉博士担任主编,与侯昉博士(系统分析师)、刘晓庆副教授、黄承慧博士(系统分析师)和彭诗力博士(系统分析师)一道编撰。各章内容编写的具体分工如下: 侯昉
编写第1、2章和3.1节~3.3节; 刘晓庆编写3.4节~3.6节和第7章; 黄承慧
编写第4章; 钟雪灵编写第5章; 郭艺辉编写6.1节~6.3节; 彭诗力
编写6.4节~6.6节。全书由钟雪灵和郭艺辉定稿。
本课程得到了多方人士的大力支持和帮助。广东金融学院李建军书记积极推动具有我校特色的在线工具课程群开发,王醒男副
校长针对应用型人才能力培养提出工具课程作为抓手。两位领导作为我校应用型人才工具课程建设的布局者,为本课程成功上线与持续建设创造了良好的环境。学校实验教学中心王小燕主任作为工具课程建设的负责人,是我们课程团队的领路人。在此向各位领导表示衷心的感谢!除了本书的作者外,课程团队成员温聪源高级实验师、朱彪先生、何志锋博士和谢添德老师为课程的建设和运行积极奉献自己的智慧。智慧树网的方一蛟先生、邓利鹏小姐、秦月小姐、肖茹丹小姐、林鹏飞先生和申文斌先生为课程的建设和运行做了大量的工作。清华大学出版社
为本书的顺利出版也付出良多。在此向为大数据工具应用课程付出辛勤劳动的朋友们表示衷心的感谢!
钟雪灵
2020年4月12日于广州