新書推薦:
《
泉舆日志 幻想世界宝石生物图鉴
》
售價:NT$
611.0
《
养育女孩 : 官方升级版
》
售價:NT$
230.0
《
跨界:蒂利希思想研究
》
售價:NT$
500.0
《
千万别喝南瓜汤(遵守规则绘本)
》
售價:NT$
203.0
《
大模型启示录
》
售價:NT$
510.0
《
东法西渐:19世纪前西方对中国法的记述与评价
》
售價:NT$
918.0
《
养育男孩:官方升级版
》
售價:NT$
230.0
《
小原流花道技法教程
》
售價:NT$
500.0
|
編輯推薦: |
本书遵循教指委相关指导文件和高等院校学生学习规律编写而成。践行四新理念,融入思政元素,注重理论与实践相结合。
|
內容簡介: |
本书选用统计学和数据科学中常见的 R 语言和Python语言“双语”编 写,主要内容包括:引言、R 语言编程基础、R 语言数据处理、R 语言可 视化、R 语言随机抽样和随机数、R 语言基本统计推断、R 语言回归分析、 R 语言大数据分析、Python 语言基础、Python 数据处理等内容。此外, 本书在每章正文后设置主要函数列表、练习题和实验题,以帮助学生复习 巩固和自主练习。同时,还为教师配备了课程教学大纲(含课程思政内容)、 课件、习题解答、模拟试题及配套答案等丰富的教学资源。 本书结构严谨,逻辑清晰,叙述清楚,说明到位,行文流畅,习题配 备合理,可读性强,可作为高等学校统计学、大数据科学与技术等专业的 教材或相关专业的教学参考书,也可供统计分析软件初学者或从业者参考。
|
關於作者: |
作者简介 王洪,男,统计学博士,副教授,博士生导师。美国加利福尼亚大学洛杉矶分校 (UCLA)生物统计专业博士后,国家认证系统分析师,主要从事机器学习和生物统计 等方面的研究工作。以第一作者或通讯作者的身份发表 SCI 论文 30 余篇,获软件著作权 1 项。主持和参加多项国家社科基金、国家自科基金项目,主持多项全国统计科研项目重 点项目、人文社科基金等省部级项目,主持多项企业合作横向课题。
|
目錄:
|
目 录 前言 第 1 章 引言 1 1.1 统计分析的未来 1 1.2 常见统计分析软件比较 2 1.3 R 语言软件的下载、安装及基本操作3 1.3.1 下载和安装 R 语言软件 3 1.3.2 R 语言软件基本操作与控制 4 1.3.3 常用的 R 程序包7 1.3.4 RStudio 10 1.3.5 Markdown12 1.4 Python 语言软件的下载、安装及运行 14 1.4.1 下载与安装 Python 语言软件14 1.4.2 Anaconda15 1.4.3 运行 Python 15 1.5 本章小结 16 1.6 练习题17 1.7 实验题17 第 2 章 R 语言编程基础 18 2.1 R 语言版的 “Hello World!” 18 2.2 R 语言脚本运行 18 2.3 R 语言常量和变量19 2.4 R 语言对象基本操作 20 2.4.1 R 语言对象属性20 2.4.2 列出对象与删除对象 22 2.5 R 语言数据类型 23 2.5.1 向量23 2.5.2 数组32 2.5.3 矩阵33 2.5.4 数据框 35 2.5.5 列表36 2.6 R 语言流程控制 38 VI 2.6.1 分支条件语句 39 2.6.2 循环语句 41 2.7 R 语言自定义函数45 2.8 本章小结 48 2.9 练习题49 2.10 实验题 50 第 3 章 R 语言数据处理 51 3.1 数据的输入与输出51 3.1.1 终端输出 51 3.1.2 读取数据 53 3.1.3 保存数据 57 3.2 数据选择 59 3.2.1 常见数据操作函数59 3.2.2 取子集 63 3.2.3 常见数据选择函数68 3.3 数据整理 71 3.3.1 修改变量名称 71 3.3.2 增加新变量72 3.3.3 彻底删除新变量72 3.3.4 类型转换函数 73 3.3.5 排序74 3.3.6 数据合并 76 3.3.7 缺失数据处理 80 3.4 本章小结 81 3.5 练习题82 3.6 实验题82 第 4 章 R 语言可视化 84 4.1 R 语言基础绘图 84 4.1.1 高级绘图函数 84 4.1.2 低级绘图函数 96 4.1.3 交互式绘图函数98 4.1.4 使用图形参数 99 4.1.5 图形保存101 4.2 ggplot2 绘图包 102 4.2.1 ggplot 语法 103 4.2.2 ggplot 绘图函数103 4.3 增强型绘图 plotly 包 112 VII 4.3.1 将 ggplot2 对象转换为 plotly 对象112 4.3.2 直接创建 plotly 对象112 4.4 交互式动态网页 Shiny 包 115 4.4.1 Shiny 简介115 4.4.2 Shiny 应用程序的结构115 4.4.3 编写简单的 Shiny 应用117 4.4.4 运行 Shiny 应用程序121 4.5 本章小结 122 4.6 练习题 123 4.7 实验题 123 第 5 章 R 语言随机抽样和随机数 124 5.1 随机变量分布 124 5.2 随机抽样 125 5.3 生成已知分布的随机数129 5.3.1 R 语言函数生成随机数129 5.3.2 逆变换法生成随机数 131 5.3.3 舍选法 133 5.4 随机数的应用 134 5.4.1 估计参数134 5.4.2 验证大数定律 135 5.4.3 验证中心极限定理 136 5.5 本章小结 138 5.6 练习题 138 5.7 实验题 138 第 6 章 R 语言基本统计推断 140 6.1 R 语言汇总统计量函数140 6.2 R 语言参数估计方法 144 6.2.1 点估计 144 6.2.2 区间估计146 6.3 假设检验 148 6.3.1 t 检验 149 6.3.2 二项分布的总体检验 156 6.3.3 泊松分布的总体检验 157 6.3.4 样本比例的总体检验 158 6.3.5 方差分析160 6.4 非参数统计推断162 6.4.1 K-S 检验162 VIII 6.4.2 Wilcoxon 符号秩检验163 6.4.3 Wilcoxon 秩和检验 165 6.4.4 Pearson 卡方检验 166 6.4.5 Fisher 精确检验170 6.5 本章小结 171 6.6 练习题 171 6.7 实验题 172 第 7 章 R 语言回归分析173 7.1 一元回归模型 173 7.1.1 R 语言回归函数173 7.1.2 一元回归分析示例 175 7.2 多元回归模型 178 7.2.1 多元回归分析示例 178 7.2.2 处理类别变量 180 7.2.3 回归系数的置信区间 182 7.2.4 标准化的回归系数 182 7.3 回归模型的拟合优度 183 7.3.1 R2183 7.3.2 调整后的 R2 184 7.4 回归模型诊断 184 7.4.1 残差的分类184 7.4.2 线性假设诊断 186 7.4.3 残差分析和异常点检测186 7.4.4 多重共线性检测189 7.5 模型选择 196 7.5.1 最佳子集回归 196 7.5.2 逐步回归197 7.6 模型的预测203 7.6.1 回归模型的预测203 7.6.2 标准化数据的预测 204 7.7 本章小结 205 7.8 练习题 206 7.9 实验题 206 第 8 章 R 语言大数据分析 207 8.1 R 语言效率编程207 8.1.1 检查代码运行时间 207 8.1.2 优化 R 循环 208 IX 8.1.3 向量化运算209 8.1.4 优先使用 base 包命令210 8.1.5 使用 C++ 编程211 8.1.6 使用 apply 族函数 211 8.2 内存管理 214 8.2.1 内存使用214 8.2.2 内存清理215 8.3 R 并行处理包 216 8.3.1 parallel 软件包216 8.3.2 foreach 软件包218 8.4 R 高效读取大数据219 8.4.1 提升读取效率的函数 219 8.4.2 在内存外存储数据 221 8.5 本章小结 222 8.6 练习题 222 8.7 实验题 223 第 9 章 Python 语言基础 224 9.1 在 R 中调用 Python 224 9.2 Python 入门 225 9.2.1 Python 版 “Hello World!”225 9.2.2 关键字和标识符226 9.2.3 变量和常量226 9.2.4 Python 语句、缩进和注释 228 9.2.5 Python 数据类型229 9.2.6 数据类型转换 232 9.2.7 运算符和操作对象 233 9.3 Python 数据结构236 9.3.1 序列236 9.3.2 列表241 9.3.3 元组246 9.3.4 字符串 247 9.3.5 字典252 9.4 Python 流程控制256 9.4.1 条件语句256 9.4.2
|
內容試閱:
|
前 言 我们生活在一个大数据时代,这也是统计学工作者能够一展抱负的时代。然而,工欲 善其事,必先利其器,统计学从业者的 “器” 是什么呢?我们认为,“器” 就是一门合适的 编程语言。对于统计专业的学生来说,掌握 R 语言是必需的。同时,我们也发现,随着 数据科学尤其是深度学习的兴起,Python 语言在计算机科学、人工智能等领域应用广泛。 要和其他从事统计数据分析工作的同行交流、合作,统计专业的学生还必须了解 Python, 会用 Python。 R 和 Python 都很重要,那么到底学哪个呢?我们认为 “小孩子才做选择题,大人全 都要”。因此,在本书的编写过程中,我们试图 “毕其功于一役”,把 R 和 Python 两种语 言都囊括其中。但是,需要指出的是,对于统计专业的本科生来说,两门语言的重要程度 是不一样的:对 R 语言,要熟练掌握并运用;对 Python 语言,通晓基本概念,会用即 可。因此,在本书中,我们重点介绍了 R 语言,包括 R 语言基本概念、R 语言数据处理、 R 语言可视化、R 语言统计推断和 R 语言大数据分析等。对于 Python 语言,我们则介 绍了 Python 的基本概念、Python 数据处理等入门内容。 本书由王洪编写。王思政、周含璞和邹易等人参加了部分章节的资料整理工作。 在本书编写过程中,作者参阅了大量的统计分析软件、教材和相关资料,在此我们特 向有关作者表示深深的谢意。本书的编写还得到了中南大学本科生院、数学与统计学院许 多同仁的大力支持,谨向他们表示衷心感谢。 本书的出版是编者阶段性教学实践的总结。由于编者个人的局限性,本书可能会有一 些不足之处,恳请读者批评指正。 王 洪 2023 年 8 月
|
|