新書推薦:
《
皇家宫廷中的保健秘方 中小学课外阅读
》
售價:NT$
290.0
《
《诗经》十五讲 十五堂《诗经》历史文化与文学课 丹曾人文通识丛书
》
售價:NT$
395.0
《
述异记汇笺及情节单元分类研究(上下册)
》
售價:NT$
475.0
《
环境、社会、治理(ESG)信息披露操作手册
》
售價:NT$
1190.0
《
桑德拉销售原则 伍杰 [美]大卫·马特森
》
售價:NT$
440.0
《
理论的意义
》
售價:NT$
340.0
《
悬壶杂记:医林旧事
》
售價:NT$
240.0
《
谁之罪?(汉译世界文学5)
》
售價:NT$
240.0
|
編輯推薦: |
结合各类常见的统计方法,系统地讲述R软件以及统计原理及模型
|
內容簡介: |
本书的版是国内较早系统地介绍R软件的中文书籍,第二版教材对版的内容作了较大的改动,使内容的编排更加合理,同时增加了一些重要的知识点,以及扩展程序包中函数的介绍,减少自编函数的使用。 本版教材仍然延续版的风格,结合数理统计中的问题,对R软件进行科学、准确和全面的介绍,以便使读者能深刻理解该软件的精髓精髓,以及灵活和高级的使用技巧。本版的读者定位仍然是R的初学者,按照统计知识、统计模型、R相关函数的使用和示例来编排,使读者即了解了统计的相关知识,又容易掌握与之对应的R函数的使用。
|
關於作者: |
薛毅,一直从事数学建模、计算数学和运筹学方面的教学与科研工作。主讲多门本科生、研究生课程,其中“数学建模”课程荣获北京市精品课程(2005年度)。出版著作或教材17部,译著2部,其中《数学建模基础》和《数值分析与科学计算》获得北京市高等教育精品教材奖(2006年度和2013年度),《数学建模基础》获国家“十一五”规划教材,《统计建模与R软件》被誉为国内本系统介绍R的中文书籍。两次被评为北京市优秀教师(2006年和2017年)。
|
目錄:
|
第1章 R软件简介 1
1.1 R软件的下载与安装 1
1.2 R软件的界面 2
1.2.1 主窗口 2
1.2.2 文件菜单 3
1.2.3 其他菜单 5
1.2.4 程序包菜单 5
1.2.5 帮助菜单 7
1.3 与数据有关的对象 8
1.3.1 纯量 8
1.3.2 向量 9
1.3.3 因子 13
1.3.4 矩阵 15
1.3.5 数组 18
1.3.6 列表 21
1.3.7 数据框 23
1.4 向量与矩阵的运算 26
1.4.1 向量的四则运算 26
1.4.2 向量的内积与外积 27
1.4.3 矩阵的四则运算 28
1.4.4 矩阵的函数运算 29
1.4.5 求解线性方程组 30
1.4.6 矩阵分解 31
1.5 方程求解与优化问题 34
1.5.1 非线性方程求解 34
1.5.2 优化问题求解 36
1.6 读、写数据文件 38
1.6.1 读纯文本文件 38
1.6.2 读取csv格式的表格数据 41
1.6.3 读取Excel表格文件 41
1.6.4 数据集的读取 43
1.6.5 写数据文件 44
1.7 控制流 45
1.7.1 分支函数 46
1.7.2 中止语句与空语句 47
1.7.3 循环函数 47
1.8 R函数的编写 49
1.8.1 函数定义 49
1.8.2 有名参数与默认参数 51
1.8.3 递归函数 52
1.9 程序运行与调试 52
1.9.1 建立自己的工作目录 52
1.9.2 工作空间 53
1.9.3 作用域 53
1.9.4 程序调试 54
习题 155
第2章 概率、随机变量及其分布 57
2.1 随机事件与概率 57
2.1.1 随机事件 57
2.1.2 概率 58
2.1.3 古典概型 59
2.1.4 几何概型 63
2.1.5 条件概率 64
2.1.6 概率的乘法公式、全概率公式、贝叶斯公式 65
2.1.7 独立事件 66
2.1.8 n重伯努利试验及其概率计算 66
2.2 随机变量及其分布 66
2.2.1 基本概念 66
2.2.2 常见的离散型随机变量的分布 69
2.2.3 常见的连续型随机变量的分布 73
2.3 随机向量 78
2.3.1 定义及联合分布 78
2.3.2 离散型随机向量 79
2.3.3 连续型二维随机向量 79
2.3.4 边缘分布 79
2.3.5 随机变量的独立性 80
2.3.6 常见的二维随机向量的分布 81
2.4 随机变量的数字特征 82
2.4.1 数学期望 82
2.4.2 方差 82
2.4.3 几种常用随机变量的数学期望与方差 83
2.4.4 协方差与相关系数 84
2.4.5 矩 85
2.4.6 协方差矩阵和相关矩阵 85
2.5 极限定理 87
2.5.1 大数定律 87
2.5.2 中心极限定理 88
2.6 数理统计的基本概念 90
2.6.1 总体、个体、简单随机样本 91
2.6.2 参数空间与分布族 92
2.6.3 统计量 93
2.6.4 常用的统计量 93
2.6.5 抽样 95
2.6.6 导出分布 95
2.6.7 统计量的分布 98
2.7 R中内置的分布函数 100
习题2 101
第3章 数据描述性分析 104
3.1 描述统计量 104
3.1.1 位置的度量 104
3.1.2 分散程度的度量 109
3.1.3 分布形状的度量 111
3.2 数据的分布 113
3.2.1 直方图、经验分布图与QQ图 113
3.2.2 茎叶图、箱线图及五数总括 117
3.3 R软件中的绘图命令 122
3.3.1 高水平绘图函数 122
3.3.2 高水平绘图中的命令 133
3.3.3 低水平作图函数 134
3.4 多元数据的数字特征与相关分析 135
3.4.1 二元数据的数字特征及相关系数 135
3.4.2 二元数据的相关性检验 137
3.4.3 多元数据的数字特征及相关矩阵 139
3.4.4 基于相关系数的变量分类 142
3.5 多元数据的图表示方法 146
3.5.1 轮廓图 146
3.5.2 星图 148
3.5.3 调和曲线图 151
习题3 152
第4章 参数估计 154
4.1 点估计 154
4.1.1 矩法 154
4.1.2 极大似然法 158
4.2 估计量的优良性准则 164
4.2.1 无偏估计 164
4.2.2 有效性 166
4.2.3 相合性(一致性) 166
4.3 区间估计 167
4.4 单个总体的区间估计 168
4.4.1 均值估计: Z统计量 168
4.4.2 均值估计: t统计量 171
4.4.3 总体比例估计 173
4.5 两个总体的区间估计 175
4.5.1 均值差的估计: Z统计量 175
4.5.2 均值差的估计: t统计量 177
4.5.3 总体比例差的估计 181
4.6 总体方差的估计 183
4.6.1 方差的估计 183
4.6.2 方差比的估计 186
习题4 188
第5章 假设检验 191
5.1 假设检验的基本概念 191
5.1.1 基本概念 191
5.1.2 假设检验的基本思想与步骤 193
5.1.3 假设检验的两类错误 193
5.1.4 原假设和备择假设的设置 194
5.2 重要的参数检验 194
5.2.1 Z检验 194
5.2.2 t检验 200
5.2.3 总体比例的检验 206
5.2.4 泊松分布参数的检验 211
5.2.5 正态总体方差的检验 214
5.3 分布的检验 216
5.3.1 皮尔逊拟合优度??检验 217
5.3.2 柯尔莫戈洛夫--斯米尔诺夫检验 222
5.3.3 正态性检验 224
5.4 列联表检验 227
5.4.1 皮尔逊 ??独立性检验 227
5.4.2 费希尔精确的独立检验 230
5.4.3 麦克尼马尔检验 232
5.5 符号检验 233
5.5.1 单个总体的检验 233
5.5.2 两个总体的检验 234
5.6 秩检验 236
5.6.1 秩统计量 236
5.6.2 威尔科克森符号秩检验 238
5.6.3 威尔科克森秩和检验 240
5.6.4 配对数据的秩检验 242
5.7 秩相关检验 243
5.7.1 斯皮尔曼秩相关检验 243
5.7.2 肯德尔秩相关检验 245
5.7.3 多组数据的相关性检验 246
5.8 游程检验 248
习题5 251
第6章 回归分析 256
6.1 一元线性回归分析 256
6.1.1 数学模型 256
6.1.2 回归参数的估计 257
6.1.3 回归方程的显著性检验 258
6.1.4 参数? _0与? _1的区间估计 261
6.1.5 预测 261
6.1.6 计算实例 262
6.2 与线性回归有关的函数 266
6.2.1 基本函数 266
6.2.2 提取模型信息的函数 266
6.3 多元线性回归分析 269
6.3.1 数学模型 270
6.3.2 回归系数的估计 270
6.3.3 显著性检验 271
6.3.4 示例 272
6.3.5 回归系数的区间估计 274
6.3.6 预测 274
6.3.7 修正拟合模型 275
6.3.8 计算实例 275
6.4 逐步回归 279
6.4.1 “”回归方程的选择 279
6.4.2 逐步回归的计算 280
6.5 回归诊断 284
6.5.1 回归诊断的重要性 284
6.5.2 残差 287
6.5.3 残差图 289
6.5.4 残差的独立性检验 293
6.5.5 影响分析 295
6.6 多重共线性的诊断 301
6.6.1 什么是多重共线性 301
6.6.2 多重共线性的发现 301
6.7 广义线性回归模型 305
6.7.1 与广义线性模型有关的R函数 305
6.7.2 正态分布族 306
6.7.3 二项分布族 308
6.7.4 泊松分布族 313
6.7.5 其他分布族 315
6.8 非线性回归模型 316
6.8.1 多项式回归模型 317
6.8.2 (内在)非线性回归模型 320
习题6 325
第7章 方差分析 330
7.1 单因素方差分析 330
7.1.1 数学模型 331
7.1.2 方差分析 331
7.1.3 方差分析表的计算 333
7.1.4 均值的多重比较 336
7.2 单因素方差分析的进一步讨论 340
7.2.1 误差的正态性检验 340
7.2.2 方差齐性检验 341
7.2.3 非齐方差数据的方差分析 342
7.3 秩检验 342
7.3.1 克鲁斯卡尔--沃利斯秩和检验 342
7.3.2 弗里德曼秩和检验 345
7.4 双因素方差分析 347
7.4.1 不考虑交互效应 347
7.4.2 考虑交互效应 350
7.4.3 方差齐性检验 354
7.5 正交试验设计与方差分析 355
7.5.1 用正交表安排试验 355
7.5.2 正交试验的方差分析 358
7.5.3 有交互效应的试验 359
7.5.4 有重复试验的方差分析 362
习题7 363
第8章 应用多元分析(I) 367
8.1 判别分析 367
8.1.1 判别分析的基本概念 367
8.1.2 距离判别 369
8.1.3 贝叶斯判别 375
8.1.4 费希尔判别 380
8.1.5 判别分析的进一步讨论 384
8.1.6 扩展程序包中的判别函数 388
8.2 聚类分析 393
8.2.1 距离和相似系数 393
8.2.2 系统聚类法 399
8.2.3 动态聚类法 409
习题8 411
第9章 应用多元分析(II} 414
9.1 主成分分析 414
9.1.1 总体主成分 414
9.1.2 样本主成分 417
9.1.3 相关函数的介绍及实例 420
9.1.4 主成分分析的应用 425
9.2 因子分析 429
9.2.1 引例 430
9.2.2 因子模型 431
9.2.3 参数估计 432
9.2.4 方差的正交旋转 441
9.2.5 因子分析的计算函数 443
9.2.6 因子得分 446
9.3 典型相关分析 448
9.3.1 总体典型相关 449
9.3.2 样本典型相关 451
9.3.3 典型相关分析的计算 452
9.3.4 典型相关系数的显著性检验 454
习题9 456
第10章 数据可视化 459
10.1 多维标度法 459
10.1.1 多维标度法的基本概念 459
10.1.2 多维标度法的古典解 460
10.1.3 非度量方法 467
10.1.4 实例计算 469
10.2 对应分析 471
10.2.1 引例 472
10.2.2 对应分析的计算公式 473
10.2.3 R计算与绘图 475
10.3 样本与变量的双重信息图 479
10.3.1 双重信息图的构造 479
10.3.2 R作图 482
习题10 487
附录 489
A. R 函数索引 489
B. 习题参考答案 497
参考文献 520
|
內容試閱:
|
《统计建模与R软件》一书自2007年出版至今,已有14个年头,由于此书是实用统计方法中较早介绍R软件的中文教材之一,不少学校将它选作统计软件或统计计算的教材,或者是统计学专业的教学参考书。
但随着R软件版本的不断更新,书中的一些缺点也日渐明显,例如,有些命令已不适用于新的版本。另一方面,随着R软件扩展包的不断增加,R求解问题的能力也在不断增强,所以有必要介绍与统计模型关系密切的扩展程序包中的函数,减少自编程序的使用。
从图书出版到现在,作者收到过大量的邮件,除了索要书中自编程序外,有不少读者提出自己的观点和看法,也提出了不少建议。虽然本人一直在关注R软件的发展,并出版了《R语言实用教程》(清华大学出版社,2014.10)、《R语言在统计中的应用》(人民邮电出版社,2017.4)、《数学建模基于R》(机械工业出版社,2017.7)、《时间序列分析与R软件》(清华大学出版社,2020.5),但还是认为有必要修订再版,这或许就是读者的意见与建议的原因吧。
第2版教材对第1版的内容作了较大的改动,增加了扩展程序包中部分函数的介绍,尽量减少自编函数的使用。将第1版中的第1章与第2章调换,第1章为R软件的介绍,并增加了一些准备知识(如优化问题求解)。第2章为概率与数理统计基本知识的介绍,增加了相关概念中R函数的使用。去掉第1版中第10章计算机模拟,改为数据可视化,其目的是适应当前数据分析的需求。其他章节的改动不大,增加了扩展程序包中函数的介绍。根据读者要求,增加了习题参考答案。
第2版的各章编排与改动如下:第1章,R软件简介。介绍R软件的界面、与数据有关的对象、数据的读写和R函数的编写等,增加了求解非线性方程、优化问题求解和自编函数的运行与调试等内容。第2章,概率、随机变量及其分布。介绍概率与数理统计的基本知识,在各知识点,增加与之对应的R函数和例题。第3章,数据描述性分析。介绍常见的描述统计量,如均值、方差等。介绍数据分布的图形,如直方图、QQ图等。介绍基本的绘图方法和命令、多元数据的特征和图形表示方法等。去掉第1版中正态性检验与分布拟合检验,将这部分内容放在第5章中。第4章,参数估计。介绍点估计和区间估计,重点是正态总体的区间估计,增加了$Z$统计量及相关参数的估计,总体比例和总体比例差的估计。第5章,假设检验。介绍重要的参数检验、分布的检验、列联表检验、符号检验和秩检验等,增加了泊松分布参数的精确检验、数据的正态性检验和游程检验。第6章,回归分析。介绍线性回归、逐步回归、回归诊断、广义线性回归和非线性回归等内容,增加了残差的独立性检验。第7章,方差分析。介绍单因素方差分析、双因素方差分析,以及正交试验设计与方差分析的关系,增加了非齐方差数据的方差分析的内容。第8章,应用多元分析(I)。介绍判别分析和聚类分析,它们的共同点是对样本进行分类,增加了线性判别函数和二次判别函数的使用,K近邻算法、朴素贝叶斯算法的介绍及相关函数的使用。第9章,应用多元分析(II)。介绍主成分分析、因子分析和典型相关分析,它们的共同点是降维。第10章,数据可视化。介绍多维标度法、对应分析、样本与变量双重信息图,这部分内容还应属于应用多元分析的范畴,以数据可视化为题目是重点强调这些方法的可视化功能。后一部分内容是附录,包括R函数索引,便于读者查找书中的函数,以及习题的参考答案。
本书介绍的R函数是以R-4.0.2版本为基准,所有的函数与程序均通过测试。为了便于读者学习和使用,同时还提供了书中例题和习题的数据,以及部分习题参考解答的R程序(answer.R),读者可通过扫描本页的二维码获取。
本书是为理工、经济、管理、生物等专业学生或专业人员为解决统计计算问题而编写的,可以作为上述专业学生数理统计课程的辅导教材或教学参考书,也可作为统计计算课程的教材和数学建模竞赛的辅导教材。
由于受编者水平所限,书中一定存在不足甚至错误之处,欢迎读者不吝指正。
编者
2021年2月
于北京工业大学
|
|