新書推薦:
《
女人的胜利
》
售價:NT$
254.0
《
数据有道:数据分析+图论与网络+微课+Python编程(鸢尾花数学大系:从加减乘除到机器学习)
》
售價:NT$
1214.0
《
500万次倾听:陪伤心的人聊聊
》
售價:NT$
245.0
《
英国商业500年(见证大国崛起与企业兴衰,启迪未来商业智慧。)
》
售價:NT$
367.0
《
万千心理·儿童心理治疗中的心智化:临床实践指导
》
售價:NT$
398.0
《
自我囚禁的人:完美主义的心理成因与自我松绑(破除你对完美主义的迷思,尝试打破自我评价过低与焦虑的恶性循环)
》
售價:NT$
301.0
《
周易
》
售價:NT$
203.0
《
东南亚的传统与发展
》
售價:NT$
306.0
|
編輯推薦: |
《高等统计学》可以作为本科高年级学生或硕士研究生的教材,也可以作为科技工作者自学或查阅资料的参考书。
|
內容簡介: |
《高等统计学》介绍高等统计学的基本概念、方法和理论,其内容包括基本概念、点估计、统计决策与Bayes统计、假设检验、区间估计和置信域。《高等统计学》着重阐述高等统计学的思想、概念和方法,尽量简化公式推导和理论证明。此外,每章列举一些典型例题,给出较详细的解题方法和技巧,并有选择地安排一些模拟计算和图示。
《高等统计学》可以作为本科高年级学生或硕士研究生的教材,也可以作为科技工作者自学或查阅资料的参考书。
|
目錄:
|
目 录
前言
第 1 章 基本概念 1
1.1 统计模型与常用分布族 1
1.1.1 统计模型 1
1.1.2 常用分布族 4
1.2 统计量及其分布 9
1.2.1 统计量 9
1.2.2 抽样分布 11
1.2.3 统计量的渐近分布 12
1.3 充分统计量 15
1.3.1 充分统计量的定义 15
1.3.2 因子分解定理 19
1.3.3 极小充分统计量 22
1.4 完备统计量 24
1.4.1 分布族的完备性 24
1.4.2 完备统计量 26
1.4.3 Basu 定理 27
1.5 指数型分布族 28
1.5.1 指数型分布族的定义 28
1.5.2 指数型分布族的标准形式 30
1.5.3 指数型分布族的基本性质 32
习题 1 35
第 2 章 点估计 37
2.1 估计量优良性的评价标准 37
2.1.1 均方误差准则 37
2.1.2 无偏性 38
2.1.3 相合性 39
2.1.4 渐近正态性 42
2.2 无偏估计 47
2.2.1 一致*小方差无偏估计47
2.2.2 Fisher 信息 54
2.2.3 C-R 不等式 62
2.2.4 有效无偏估计 66
2.3 矩估计 69
2.3.1 矩估计的概念和方法 69
2.3.2 矩估计的相合性和渐近正态性 70
2.4 极大似然估计 72
2.4.1 极大似然估计的概念和方法 73
2.4.2 极大似然估计的相合性与渐近正态性 78
2.4.3 渐近有效性 83
2.5 同变估计 84
2.5.1 同变估计的概念 84
2.5.2 平移变换下位置参数的同变估计 86
2.5.3 尺度变换下尺度参数的同变估计 89
2.5.4 线性变换下位置尺度参数的同变估计 93
2.6 稳健估计 95
2.6.1 M 估计 95
2.6.2 L 估计和 R 估计 101
习题 2 102
第 3 章 统计决策与 Bayes 统计 107
3.1 统计决策理论概述 107
3.1.1 统计决策问题的三要素 107
3.1.2 决策函数和风险函数 111
3.1.3 决策函数的优良性准则 112
3.2 Bayes 统计基本概念 114
3.2.1 先验分布和后验分布 114
3.2.2 先验分布的选取方法 116
3.3 Bayes 估计 122
3.3.1 求 Bayes 估计的方法 122
3.3.2 Bayes 估计的容许性 130
3.4 极小极大估计 131
3.4.1 若干基本结果 131
3.4.2 极小极大估计的性质 134
习题 3 134
第 4 章 假设检验 137
4.1 基本概念137
4.1.1 拒绝域和检验函数 137
4.1.2 两类错误 138
4.1.3 检验的功效函数 139
4.1.4 检验的水平 140
4.1.5 充分性原则 142
4.2 Neyman-Pearson 基本引理 142
4.3 一致**检验 152
4.3.1 定义和基本结果 152
4.3.2 单调似然比分布族的单边检验 154
4.3.3 单参数指数型分布族的双边检验 一 161
4.4 一致**无偏检验 167
4.4.1 无偏检验和相似检验 167
4.4.2 单参数指数型分布族的双边检验 二 170
4.4.3 正态分布单参数的双边检验 174
4.4.4 多参数指数型分布族的一致**无偏检验 178
4.5 似然比检验 187
4.5.1 似然比检验的定义和例子 187
4.5.2 似然比统计量的渐近分布 192
4.6 Bayes 假设检验 197
习题 4 200
第 5 章 区间估计和置信域 203
5.1 基本概念 203
5.1.1 置信区间及其精度 203
5.1.2 置信限 204
5.1.3 置信域 205
5.2 构造置信区间和置信域的方法 205
5.2.1 枢轴量法 205
5.2.2 正态逼近法 208
5.2.3 似然法 210
5.2.4 经验似然法 211
5.2.5 Bootstrap 法 214
5.2.6 假设检验法 217
5.3 区间估计的优良性 219
5.3.1 一致*精确置信域 219
5.3.2 置信域的平均测度 220
5.4 信仰推断方法 223
5.4.1 信仰分布 223
5.4.2 函数模型 224
5.4.3 Behrens-Fisher 问题 226
习题 5 228
参考文献 230
附录 附表 231
索引 249
|
內容試閱:
|
第1章基本概念
本章主要介绍统计学中的基本概念,主要内容包括统计模型与常用分布族、统计量及其分布、充分统计量、完备统计量、指数型分布族。这些内容将为后面各章的学习提供帮助。
1.1统计模型与常用分布族
统计学方法和理论的研究是基于某个统计模型展开的,而对统计模型的讨论涉及分布族。因此,统计模型与分布族在统计学中扮演着重要角色。本节首先引入统计模型的概念,然后介绍一些常用的分布族。
1.1.1统计模型
在开始学习统计学之前,首先要明白什么是统计学。《大英百科全书》的解释是:统计学Statistics是一门收集与分析数据,并且根据数据进行推断的艺术与科学。按照上述对统计学的解释,我们可以看出统计学有两个主要任务:一是收集数据;二是分析数据,**个任务的内容属于统计学中的两门课程抽样调查和试验设计;第二个任务需要利用各种统计方法来完成本书仅考虑第二个任务,即讨论如何对已有的数据进行统计分析的问题。由于数据来源于自然和社会的各个方面,应用是统计学的一个十分重要的特征,但实际应用更需要理论为基础。
因此,本书不但介绍统计学中的基本概念和方法,而且也涉及主要的统计理论。
在统计学中,数据是样本的观测值,数据分析的目的是利用样本来对事物的某些未知方面进行统计推断或预测。假定样本X的一切可能取值为X,那么通常称X为样本空间,称X;B为可测空间,其中B是X的某些子集构成的.域 .依X的分布而从X中随机抽出的一个元素就是样本对一维总体,容量为n的样本X记为X1;¢¢¢;Xn.,其中 \."表示向量或矩阵的转置,此时样本空间X是n维欧氏空间Rn或Rn的某个Borel子集,而取X的一切Borel子集作为 B.这样的样本空间称为欧氏样本空间对于k维总体,也可以作类似理解。有了这个约定,我们就不必在每个场合下对样本空间进行说明了。
随机变量X有一定的概率分布F.大家知道,在概率论中F是给定的,概率和数字特征的计算是在F已知的情况下进行的对统计学中的问题,F总是未知的,或仅知道其形式而其中含有未知参数。因此,我们可以把这个意思说成:F属于某个分布族F.它在特定的统计问题中有具体的含义。当F是样本分布时,F称为样本分布族;而当F是总体分布时,F则称为总体分布族。二者统称为分布族,但其含义有些差别。例如,如果总体eX有分布eF,从eX中抽取独立同分布iid样本X1;¢¢¢;Xn,则X=X1;¢¢¢;Xn.有分布F=eF£¢¢¢£eF,它完全由eF所决定。我们可以把样本X1;¢¢¢;Xn视为在完全同等的条件下对eX所作的n次独立观测值,此时通常把由eX的分布 eF所构成的集合称为总体分布族,它决定了样本X的分布族||样本分布族。因此在这个特例下,总体分布族与样本分布族有不同的含义。
样本空间X、.域B和样本分布族F构成了一个统计问题的三个基本要素。我们称三元组X;B;F为统计模型。如果分布族F仅依赖于某一个参数或参数向量μ,则称该模型为参数统计模型,并称F为参数分布族。如果F中的分布不能用有限个参数来刻画,则称该模型为非参数统计模型,并称F为非参数分布族。例如,设F1=fFμ: μ2£g,其中μ为参数,£为参数空间,那么X;B;F1为参数模型,其中F1为参数分布族。又如,设F2=fF:F 为实数集R上的对称分布g,那么X;B;F2为非参数模型,其中F2为非参数分布族。
在实践中,对具体问题可以借助于专业知识和经验积累来确定统计模型。人们通常希望从参数模型出发来研究统计学中的问题,因为参数模型含有较多的信息,由此出发可以获得精度较高的参数估计。但这样做要承担一定的风险,这是因为当参数模型不真时,统计推断结果可能会偏离实际,甚至与实际相背离。如果选用非参数模型,所冒风险就会很小,因为非参数模型适应面广,但它所含的信息较少,统计推断结果的精度一般不会很高。在这两类模型下所用的统计推断方法有很大差别,这就形成了统计学中的两类方法||参数统计方法和非参数统计方法。
在20世纪80年代,人们提出了另一类模型||半参数模型部分线性模型就是其中的一种,即有形式
EYjX=x;U=u=ˉ.x+gu;1.1.1
其中ˉ=ˉ1;¢¢¢;ˉp.为p维未知参数向量,gu为定义在某区间上的未知函数。模型1.1.1由两部分构成:**部分ˉ.x为x=x1;¢¢¢;xp.的线性组合;第二部分gu为u的非线性函数。因此称它为部分线性模型。该模型不能作为参数模型,因为X;U;Y的分布族不能通过有限个参数来刻画。由于模型1.1.1的**部分是参数性的,而第二部分是非参数性的,因此它应归入半参数模型。按照这一思想,可以举出其他一些半参数模型的例子。例如,单指标模型、部分线性单指标模型、部分线性变系数模型、可加部分线性模型等。对半参数模型的讨论超出了本书的范围,这里不再赘述。
本书主要讨论参数模型及参数统计方法,但也涉及非参数统计方法。关于非参数模型及非参数统计方法的详细讨论,可以阅读相关的非参数统计书籍,例如,陈希孺和柴根象1993,孙山泽2000,王静龙和梁小筠2006,李竹渝与鲁万波和龚金国2007,薛留根2013,2015等。对于半参数模型的讨论,可参阅柴根象和洪圣岩 1995、薛留根2012等人的著作。
下面引入可控分布族和可控模型的概念。为此,我们从测度的**连续性谈起。
定义1.1.1设X;B;F为一统计模型。如果在可测空间X;B上存在这样一个.有限测度1,使得F中每一个概率分布F对1都是**连续的,即对任意F2F,都有F.1,则称F为可控分布族,称X;B;F为可控模型,并称1为控制测度,相应的Radon-Nikodym导数dF=d1称为密度函数,简称为密度。对控制测度1,如无特殊声明,均指非负测度。统计学中常用来作控制的有限测度有两种:计数测度和Lebesgue测度。下面举例加以说明。
例1.1.1计数测度设X=R;B是直线上一切Borel集组成的.域,在X;B上定义如下测度:
1B=B中非负整数的个数;8B2B:容易验证,测度1是.有限测度,并称为计数测度。它可以用来控制任一个定义在非负整数集合N或其子集上的概率分布族,其Radon-Nikodym导数就是通常的概率分布列。如对Poisson分布族来说,任一个不含非负整数的Borel集A的计数测度1A为零,而在这样的集合上Poisson概率PA必为零。
今后对离散型随机变量的分布所谈论的密度函数,就是指该分布对计数测度的Radon-Nikodym导数。下面给出 Lebesgue测度的定义。
例1.1.2Lebesgue测度设X=R;B是直线上的一切Borel集组成的。
域,在X;B上基于区间长度定义Lebesgue测度1B=B中不相交区间的长度之和或其极限;8B2B:容易验证, Lebesgue测度是有限测度,它可以控制任一个定义在实数集R上的连续分布F,其Radon-Nikodym导数就是通常的密度函数fx。
一般来说,对于一个参数模型X;B;F,如果分布族F=fFμ;μ2£g是可控的,其控制测度为1,则相应的密度函数也依赖于参数μ,即
dFμxd1=fx;μ;μ2£:
此时,可控分布族也可以用密度函数fx;μ表示,即
X;B;ffx;μ:μ2£g:
存在既不被计数测度控制,又不被Lebesgue测度控制的分布族。一个特殊的例子是Marshall-Olkin的二元指数族。对该分布族的详细讨论可参阅茆诗松等2006的著作,这里不再赘述。
1.1.2常用分布族
在统计模型X;B;F中,样本空间X和.域B是不可缺少的,它指出了样本的取值范围以及应讨论哪一类事件是有意义的。但分布族F是统计模型的核心,它在统计推断中起着重要作用。在概率论与数理统计的教科书中已介绍过一些常用的分布族,其中包括:
1二项分布族fBn;μ:00g;
3正态分布族fN1;.2:1;.22R£R+g,其中R+是正实数集;
4均匀分布族fUa;b:.12时,fx先其中自由度n可为任意正实数,但在实际问题中常用的自由度n为自然数,并编制了2 分布表。
6Beta分布族。Beta分布的密度函数为
记为Bea;b,其中a和b是正的参数。Beta分布族记为fBea;b:a0;b0g。
对Beta分布族作如下解释。
iBeta分布的密度曲线。参数a和b的值的改变将导致Beta分布的密度曲线形状的改变。图1.1.2在a和b的不同值下给出了几种特殊的Beta分布的密度曲线。从图中可以得到如下结论:当a1和b1时,
fx的曲线呈单峰状,在a.1=a+b.2处达到**值;当a61和b1时,
fx是严减函数;当a1和b61时,fx是严增函数。
|
|