登入帳戶  | 訂單查詢  | 購物車/收銀台(0) | 在線留言板  | 付款方式  | 聯絡我們  | 運費計算  | 幫助中心 |  加入書簽
會員登入   新用戶註冊
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2023年度TOP分類閱讀雜誌 香港/國際用戶
最新/最熱/最齊全的簡體書網 品種:超過100萬種書,正品正价,放心網購,悭钱省心 送貨:速遞 / 物流,時效:出貨後2-4日

2024年11月出版新書

2024年10月出版新書

2024年09月出版新書

2024年08月出版新書

2024年07月出版新書

2024年06月出版新書

2024年05月出版新書

2024年04月出版新書

2024年03月出版新書

2024年02月出版新書

2024年01月出版新書

2023年12月出版新書

2023年11月出版新書

2023年10月出版新書

『簡體書』社会科学研究的贝叶斯推断方法

書城自編碼: 4048360
分類: 簡體書→大陸圖書→社會科學社会科学总论
作者: 顾昕
國際書號(ISBN): 9787576054491
出版社: 华东师范大学出版社
出版日期: 2024-11-01

頁數/字數: /
書度/開本: 16开 釘裝: 平装

售價:NT$ 296

我要買

share:

** 我創建的書架 **
未登入.



新書推薦:
历史的严妆:解读道学阴影下的南宋史学(中华学术·有道)
《 历史的严妆:解读道学阴影下的南宋史学(中华学术·有道) 》

售價:NT$ 500.0
海外中国研究·江南:中国文雅的源流
《 海外中国研究·江南:中国文雅的源流 》

售價:NT$ 347.0
迟缓的巨人:“大而不能倒”的反思与人性化转向
《 迟缓的巨人:“大而不能倒”的反思与人性化转向 》

售價:NT$ 352.0
我们去往何方:身体、身份和个人价值
《 我们去往何方:身体、身份和个人价值 》

售價:NT$ 305.0
大学问·批判的武器:罗莎·卢森堡与同时代思想者的论争
《 大学问·批判的武器:罗莎·卢森堡与同时代思想者的论争 》

售價:NT$ 449.0
低薪困境:剖析日本经济低迷的根本原因
《 低薪困境:剖析日本经济低迷的根本原因 》

售價:NT$ 301.0
穷人的银行家(诺贝尔和平奖获得者穆罕默德·尤努斯自传)
《 穷人的银行家(诺贝尔和平奖获得者穆罕默德·尤努斯自传) 》

售價:NT$ 347.0
绵延:文明分野与文化演进
《 绵延:文明分野与文化演进 》

售價:NT$ 301.0

編輯推薦:
使用者角度介绍贝叶斯推断方法。
近年来,频率统计推断方法受到统计学者的广泛批评,贝叶斯方法逐步得到社会科学研究者的关注。然而,贝叶斯方法原理复杂、计算困难,社会科学研究者可能不易理解和使用。为此,本书围绕社会科学研究的常用模型与实际研究问题阐述贝叶斯推断方法,主要讨论贝叶斯假设检验和模型选择问题,并介绍作者在R和JASP软件平台开发的贝叶斯数据分析软件包。本书注重方法的实例应用、软件操作和结果解读,希望能够帮助社会科学研究者、数据分析工作者、高校学生等学习、掌握和使用贝叶斯推断方法,更好地开展科学研究。
內容簡介:
本书涵盖了作者关于贝叶斯假设检验和模型选择的研究工作,结合案例在各类常用统计模型下讨论贝叶斯方法的应用流程和结果解读,同时给出案例数据分析的bain软件代码和JASP操作步骤。
本书主要讨论贝叶斯假设检验和模型选择的理论方法、模型应用、实证应用。第一章概述贝叶斯统计的基本概念以及相比于传统频率统计的优势。第二章综述贝叶斯假设检验的方法和应用,并介绍作者开发的贝叶斯检验软件,该章节不涉及统计原理和具体模型。第三章详细论述贝叶斯假设检验的原理和贝叶斯因子指标的计算,重点讨论本书作者提出的贝叶斯检验方法。该章节适合有一定数理基础的读者,只关注实际应用的读者可跳过第三章,不影响后续阅读。
第四、五、六、七、八章阐述贝叶斯假设检验在具体统计模型中的应用,每章都以实证案例穿插其中,展示作者提出的贝叶斯检验方法的实际应用,并演示作者开发的贝叶斯假设检验R软件包bain和JASP软件Bain模块的数据分析操作。具体地,第四章关注贝叶斯t检验模型,包括单样本t检验、两样本t检验、独立样本t检验、配对样本t检验的贝叶斯评估方法及其在软件中的实现。第五章考虑方差分析模型,包括单因素方差分析、两因素方差分析、协方差分析、重复测量方差分析模型的贝叶斯检验方法及其软件实现。第六章探讨贝叶斯检验方法在线性回归模型和logistic回归模型中的应用,包括自变量效应的检验、自变量效应次序的评估、模型整体检验等,同时给出回归模型贝叶斯检验的软件操作。第七章讨论因子分析模型中的贝叶斯检验问题,主要涉及因子负荷的贝叶斯检验,同样也有软件操作演示。第八章将线性回归模型和因子分析模型结合,在潜变量回归模型中考虑潜变量效应大小的贝叶斯检验以及软件实现。
第九章讨论线性回归模型和因子分析模型的贝叶斯变量选择方法,根据模型的后验概率指标选择最优模型,并给出融合先验信息的单边变量选择方法。第十章关注模型变量的相对重要性评估问题,在回归模型下讨论重要性评估指标和检验方法,并将其拓展到潜变量回归模型和多重中介模型。第十一章介绍贝叶斯网络的方法、应用与优势,并给出贝叶斯网络结构学习算法,使用融合先验信息的贝叶斯模型选择方法构建贝叶斯网络。
關於作者:
顾昕博士,华东师范大学教育学部教育心理学系副教授。博士毕业于荷兰乌特勒支大学方法与统计系,专业方向为教育与心理统计,主要从事应用贝叶斯统计、统计计算、统计软件开发等研究。主持国家自然科学基金、上海市浦江人才项目等。在《心理学方法》(Psychological Methods)、《结构方程模型》(Structural Equation Modeling)、《多元行为研究》(Multivariate Behavioral Research)等领域内重要学术期刊发表论文20余篇,并在R和JASP软件平台开发多个贝叶斯数据分析软件包。
目錄
前言
第一章 贝叶斯统计推断
第1节 频率统计与贝叶斯统计
第2节 贝叶斯推断的基本概念
第3节 贝叶斯推断的抽样算法
第4节 贝叶斯推断的评估指标
第5节 本章小结
第二章 贝叶斯假设检验
第1节 贝叶斯因子概述
第2节 贝叶斯假设检验的类型
第3节 贝叶斯假设检验的应用
第4节 贝叶斯假设检验的计算
第5节 贝叶斯假设检验的软件
第6节 本章小结
第三章 贝叶斯检验的统计原理与计算方法
第1节 信息假设的一般形式
第2节 信息假设的贝叶斯因子
第3节 贝叶斯因子的计算方法
第4节 先验分布的设定方法
第5节 fractional先验下的贝叶斯因子
第6节 本章小结
第四章 贝叶斯t检验
第1节 t检验的模型与应用
第2节 贝叶斯t检验的方法与应用
第3节 贝叶斯t检验的软件实现
第五章 贝叶斯方差分析
第1节 方差分析的模型与应用
第2节 贝叶斯方差分析的方法与应用
第3节 贝叶斯方差分析的软件实现
第六章 贝叶斯回归分析
第1节 回归分析的模型与应用
第2节 贝叶斯回归分析的方法与应用
第3节 贝叶斯回归分析的软件实现
第七章 因子分析模型的贝叶斯检验
第1节 因子分析的模型与应用
第2节 因子负荷贝叶斯检验的方法与应用
第3节 因子负荷贝叶斯检验的软件实现
第4节 本章小结
第八章 潜变量回归模型的贝叶斯检验
第1节 潜变量回归分析的模型与应用
第2节 贝叶斯潜变量回归分析的方法与应用
第3节 贝叶斯潜变量回归分析的软件实现
第4节 本章小结
第九章 贝叶斯变量选择
第1节 变量选择概述
第2节 贝叶斯变量选择
第3节 基于MCMC的模型搜索方法
第4节 贝叶斯单边变量选择
第5节 本章小结
第十章 贝叶斯相对重要性分析
第1节 相对重要性分析概述
第2节 相对重要性评估指标
第3节 相对重要性的贝叶斯推断
第4节 相对重要性分析的模型应用
第5节 本章小结
第十一章 贝叶斯网络
第1节 贝叶斯网络的方法与应用
第2节 贝叶斯网络的优势
第3节 贝叶斯网络的分析算法
第4节 基于MCMC的模型搜索算法
第5节 贝叶斯网络的分析软件
第6节 贝叶斯网络的实证应用
第7节 本章小结
参考文献
內容試閱
第一章 贝叶斯统计推断
统计推断是数据分析的必要手段,它帮助研究者从数据中提取有意义的信息,并据此做出决策。频率学派和贝叶斯学派是统计学的两大分支,它们在概率解释和先验信息使用上存在差异。长期以来频率统计推断都是社会科学研究的主流方法,但也受到了广泛的批评(Edwards et al., 1963; Mulaik & Steiger, 1997; Wagenmakers, 2007)。随着计算机技术的进步,贝叶斯统计推断方法得到快速发展,许多贝叶斯统计学者致力于推广贝叶斯统计的应用(Wagenmakers et al., 2018a; Van de Schoot et al., 2021; Heck et al., 2023)。但是贝叶斯方法在人文社会科学研究的应用还较少(van de Schoot et al., 2017),可能的原因是相比于频率统计,贝叶斯统计的原理较为复杂、更难理解。本章以较为通俗的语言阐述贝叶斯统计与频率统计的区别、贝叶斯统计的基本概念与计算方法、贝叶斯假设检验的方法与优势等。

第1节 频率统计与贝叶斯统计
大多数社会科学研究者在使用量化分析方法时知道统计学在解决研究问题中所起的重要作用,然而并不是所有的研究者都意识到统计推断背后的概率理论,以及不同理论之间的实际差异。现代统计学分为频率学派和贝叶斯学派,这两个学派的本质差异是概率理论的范式不同。
以罗纳德·费希尔(Ronald Fisher)、耶日·内曼(Jerzy Neyman)、埃贡·皮尔逊(Egon Pearson)为代表人物的频率学派,将概率与多次实验事件发生的频率相联系,将概率看作是频率的极限,以样本数据的频率为基础进行推断。一个典型的例子是抛硬币实验,当我们重复无限次实验后,概率表示为抛硬币正面或反面朝上的比例。频率统计假定总体中的未知参数是固定不变的,只有一个真实的总体参数。
以哈罗德·杰弗里斯(Harold Jefferys)和大卫·林德利(David Lindley)为代表人物的贝叶斯学派,将未知参数看作是随机的,将概率解释为未知参数的不确定性,以概率分布描述未知参数。在观测数据之前,人们对未知参数的认识称为先验信息。贝叶斯统计没有无限重复实验这一假想的概念,研究者使用当次实验数据更新未知参数的先验信息。例如在抛硬币实验中,正面朝上的概率是随机变化的,当观测到某次实验的结果时,正面概率也随之更新。
频率统计通过样本信息构造统计量的抽样分布,推断总体参数。总体参数是确定的值,但它的样本估计可能存在误差,频率统计使用置信区间(confidence interval)表达参数估计的误差范围。贝叶斯统计则将先验信息和样本数据结合,得到后验分布,并以此推断未知参数。总体参数是随机的,样本数据更新了先验信息中随机参数的值。贝叶斯统计使用可信区间(credible interval)表达随机参数的范围,95%可信区间表示总体参数在该区间的概率是95%。表1-1展示了以上讨论的频率统计和贝叶斯统计的区别。

2.1 贝叶斯定理
在贝叶斯统计中,所有的变量和参数都将被赋予一个联合概率分布,构建未知参数在给定观测变量下的条件分布进行推断。条件分布是概率论中的一个重要概念,它描述了在已知某些变量条件下随机变量的分布情况。基本的条件概率公式可写为:
P(B|A)=P(AB)P(A)(1-1)
其中,A和B表示事件或变量,P(B|A)表示在事件A发生的条件下事件B发生的概率,它等于事件A和B同时发生的概率P(AB)与事件A发生的概率P(A)的比值。需要注意的是,P(AB)=P(BA)都表示事件A和B同时发生的概率,且根据式(1-1), P(AB)=P(B|A)P(A)。但是P(A|B)≠P(B|A),两个条件概率的关系可由贝叶斯法则(Bayes rule)表示为:
P(A|B)=P(AB)P(B)=P(B|A)P(A)P(B)(1-2)
在统计模型中,令θ表示模型参数,D表示观测数据,则π(θ|D)代表未知参数在给定观测变量下的条件概率分布。根据式(1-2)该条件概率分布可以写为:
π(θ|D)=f(D|θ)π(θ)m(D)∝f(D|θ)π(θ)(1-3)
在式(1-3)中,f(D|θ)表示数据在模型参数下的条件分布,称为数据的似然函数(likelihood function)或概率密度函数(probability density function);π(θ)表示在收集数据前模型参数的概率分布,称为参数的先验分布(prior distribution);π(θ|D)表示模型参数在观测数据下的条件分布,称为参数的后验分布(posterior distribution);m(D)是与模型参数无关的常数,称为数据的边际似然(marginal likelihood)。省略常数m(D)后,后验分布正比于(∝)先验分布与数据似然函数的乘积。先验分布、似然函数、后验分布是贝叶斯统计中的重要概念,下面将分别介绍。

2.2 先验分布
先验分布(有时简称先验)在贝叶斯统计中起着关键性作用,反映了数据分析前人们对模型参数的认识。先验分布可以有许多不同的分布形式,如正态分布、均匀分布、贝塔分布等,这些分布也可以包含未知的参数。这类参数被称为超参数(hyperparameters),它们并不是模型参数,而是为了表达先验分布的不确定性。例如,考虑一个正态先验N(μ0, σ20),均值μ0和方差σ20为超参数,μ0表示分布可能的集中趋势,σ20表示集中趋势的不确定性。它们描述了先验分布的不确定性。
先验分布可以包含从完全不确定到完全确定的任何程度的先验信息。根据包含先验信息强弱的不同,可将先验大致划分为三类:有信息先验(informative)、弱信息先验(weakly informative)、无信息先验(noninformative)。这些分类并不严格,有时需要研究者的个人判断。例如方差等于1000的正态先验既可以被认为是无信息的,也可以被当作弱信息先验使用。
有信息先验包含了较强的先验信息,这些先验信息由先验分布的超参数表达。先验方差反映了先验信息的强弱,例如在特定模型参数的正态先验中,若设定较小的先验方差,则表明我们较为确定模型参数将在先验均值附近;若考虑更极端的情况,设置先验方差为0,则不需要额外的数据分析,我们完全确信模型参数等于先验均值。当现有信息已经表明对特定模型参数或参数间关系的限制,则研究者可能希望使用有信息的先验,以控制样本数据可能带来的偏差。先验信息可以有不同的信息来源,例如专家组基于特定领域知识对超参数的估计,或是本领域已发表的研究论文或元分析等。
此外,当先验信息不存在时,我们也可以使用样本数据信息设定基于数据的有信息先验(databased priors),即使用极大似然或其他样本统计量估计先验分布中的超参数。但是,由于该方法可能涉及数据的重复使用问题,受到一些统计学者的批评,即数据既用于先验分布的设定,又用于似然函数的计算。为了避免数据二次使用的问题,我们可对样本数据进行划分,只使用小部分设定先验分布超参数,其余部分用于似然函数,该方法将在本书第三章进一步讨论。
无信息先验不包括参数的先验信息,当模型参数的先验知识不存在或是研究者不愿在统计推断中加入主观的先验信息时,可以设定无信息先验。不过在设置先验时,可能无法保证完全不包含任何先验信息,例如统计分析软件常使用平坦先验(flat prior)作为默认先验,通常通过设置极大的先验方差实现,例如N(0, 1002),但平坦先验并不是完全无信息的。另一类常用的无信息先验是Jeffreys先验,它根据参数的Fisher信息量设定,不过Jeffreys先验可能是非正常先验(improper prior),即先验并不满足分布函数的要求,可能导致非正常的后验分布。总的来说,无信息先验的使用非常广泛,它包括不同的类型,研究者在使用无信息先验进行统计推断时要注明所使用的先验类型。
当使用无信息先验分布时,统计推断完全由数据决定,这时研究者可能有的疑问是,贝叶斯与频率统计分析的结果是否变得相同,例如无信息先验下的贝叶斯估计结果是否与频率统计的极大似然估计结果相同。这取决于无信息先验的形式和具体模型参数。在式(1-3)中,当无信息先验π(θ)∝1时,后验分布正比于似然函数。不过贝叶斯方法使用后验分布(似然函数)的均值作为估计值,而极大似然方法考虑使似然函数最大的值作为估计值,两者在似然函数为单峰对称分布时相等。
弱信息先验介于有信息先验和无信息先验之间,这类先验可能对后验分布的影响不大,统计推断仍然是由样本数据决定的。当研究者有一些关于参数的先验知识,但又存在很大的不确定性时,可以使用弱信息先验作为折中的方案。鉴于无信息先验过于发散且可能并不满足分布函数的要求,弱信息先验可能是较好的选择。为此,我们应指定合理的参数空间,利用弱信息先验对参数的取值范围稍作约束。例如设定回归系数的弱信息先验,使得95%的先验分布处于-10到10之间,以避免过大的取值。
此外,研究者也可以设置具有混合信息的先验分布,贝叶斯变量选择常用的spike and slab先验是一类典型的混合先验分布。spike and slab先验考虑回归系数在两种情形下的混合先验,当备选模型不包含某个变量时,对该变量回归系数使用有信息先验,将回归系数的分布约束在0附近;当预期模型包含某个变量时,对该变量回归系数使用弱信息先验或无信息先验,回归系数的分布较为分散。关于spike and slab先验的详细介绍和讨论,可见本书第九章内容。
最后想要说明的是,当先验分布与数据似然不一致时,并不一定是先验分布的问题,也可能是数据的抽样误差或模型的错误设定问题,又或者两者都没有问题,数据分析结果将会更新研究者对参数先验的认识。

2.3 似然函数
数据的似然函数是频率统计和贝叶斯统计推断共有的概念,它表示数据在当前模型和参数下的可能性。在贝叶斯统计中,似然函数涵盖了下列信息:统计模型、观测数据、参数取值。似然函数的形式由统计模型决定,大小由观测数据和参数的拟合程度决定。例如正态线性模型的数据似然为正态密度的乘积,数据与给定模型参数的拟合度越高,其似然越大。
在一些较为简单的统计模型下,数据的似然函数也较为简单,可以直接设定。例如,考虑抛硬币实验中正面朝上的概率θ。在实验中共抛n次硬币,第i次的结果记为yi, yi=1表示正面朝上,yi=0表示反面朝上。正面朝上的总次数记为y=∑ni=1yi, y服从二项分布:
f(y|θ)=Cynθy(1-θ)n-y(1-4)
其中Cyn表示从n中选y个的组合次数。若实验结果为抛10次硬币有6次朝上,则似然函数为:
f(y|θ)=C610θ6(1-θ)4(1-5)
这里给定θ即可算出似然值,如θ=0.5,则f(y|θ)=0.205。
在实践中,数据的分布或数据来源的模型可能未知,研究者可能出于习惯而轻易地选择某个分布。例如正态分布是社会科学研究使用最多最广泛的数据分布,但是某些变量数据并不满足正态分布的形态,这可能导致数据似然的偏差,进而影响统计推断。在统计推断前诊断数据的分布函数,或在统计推断后对结果进行稳健性分析(robustness),可以在一定程度上避免分布或似然函数的选择偏差问题。

2.4 后验分布
后验分布综合了先验分布和似然函数的信息,是贝叶斯统计推断的基础。后验分布的分布函数由先验分布和似然函数决定,若参数的先验分布与似然函数“相匹配”,则后验分布与先验分布具有相同的分布函数,这类先验称为共轭先验(conjugate prior)。例如,若使用正态共轭先验,则后验分布也服从正态分布,后验分布的均值和方差融入了数据的信息,与先验分布不同。然而,在很多情况下参数的后验分布没有显式表达式,即无法直接计算后验概率密度,这对贝叶斯统计推断造成了一些困难,也是贝叶斯推断在过去很长一段时间没有成为统计分析主流方法的原因之一。不过,随着马尔可夫链蒙特卡洛(Markov chain Monte Carlo, MCMC)方法的发展以及计算机技术的支持,我们可以抽取未知参数的后验样本,基于后验样本可估计后验分布的特征,如后验均值可由后验样本平均值估计。第3节将进一步介绍MCMC算法。
后验分布反映了数据对先验知识的更新,更新后得到的后验分布也可以当作是下一次实验数据分析的先验分布,与新的数据似然结合,得到新的后验分布,这一过程称为贝叶斯更新(Bayesian update)。贝叶斯更新根据新获得的数据不断更新对未知参数的信念,动态调整模型参数的估计和检验。此外,贝叶斯更新自然地量化了推断的不确定性,随着数据信息的不断加入,我们关于模型参数的知识也在不断增多,参数的不确定性逐渐降低,参数的后验方差也随之减小。随着更多信息的加入,我们对未知参数的理解会越来越接近真实情况。

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 台灣用户 | 香港/海外用户
megBook.com.tw
Copyright (C) 2013 - 2024 (香港)大書城有限公司 All Rights Reserved.