序前言第1章概率思想:构建理论基础11.1理论基石:条件概率、独立性与贝叶斯11.1.1从概率到条件概率11.1.2条件概率的具体描述21.1.3条件概率的表达式分析31.1.4两个事件的独立性41.1.5从条件概率到全概率公式51.1.6聚焦贝叶斯公式61.1.7本质内涵:由因到果,由果推因71.2事件的关系:深入理解独立性81.2.1重新梳理两个事件的独立性81.2.2不相容与独立性81.2.3条件独立91.2.4独立与条件独立111.2.5独立重复实验11第2章变量分布:描述随机世界132.1离散型随机变量:分布与数字特征132.1.1从事件到随机变量132.1.2离散型随机变量及其要素142.1.3离散型随机变量的分布列152.1.4分布列和概率质量函数162.1.5二项分布及二项随机变量172.1.6几何分布及几何随机变量212.1.7泊松分布及泊松随机变量242.2连续型随机变量:分布与数字特征272.2.1概率密度函数272.2.2连续型随机变量区间概率的计算292.2.3连续型随机变量的期望与方差292.2.4正态分布及正态随机变量302.2.5指数分布及指数随机变量332.2.6均匀分布及其随机变量352.3多元随机变量(上):联合、边缘与条件382.3.1实验中引入多个随机变量382.3.2联合分布列382.3.3边缘分布列392.3.4条件分布列402.3.5集中梳理核心的概率理论442.4多元随机变量(下):独立与相关462.4.1随机变量与事件的独立性462.4.2随机变量之间的独立性472.4.3独立性示例482.4.4条件独立的概念482.4.5独立随机变量的期望和方差502.4.6随机变量的相关性分析及量化方法522.4.7协方差及协方差矩阵522.4.8相关系数的概念542.5多元随机变量实践:聚焦多元正态分布552.5.1再谈相关性:基于二元标准正态分布552.5.2二元一般正态分布572.5.3聚焦相关系数602.5.4独立和相关性的关系642.6多元高斯分布:参数特征和几何意义662.6.1从一元分布到多元分布662.6.2多元高斯分布的参数形式672.6.3二元高斯分布的具体示例682.6.4多元高斯分布的几何特征712.6.5二元高斯分布几何特征实例分析74第3章参数估计:探寻最大可能773.1极限思维:大数定律与中心极限定理773.1.1一个背景话题773.1.2大数定律783.1.3大数定律的模拟803.1.4中心极限定理833.1.5中心极限定理的工程意义843.1.6中心极限定理的模拟853.1.7大数定律的应用:蒙特卡罗方法863.2推断未知:统计推断的基本框架893.2.1进入统计学893.2.2统计推断的例子903.2.3统计推断中的一些重要概念913.2.4估计量的偏差与无偏估计923.2.5总体均值的估计933.2.6总体方差的估计953.3极大似然估计1003.3.1极大似然估计法的引例1003.3.2似然函数的由来1023.3.3极大似然估计的思想1033.3.4极大似然估计值的计算1053.3.5简单极大似然估计案例1063.3.6高斯分布参数的极大似然估计1073.4含有隐变量的参数估计问题1103.4.1参数估计问题的回顾1103.4.2新情况:场景中含有隐变量1113.4.3迭代法:解决含有隐变量情形的抛硬币问题1123.4.4代码实验1153.5概率渐增:EM算法的合理性1183.5.1EM算法的背景介绍1193.5.2先抛出EM算法的迭代公式1193.5.3EM算法为什么是有效的1203.6探索EM公式的底层逻辑与由来1233.6.1EM公式中的E步和M步1243.6.2剖析EM算法的由来1243.7探索高斯混合模型:EM 迭代实践1273.7.1高斯混合模型的引入1283.7.2从混合模型的角度看内部机理1293.7.3高斯混合模型的参数估计1313.8高斯混合模型的参数求解1323.8.1利用 EM 迭代模型参数的思路1323.8.2参数估计示例1363.8.3高斯混合模型的应用场景139第4章随机过程:聚焦动态特征1454.1由静向动:随机过程导引1454.1.1随机过程场景举例1:博彩1464.1.2随机过程场景举例2:股价的变化1504.1.3随机过程场景举例3:股价变化过程的展现1524.1.4两类重要的随机过程概述1544.2状态转移:初识马尔可夫链1554.2.1马尔可夫链三要素1554.2.2马尔可夫性:灵魂特征1564.2.3转移概率和状态转移矩阵1574.2.4马尔可夫链性质的总结1584.2.5一步到达与多步转移的含义1594.2.6多步转移与矩阵乘法1604.2.7路径概率问题1634.3变与不变:马尔可夫链的极限与稳态1644.3.1极限与初始状态无关的情况1644.3.2极限依赖于初始状态的情况1654.3.3