新書推薦:
《
希腊人(伊恩·莫里斯文明史系列)
》
售價:NT$
845.0
《
亚马逊六页纸 如何高效开会、写作、完成工作
》
售價:NT$
349.0
《
世界巨变:严复的角色(王中江著作系列)
》
售價:NT$
500.0
《
塔西佗(全二册)(二十世纪人文译丛)
》
售價:NT$
1800.0
《
(棱镜精装人文译丛)思想的假死
》
售價:NT$
290.0
《
当代精神分析新论
》
售價:NT$
430.0
《
宋初三先生集(中国思想史资料丛刊)
》
售價:NT$
990.0
《
棕榈油的全球史 : 从奴隶船到购物篮
》
售價:NT$
440.0
|
內容簡介: |
大数据时代,人们在生产生活中收集了大量的高维复杂数据。在针对这些数据进行统计分析的过程中,构建一个简单高效的模型至关重要。一个简单的稀疏模型不仅具有很好的解释性,常常也具有很高的性能。本书的主要工作就是针对高维数据的稀疏统计建模研究。
|
關於作者: |
首都经济贸易大学副教授,2012年博士毕业于东北师范大学,2013-2015年美国北卡罗莱纳大学教堂山分校博士后,2016年加入首都经济贸易大学,主要研究领域:高维数据分析、机器学习。现主持国家自然科学基金青年项目1项,国家统计局科研项目1项。研究成果大都发表在国际顶级和知名的统计学期刊上。
|
內容試閱:
|
大数据时代,人们在生产生活中收集了大量的高维复杂数据。在针对这些数据进行统计分析的过程中,构建一个简单高效的模型至关重要。一个简单的稀疏模型不仅具有很好的解释性,常常也具有很高的性能。本书的主要工作就是针对高维数据的稀疏统计建模研究。
现今,针对线性模型的稀疏性研究已经很成熟。因此,本书第一章首先概述了线性模型的稀疏性方法。针对多变量回归模型的稀疏性研究也有很多,然而这些研究大多只是针对预测变量的稀疏性,关于多维响应变量的稀疏性研究并不多见。本书的第二、三章针对多变量线性回归的稀疏性做了一些研究,这里的稀疏性不仅仅针对预测变量,同时也针对多维的响应变量。我们首先研究了多变量线性回归和典型相关分析的关系,然后通过研究典型载荷的稀疏性来研究多变量线性回归模型的稀疏性。
在第四章,我们针对超高维朴素贝叶斯分类器,提出了一个全新的统计量来研究它的统计显著性,理论结果保证我们所提统计量的渐近正态性。同时我们的数值模拟研究也佐证了我们的理论发现。此外我们还尝试了利用我们所提的检验统计量通过假设检验的方法对朴素贝叶斯分类器进行变量选择,从而可以得到一个稀疏的朴素贝叶斯分类器,在保证分类精度的同时,使分类器更加具有解释性。
第五章研究了协方差矩阵的估计问题。很多数据分析的统计方法都需要一个好的协方差矩阵或协方差逆阵的估计。传统上,用样本协方差阵估计协方差矩阵是一个不错的选择。然而高维情形下,样本协方差矩阵不再是正定的,但是正定性在大部分多变量统计分析方法中是被要求的。所以非常有必要对协方差矩阵或者其逆阵寻求一个好的估计。本章提出了一种新颖的假设检验方法来确定协方差逆阵的阶数。理论结果表明我们所提出的检验统计量在原假设下是渐近标准正态的,而且数值模拟结果能够很好地佐证我们的理论发现。
本书是作者针对高维数据分析中的稀疏建模问题多年研究的全面总结,对该领域的研究提供了一些具有创新性的方法。本书适合数学、统计学、数据挖掘等相关专业的高年级本科生、研究生及相关研究人员阅读。
本书的出版得到了首都经济贸易大学出版基金和国家自然科学基金青年项目(编号:11601349)的资助。感谢首都经济贸易大学出版社的编辑为本书付出的劳动,他们的认真审稿是本书出版的保证。最后,感谢我的家人,编写本书离不开他们的支持。
由于作者水平所限,书中难免有不足之处,敬请读者指正。
另外,本书正文涉及大量公式,故使用Latex专业软件进行排版,可能一定程度上影响到版面的美观,还请广大读者海涵。
|
|