新書推薦:
《
形似神异:什么是中日传统政治文化的结构性差异
》
售價:NT$
254.0
《
养育不好惹的小孩
》
售價:NT$
352.0
《
加加美高浩的手部绘画技法 II
》
售價:NT$
407.0
《
卡特里娜(“同一颗星球”丛书)
》
售價:NT$
398.0
《
伟大民族:从路易十五到拿破仑的法国史(方尖碑)
》
售價:NT$
857.0
《
古今“书画同源”论辨——中国书法与中国绘画的关系问题兼中国画笔墨研究
》
售價:NT$
602.0
《
《日本文学史序说》讲演录
》
售價:NT$
332.0
《
无尽的海洋:美国海事探险与大众文化(1815—1860)
》
售價:NT$
454.0
編輯推薦:
本书是著名统计学家James E. Gentle撰写的金融数据统计分析教材,结合金融数据的特点,把统计方法与R软件实现紧密联系,自成体系,即有对统计学、计量经济方法原理的介绍,又有各种具体的应用实例、程序代码,还列出了供读者深入学习的参考文献和注释说明。因此,不管是金融数据统计分析的初学者,还是有一定统计和计量分析基础的读者,都可以从阅读和学习本书中获益良多。
內容簡介:
本书涵盖了使用统计分析和数据科学方法对财务数据进行建模和分析的方法。第1章概述了金融市场,描述了市场运作并使用探索性数据分析来说明金融数据的性质。第2章介绍了探索性数据分析的方法,尤其是图形方法,并在实际财务数据上进行了说明。第3章介绍了可用于财务分析的概率分布,特别是重尾分布,并介绍了计算机模拟财务数据的方法。第4章介绍了统计推断的基本方法,尤其是在分析中使用线性模型,第5章介绍了时间序列的方法,其中特别强调了适用于财务数据分析的模型和方法。附录还描述了如何使用R从互联网获取当前财务数据。
關於作者:
詹姆斯·E. 金特尔(James E. Gentle)曾任乔治·梅森大学计算统计学教授,也是美国统计协会和美国科学促进会等多个学术机构的成员。他曾担任The American Statistician(1989—1990)的副主编,以及多个计算统计学期刊的编辑,目前担任Communications in Statistics的资深编辑。他主要从事计算统计、模拟、计算金融等方面的研究,已经出版了多本统计相关书籍。
目錄 :
目 录
译者序
前言
第1章 金融数据的性质1
1.1 金融时间序列3
1.1.1 自相关系数5
1.1.2 平稳性5
1.1.3 时间尺度和数据加总6
1.2 金融资产和市场9
1.2.1 市场和监管机构11
1.2.2 利息14
1.2.3 资产收益率20
1.2.4 股票价格、公平市场价值23
1.2.5 股票分割、股利和资本收益32
1.2.6 指数和“市场”34
1.2.7 衍生资产43
1.2.8 空头头寸45
1.2.9 资产的投资组合:分散和
对冲46
1.3 收益率的频率分布53
1.3.1 位置和尺度55
1.3.2 偏度56
1.3.3 峰度57
1.3.4 多元数据57
1.3.5 正态分布61
1.3.6 q-q图64
1.3.7 异常值66
1.3.8 其他统计度量方法66
1.4 波动率69
1.4.1 收益率的时间序列69
1.4.2 度量波动率:历史波动率和隐含
波动率72
1.4.3 波动率指数:VIX76
1.4.4 隐含波动率曲线78
1.4.5 风险评估与管理79
1.5 市场动态83
1.6 关于金融数据的典型事实89
注释和深入阅读90
练习和复习题92
附录A1:使用R获取和分析金融
数据95
第2章 金融数据的探索性分析141
2.1 数据缩减142
2.1.1 简单概括统计量142
2.1.2 数据中心化和标准化143
2.1.3 多元数据的简单概括统计量143
2.1.4 变换143
2.1.5 识别异常观察值145
2.2 经验累积分布函数145
2.3 概率密度的非参数估计149
2.3.1 分箱数据149
2.3.2 核密度估计150
2.3.3 多元核密度估计量152
2.4 探索性分析中的图形法152
2.4.1 时间序列图153
2.4.2 直方图153
2.4.3 箱线图154
2.4.4 密度图155
2.4.5 二元数据156
2.4.6 q-q图157
2.4.7 R中的图形161
注释和深入阅读165
练习165
第3章 可观察事件模型使用的概率
分布169
3.1 随机变量和概率分布170
3.1.1 离散随机变量171
3.1.2 连续随机变量174
3.1.3 随机变量的线性组合:期望和
分位数177
3.1.4 生存函数和风险函数178
3.1.5 多元分布178
3.1.6 多元分布中变量之间的
相关性180
3.1.7 连接函数183
3.1.8 多元随机变量的变换185
3.1.9 顺序统计量的分布186
3.1.10 渐近分布:中心极限定理187
3.1.11 概率分布的尾部189
3.1.12 随机变量序列:随机过程192
3.1.13 股票价格的扩散过程与期权
定价193
3.2 一些有用的概率分布195
3.2.1 离散分布196
3.2.2 连续分布197
3.2.3 多元分布204
3.2.4 对建模有用的一般分布族205
3.2.5 构造多元分布215
3.2.6 数据生成过程建模216
3.2.7 概率分布的R函数216
3.3 随机变量的模拟219
3.3.1 均匀随机数219
3.3.2 生成非均匀随机数220
3.3.3 在R中模拟数据223
注释和深入阅读225
练习226
第4章 统计模型与推断方法232
4.1 统计模型232
4.1.1 拟合统计模型235
4.1.2 变差的度量和分解236
4.1.3 线性模型237
4.1.4 非线性方差稳定化变换239
4.1.5 参数模型和非参数模型239
4.1.6 贝叶斯模型240
4.1.7 时间序列模型240
4.2 统计建模的标准与方法240
4.2.1 估计量及其性质240
4.2.2 统计建模方法242
4.3 统计建模的优化:最小二乘法和
最大似然估计法248
4.3.1 一般优化问题248
4.3.2 最小二乘法252
4.3.3 最大似然法258
4.3.4 处理优化问题的R函数260
4.4 统计推断261
4.4.1 置信区间263
4.4.2 检验统计假设265
4.4.3 预测268
4.4.4 贝叶斯模型推断268
4.4.5 再抽样方法:自助法273
4.4.6 稳健统计方法275
4.4.7 尾部指数的估计277
4.4.8 风险值和预期损失的估计280
4.5 描述变量之间关系的模型283
4.5.1 主成分284
4.5.2 回归模型287
4.5.3 线性回归模型290
4.5.4 线性回归模型:回归变量293
4.5.5 线性回归模型:单个观察值和
残差297
4.5.6 线性回归模型:例子303
4.5.7 非线性模型313
4.5.8 在R中指定模型317
4.6 评估模型的充分性318
4.6.1 拟合优度检验;正态性检验318
內容試閱 :
前 言
本书可供对金融数据分析有兴趣且具有一定数学和统计学基础知识的读者使用。虽然本书不要求读者有金融知识基础,但是具有金融交易经验和使用过金融数据的读者可以更容易地理解本书讨论的内容。本书也为具有一定金融知识基础的读者提供了理解金融数据、发现金融数据的某些性质的新视角。金融数据具有许多有趣的性质,这些性质对统计学家提出了挑战,因此,统计学家也热衷于研究和分析金融数据。
本质上,许多著作讨论了同样的内容。与大多数学术著作的不同之处在于,本书讨论的内容正是实际交易者热衷于讨论的金融数据的那些迷人性质。本书的重点在于金融数据。尽管本书网站提供的分析实例所使用的数据都是一些过时的数据,但是本书也为读者提供了获取当前实时金融数据并进行建模和分析的方法。
虽然更好地理解金融数据可以提高投资者在金融市场获利的可能性,但是本书并不为投资者提供投资建议。
本书以数据驱动组织和安排讨论的内容。首先,本书对产生金融数据的数据生成过程进行了一般性描述。第1章使用了许多数据集进行探索性统计分析,几乎没有对统计方法本身进行讨论,主要讲述了如何进行探索性统计分析,或者如何得到金融数据。分析的重点在于各种金融资产和市场的金融数据的生成过程,以及它们的运行方式。
虽然第1章篇幅似乎非常大,但是我认为对于金融数据生成过程有一个一般性认识非常重要。金融数据分析师不仅要知道分析使用的相关统计方法,而且必须要对金融市场有所了解,例如,要了解成熟公司债券和国债的区别,要明白短期指数ETF的收益率和VIX呈正相关的原因。
读者在阅读第1章并查看各种数据集的图表和其他分析时,可能会问:“我从哪里可以下载这些数据或者类似数据?我如何进行类似的分析?”例如:“我如何得到SPY ETF的日超额收益率?比如在市场模型中使用的数据。”
第1章附录A1讨论了使用计算机从网络上下载实际实时金融数据(例如,调整后的股票收盘价和国债利率)的方法,以及如何对这些数据进行修改、绘图和分析。
本书使用R软件。除非数据以可以使用的形式下载和保存,否则不能做进一步的分析。在附录练习中,要求读者使用其他数据集进行类似的分析。
在随后的章节和相关练习中,重点对金融数据的分析方法进行讨论。尽管为了说明方便,使用了一些特定的数据集,但是读者也可以使用其他金融数据进行类似的探索性分析。
金融数据
本书是一本关于金融数据及其分析方法的书。统计学家沉溺于有趣的数据。金融数据的魅力无穷,并不遵从简单的模型。金融数据不可预测,也不受物理法则支配。金融数据是“大数据”。也许我们最好从那些可以大量免费获得的金融数据开始讨论。
现在获得金融数据和进入金融市场的方法,与50多年前我刚进入金融市场时相比,发生了非常大的变化。那时市场存在非常大的交易摩擦,佣金也非常高。对于一般的投资者和交易者来说,几乎不存在期权市场,也没有上市期权(1973年才出现上市期权),对冲机会非常有限。那时也没有ETF市场(ETF最早的形式在1989年才出现,于一年后退市;后来,1993年推出第一个ETF“标普500存托凭证(Spider或SPDR)”)。多数共同基金都进行“主动管理”,收费很高。
这真是一次有趣的回顾。美国金融市场经历了20世纪60年代的繁荣期,随后处于长期的萧条期(除了1975年的强劲反弹外)。1968年道琼斯指数首次触及1 000点后,开始下跌,以943点收盘。尽管道琼斯指数有两年(分别为1972年和1976年)收盘价超过1 000点,但是直到1982年,其收盘价才稳定在1 000点以上。从1999年开始,除了两次暴跌外,道琼斯指数都在万点以上。20世纪80年代和90年代,道琼斯指数走势为一个方向:向上!由于“互联网泡沫崩溃”造成了严重的影响,道琼斯指数跌回万点以下。不只是互联网公司,几乎所有公司股价都下跌。随后,重回涨势,直到金融危机引起暴跌,道琼斯指数再次跌回万点以下。2018年初,道琼斯指数处于历史上低波动时期,突破26 000点,随后两年内,达到29 000点。没有人理解这样的波动性,但是许多交易者(特别是“精明的投资者”)都通过交易波动率赚了钱,直到他们的交易突然亏了很多钱。同样,没有人弄明白2018年圣诞前夜的暴跌(尽管许多分析师做了“解释”),但是那些冒险抄底的人在新的一年大赚了一笔。
作为统计学家,我对金融数据产生兴趣比我进入金融市场更晚,我的兴趣也不是来自我的交易。我为自己投资组合所做的勉强能算得上“正式”的分析,就是每个星期建立市场模型(式(1.35)),为此我手工输入数据,直到20世纪90年代某个时候使用Fortran;随后在2000年左右我使用电子表格程序;后来,我使用R。我再也不用手工输入数据了。直到几年前,我还是直接使用R,但是,现在我经常使用我编写的一个简单的Shiny应用来输入时间范围等。我使用quantmod直接从雅虎金融获取大多数价格数据,但是,期权数据还存在很多问题。数据生成过程本身就会引起人们的兴趣,观察到它很开心,这也是我进行金融数据分析的原因。
和其他人一样,我曾经相信金融数据生成过程是理性的,但是和其他交易者一样,我现在知道该过程并不是理性的。这恰好使得我对金融数据分析更有兴趣。
各章概要
第1章是关于金融数据的探索性分析(EDA)。与其他章相比,第1章的定量分析稍弱。第1章以对一般的“典型事实”的总结结尾,使用探索性分析不能发现这些典型事实;以对金融数据十分简短而轻松的概述开始,随着后面各节内容的展开,引入的术语和讨论的主题也逐渐增加。
我认为作为数据分析师,除了要了解数据的一般特征,至少还要对数据生成过程有基本的了解,第1章提供了这些背景知识。第1章引入了与金融数据和产生金融数据的市场有关的术语和概念。(在第1章内容的其他介绍中,我尽量介绍一些金融术语,这些术语大家可能在CNBC日常节目或其他媒体的财经报道中听到过。)在后面的例子和练习中,当我使用来自穆迪成熟的Baa级公司债券数据时,希望读者在此之前了解穆迪、成熟以及Baa级公司债券的含义,不希望再解释这些术语的含义。第1章给出了这些术语的定义或者进行了解释。
第1章的练习基本上都是概念性的,计算很少,这与第1章附录和后面各章的练习完全不同。
读者可以在本书网站上找到第1章中大多数图和计算的R代码。第1章附录讨论了R代码,并介绍了如何得到这些数据。我在此增加这个附录的主要原因是后面各章会大量地使用R,而对R本身不再进行说明,那些章的许多练习也要使用R,并且要求通过网络获得真实的实时金融数据。第1章附录练习包括如何使用R,一些练习仅仅是重复第1章的实例。
与本书网站上过时的数据或某些来历不明的专门数据集不同,我希望读者获得真实的实时数据,并进行分析。
后面各章是关于统计方法的。这些方法也能应用到其他领域,但是人们提出这些方法的动机来自金融应用领域。
第2章再回到第1章的探索性数据分析,讨论了探索性数据所使用的一般的非参数方法和图示方法。
第3章包括随机变量和概率分布。尽管第3章没有进行统计分析,但是这些数学概念是所有统计推断的基础。这里特别强调了与金融数据有关的分布问题,例如厚尾分布和尾部性质。
第3章也描述了计算机生成随机数的方法,以及用这些随机数模拟概率分布的实现值。3.3节讨论了模拟的一些基本思想。随后的各章和练习中使用了蒙特卡罗方法。
第4章讨论了概率分布在统计推断中的作用。我们从统计模型和如何使用数据拟合这些模型开始讨论。拟合模型的标准涉及某种形式的最优(“最小”二乘、“最大”似然等),因此,第4章简单介绍了一般的优化方法。这一章还讨论了统计推断的基本概念:估计、假设检验和预测,也介绍了一些具体的方法(比如自助法的使用方法)以及相关的应用(如VaR的估计等),还分析了变量之间的关系模型,特别是回归模型,并举例进行了说明。
考虑到最近一些统计学家对“显著”一词的使用持反对意见,这里我不得不指出我大量地使用了这个术语,参见第4章注释。
第5章简要介绍了标准的时间序列模型,并且分析了实践中时间序列模型使用效果较差的原因;讨论了能够解释某种异方差性(GARCH)的时间序列模型,也给出了在自回归模型中识别和分析单位根的步骤。第5章还讨论了向量自回归过程这个主题,特别是多个序列的协整模型。
本书没有讨论固定资产(比如债券)分析,以及使用连续时间扩散模型分析衍生资产定价问题等主题。然而,这些主题偶尔也会提到。对于本书所讨论的任何主题,许多其他的细节也值得深入讨论。某些内容在“注释和深入阅读”中间接提到。
当然,由于篇幅所限,本书没有讨论许多更小的主题,比如流数据处理、高频交易和由此产生的市场动态等。
软件和程序
本书使用的软件是R。尽管我在本书中经常提到R,也给出了许多R代码的例子,许多练习也要求使用R,但是,读者也可以使用其他软件包。
对使用R有兴趣的读者,即使没有使用过R,也可以快速地掌握足够的R知识来绘制一些简单图并进行简单的分析。学习R最好的方法就是学一些代码片段,执行代码,然后稍微改动一下,看看这些改动的影响。第1章附录给出了几个R代码的例子,在本书网站上可以找到第1章所有图和计算代码。
如果读者的目的是能够使用R代码处理一些具体的工作,类似于绘图,那么读者可以很容易地找到处理这样任务的R代码,然后使用这些代码,在必要时进行修正(这不是“编程”)。
R是一个丰富的编程语言。如果读者的目的是使用R编程,我常说的一句话就是“学习编程的方法就是马上开始进行编程”。这就是我学习编程的方法,我还能给出什么建议呢?这句话也可以应用到其他事情上:学习打字的方法就是马上找一个键盘,看看各个字母的位置开始学习打字;学习游泳的方法就是马上找一个不太深的水池开始学习游泳。
尽管我曾经用许多语言编程,从Ada到APL,但是,我认为能够使用所有语言进行编程,却不能精通任何一种语言,这种情况是不合适的。我宁愿只掌握一种语言(或者三种语言)。
前提要求
本书对读者基础知识的要求很低。显然,本书要求读者掌握包括矩阵代数的数学基础。有几本书可以提供这些基础知识。偶尔我会参考我写的关于这些主题的书。由于我知道这些内容在这些书中的位置,所以这样处理是最合适的,当然这不是必要的。
本书也要求读者具有统计学或数据分析方面的基础,以及一定的科学计算能力。我要求读者掌握概率论的基本概念,比如随机变量、分布、期望、方差和相关等。对于更高深的概念和理论,我建议读者参考我的著作Theory of Statistics,参见:mason.gmu.edu/~jgentle/books/MathStat.pdf。
我在本书中偶尔会提及一些非常高深的数学主题,即使读者不了解这些主题,也能够理解本书相关的内容。但是,如果读者熟悉这些主题,那么提及的这些主题就应该添加到读者所掌握的内容之中。
本书不要求读者具有金融学的基础知识,但如果读者具有金融背景,就可以迅速地理解本书所讨论的内容。
我在几个地方提到了编程,特别是使用R编程。一些练习需要简单编程,但是,大多数练习只要求使用计算器即可,并不涉及编程。
例子和练习的注释
本书的例子使用了实际金融数据,也要求读者能够获取实际数据并使用这些数据做练习。读者能够从本书网站获取过时的数据集。数据的时期通常是21世纪的前十几年。
本书也给出了从网络这个宝库中获取真实数据和感兴趣数据的方法。我鼓励使用本书的读者或教师把练习替换为“2017年”“2018年”或读者更感兴趣的任何其他过去的时间段。
除了真实数据,本书还讨论了根据各种模型模拟人工数据的方法,以及如何使用模拟数据理解和比较各种统计方法。一些练习要求读者在各种情况下使用模拟数据评价一种统计方法的优劣。
本书还讨论了数据的准备和整理。一些练习要求读者对数据进行一定程度的前期处理。
每章练习的排序和主题的顺序不是相互对应的。尽管每个练习的标题给出了该练习的主题,但是我也鼓励读者在做练习前阅读或略读整章的内容。各个练习的难度和篇幅存在非常大的差别。一些练习内容非常多,涉及的面非常广。
补充材料
本书的网址为mason.gmu.edu/~jgentle/books/StatFinBk/。网站上的文件包括部分练习的解答提示、评论以及答案。网站补充材料也包括本书例子所使用的R代码。尽管我不断强调真实鲜活的数据,但是网站也有一些过去的金融数据。
网站上还提供了本书勘误表,该表随着本书的错误被发现而及时更新。
本书网站上还有完整的习题解答,只有教师在核对身份信息后,才能获得该解答,网址为www.crcpress.com。
因为资产价格会随时调整,所以读者根据自己获取的数据计算得到的结果和本书中的结果可能稍有不同。
致谢
首先,我要感谢John Chambers、Robert Gentleman和Ross Ihaka在R语言上所做的基础性工作。感谢R代码团队和许多程序包的开发者,以及这些程序包的维护者,他们的工作使得R更便于使用。
Jim Shine阅读了本书的大部分内容,还给出了本书许多练习的解答。感谢Jim提供了许多有帮助的意见。
感谢本书的匿名审稿者,他们提了许多有帮助的意见和建议。
感谢本书的编辑John Kimmel,他也是我以前几本书的编辑。和John再次合作,我感到非常愉快。
感谢我的妻子María所做的一切。我把本书献给她。
整本书的打字输入、编程等工作都是我一个人完成的,欢迎读者指出本书的错误并提出改进的建议,对此,我将非常感激。
詹姆斯·E.金特尔
2019年12月27日