新書推薦:
《
心智的构建:大脑如何创造我们的精神世界
》
售價:NT$
352.0
《
美国小史(揭秘“美国何以成为美国”,理解美国的经典入门读物)
》
售價:NT$
352.0
《
中国古代北方民族史丛书——东胡史
》
售價:NT$
576.0
《
巨人传(插图珍藏本)
》
售價:NT$
3289.0
《
地下(村上春树沙林毒气事件的长篇纪实)
》
售價:NT$
332.0
《
偿还:债务与财富的阴暗面
》
售價:NT$
347.0
《
清华大学藏战国竹简校释(壹):《命训》诸篇
》
售價:NT$
408.0
《
封建社会农民战争问题导论(光启文库)
》
售價:NT$
296.0
編輯推薦:
作为通识教育,人人都该懂点儿统计学!通俗、易懂、实用的统计学,助你培养统计思维!
內容簡介:
统计学的思想和各种统计数据对政府、社会乃至我们的工作和日常生活都有着不可忽视的影响,甚至超乎你的想象。通过阅读本书,你将会对我们生活的这个世界有更完整、更清晰的认识。
这不是一本讲述干巴巴的统计学理论的书,它主要介绍统计学概念的应用及其对日常生活、公共政策和许多其他领域的影响。书中没有烦琐的公式、图表和计算,你只要看得懂而且会解简单的方程式就足够了。本书着重于启发思考,这比生搬硬套地使用数学公式更有助于训练看问题的视角和解决问题的思维。
本书把统计学概念分成四个部分来呈现:数据的生产、整合数据、机会与概率、统计推断。
本书一点儿也不乏味,恰恰相反,它是那样生动有趣,深入浅出地把统计学的概念和分析方法呈现在你面前。通过一个个具体的案例、简单的练习和知识普及,能让你在阅读过程中不知不觉地增长统计学知识,提高分析和解决问题的水平。
这是一本能给你带来阅读乐趣的书,也是一本能让你更睿智的书。
關於作者:
戴维穆尔(David S. Moore),就职于美国普渡大学,曾担任美国统计学会主席。他获得了普林斯顿大学的数学学士学位和康奈尔大学的数学博士学位,著有多篇统计理论方面的学术论文。他还是美国统计学会、数学统计研究所、国际统计学研究所会员,也曾担任美国国家自然基金会统计学和概率项目主任、国际统计学教育协会主席,并获得美国数学协会杰出教育奖。
威廉诺茨(William I. Notz),就职于美国俄亥俄大学,获得了约翰霍普金斯大学的物理学学士学位和康奈尔大学的数学博士学位。他一开始就职于普渡大学统计学系。在那里,他和戴维穆尔一起讲授统计学课程,对统计学教育产生了兴趣。他的研究领域是实验设计和计算机实验。他是美国统计学会和国际统计学研究所会员。
郑磊,博士,本科就读于兰州大学数学系,后获得荷兰玛斯特里赫特管理学院MBA学位和南开大学经济学博士学位。工作经历涵盖制造业、咨询和智库,现在深圳和香港从事经济研究和投资银行工作,出版4本专著,翻译近20本引进版书籍。
目錄 :
致读者 III
序 言 了解统计学 VII
第1部分 数据的生产
第1章 数据从哪里来 003
第2章 好样本和坏样本 023
第3章 样本可以告诉我们什么 042
第4章 真实世界中的抽样调查 066
第5章 好实验与坏实验 098
第6章 现实世界中的实验 120
第7章 数据伦理 145
第8章 度量 167
第9章 统计数字会说谎 194
第1 部分 内容回顾 153
第2部分 整合数据
第10章 好图表与坏图表 227
第11章 用图呈现数值变量的分布 254
第12章 用数字描述分布 279
第13章 正态分布 309
第14章 描述相关关系:散点图和相关系数 333
第15 章 描述相关关系:回归、预测与因果关系 001
第16 章 居民消费价格指数和政府统计数据 032
第2 部分 内容回顾 056
第3 部分 机会与概率
第17 章 思考随机事件 073
第18 章 概率模型 096
第19 章 统计模拟 114
第20 章 赌场的生意经:期望值 135
第3 部分 内容回顾 153
第4 部分 统计推断
第21 章 什么是置信区间 165
第22 章 什么是显著性检验 193
第23 章 统计推断的滥用 220
第24 章 双向表与卡方检验 240
第4 部分 内容回顾 266
附 录 279
內容試閱 :
统计学是关于数据的学问。数据就是数字,但又不仅仅是数字,数据是有上下文联系的数字。比如,数字10.5本身没任何意义,但是,假如我们听说一位朋友刚出生的孩子体重为10.5磅a,那么我们会恭喜她生了一个健康的宝宝。结合数字的上下文联系和个人知识,就可以做出判断。我们知道,体重10.5磅的新生儿个头相当大,而新生儿的体重不太会是10.5盎司b或10.5千克。因此,上下文联系可以使数字含义明确。
统计学通过数据获取真知灼见并且得出结论,所用的工具是图表和计算。但是,这些工具要在符合常识的思考方式下使用。让我们先快速地了解一下新闻媒体、热门政治和社会争议的数据和统计研究方面的丰富成果,迈出学习统计学旅程的第一步。在后文中,我们将对序言里列举的案例展开更为详细的研究。
一则逸闻就是一个引人入胜的故事,它之所以能够深入人心,就在于其内容能打动人。逸闻可以让事情人性化,所以新闻报道通常以逸闻开头(和结尾)。但是逸闻无法用作决策的依据,正是因其内容生动,所以也常常误导我们。我们判断一个说法可信与否的依据,是它是否有数据支持,而不是它是否来自一个动人的故事。
住得离高压电缆太近,是否会导致儿童患上白血病?美国国家癌症研究所花了5年时间和500万美元,来收集有关这个问题的数据。结果发现,在白血病和暴露在高压电缆产生的电磁场之间没有任何相关性。和这篇研究报告同时发表在《新英格兰医学期刊》上的社评大声疾呼,是时候不要在这个问题上 再浪费我们的研究资源了。
比较一下两则报道产生的影响:一则是有关历时5年、花费500万美元的调查研究的电视新闻报道,另一则是对一位能说会道的母亲的电视采访,她患有白血病的孩子恰好住在高压电缆附近。在公众心目中,几乎每次都是逸闻胜出。但事实上,我们应该心存疑问,因为数据要比逸闻更可靠,数据可以系统地描绘出整体图景,而不是聚焦于个别事件。
我还打算补充一句,数据胜过自封的专家。新闻行业通常所秉持的所谓公正的立场,就是各找一名正反方专家发表简短的评论。我们永远无法知道是否其中一方代表的是整个学科的共识,而另一方则是蝇营狗苟于某些特殊利益的骗子。媒体这种处理冲突的做法使现在的公众认为,对应每一位专家,都有一个持相反观点的专家。如果你真的关注某个话题,就应该尝试从数据中找出结论,还要判断数据的质量是否良好。很多问题确实还未得到解决,但也有很多问题,只在那些不重视证据的人的头脑中才悬而未决。你至少可以了解一下这些专家的背景,还有他们引用的研究结果是否曾刊载于那些文章必须先通过外部评审之后才能发表的严谨期刊上。
数据是数字,而数字总显得非常可信。其实有的数字是这样,有的却并非如此。任何统计研究中最重要的事,就是数据的来源。专栏作者安兰德斯问她的读者,如果可以重新来过,是否还会生孩子?回答的人中有70% 坚定地说不要。但是,你对于兰德斯从泪迹斑斑的信中,引述读者哭诉他们的孩子如何像野兽一样的话语,大可一笑置之。因为兰德斯从事的是娱乐业,她邀请读者回答这个问题时,回应最热烈的应该是那些后悔生孩子的父母。大部分的父母并不后悔生小孩。我们知道这个事实,是因为曾经有人对许多父母做过调查,而且为了规避偏见,受访的父母是随机抽取的。民意调查当然也不是没有瑕疵这点我们后面会谈到但它仍比邀请有一肚子不满的人来回答问题要好得多。
即使是信誉卓著的期刊,也不一定能对坏数据免疫。《美国医学会杂志》刊登过一篇文章,声称用管子将冷却的液体输送进胃里,可以缓解溃疡症状。这种治疗对病人的确有效果,但那只是因为病人通常会信服医生的权威性。也就是说,安慰剂(placebo,虚拟治疗)发生了作用。后来终于有人产生了质疑, 做了有控制组的比较研究有些病人接受了这项治疗,有些只使用了安慰剂结果表明安慰剂组(控制组)的表现更好。没有比较,就没有结论, 这是判断医学研究好坏的一个很好的依据。比如,我对于最近突然流行的自然疗法就心存怀疑。在这些疗法当中,极少会通过比较实验来证明它们不只是装在贴着漂亮植物图片的瓶子里售卖的安慰剂。
有报道说,在美国,设有赌场的县犯罪率较高。有位大学教师说,在线上课的学生比在教室里上课的学生表现好。政府报告强调,受过良好教育的民众比受教育少的民众赚钱多。最好不要太快下结论,而要先问一句:有没有什么是他们没告诉我的,却可以用来解释这些事?
有赌场的县的确犯罪率较高,但是在城市或是较穷的县,犯罪率也比较高。什么样的县会开设赌场呢?这些县是否在开设赌场之前,犯罪率就已经很高了呢?在线上课的学生学得比较好,但是和在教室里上课的学生比起来,前者的年龄比较大,底子也比较好,因此他们表现好很正常。受教育程度高的人的确赚钱多,但受教育多的人和受教育少的人相比,平均来说前者的父母受的教育也较多,也比较有钱。而且,前者在更好的环境中长大,上更好的学校。这些有利条件让他们接受到更多的教育,即使他们不接受这么多教育,这些有利条件也可能会帮他们赚到很多钱。
以上这些案例,都涉及两个变量之间的相关性,并且引导我们得出结论,即其中一个变量影响了另一个变量。赌场会增加犯罪率和想变富有就要多读点儿书,是它们传达的信息。这些信息有可能是正确的,但我们看到的相关性,大部分说不定还可以由隐藏在背景中的一些变量来解释,比如开设赌场的县的本质,以及受教育程度高的人生来就具备的有利条件。好的统计研究会考虑许多的背景变量,这当然需要技巧,不过你至少可以找一找,看它们有没有这样做。