新書推薦:
《
中国近现代名家精品——项维仁:工笔侍女作品精选
》
售價:NT$
308.0
《
宋瑞驻村日记(2012-2022)
》
售價:NT$
539.0
《
汗青堂丛书138·帝国的切口:近代中国口岸的冲突与交流(1832-1914)
》
售價:NT$
594.0
《
人世事,几完缺 —— 啊,晚明
》
售價:NT$
539.0
《
樊树志作品:重写明晚史系列(全6册 崇祯传+江南市镇的早期城市化+明史十二讲+图文中国史+万历传+国史十六讲修订版)
》
售價:NT$
2215.0
《
真谛全集(共6册)
》
售價:NT$
5390.0
《
敦煌通史:魏晋北朝卷
》
售價:NT$
780.0
《
唯美手编16:知性优雅的编织
》
售價:NT$
250.0
|
編輯推薦: |
大数据时代迎接挑战的利器;凝聚合肥工业大学李廉教授团队多年教学与科研经验;对于因果关系的科学和系统解读。
|
內容簡介: |
本书介绍了人们关于因果分析和因果推断认知的历史脉络与现代发展。主要内容分为4章,第1章介绍了因果概念的历史发展,重点阐述中国古代贤达对于这一问题的精辟理解,以及古希腊科学家对于因果关系认知所做的基础性贡献。文艺复兴以后,诸多科学家在这个问题上的逐步深入研究,给予了因果关系以现代科学的描述方式。第2章介绍当前因果分析与推断的一些理论和方法,主要介绍了2011年图灵奖得主朱迪亚·珀尔有关求解因果关系的理论框架和计算方法,这些方法已经成为当前因果科学的主流模型之一。第3章专门讨论了因果分析的一些重要而有趣的问题,包括如何识别抽烟对于肺癌的影响,以及其中延续几十年的争论,介绍了在具体问题中如何确定实际原因,这些实际原因经常具有独特性而被“一般的”因果分析方法所忽略,但在医疗、司法和决策中至关重要。最后在第4章,介绍了当前机器学习和人工智能的一个新发展趋势,就是如何将因果分析与机器学习进行“嫁接”,从而产生性能更加优越、更加近似于人类思维的人工智能。本书是一本普及性读物,适合本科生及研究生,也适合从事数据科学和人工智能工作的专业人员阅读,同时对于希望了解因果科学的爱好者也是一本很好的入门书籍。
|
關於作者: |
李廉,合肥工业大学教授。曾担任高等学校大学计算机课程教学指导委员会主任,中国计算机学会理论计算机科学专业委员会主任。主要从事理论计算机科学、大数据应用、人工智能等领域的研究。先后承担或参与国家自然科学基金重大研究计划重点项目,国家科技攻关计划项目等。获安徽省教学成果一等奖两项,国家教学成果二等奖一项,2020年获中国计算机学会杰出教育奖。
|
目錄:
|
第1章如何认识世界1.1因果概念的产生及意义1.1.1因果关系与认知1.1.2常识因果与科学因果1.1.3因果关系的分析与推断1.1.4因果关系的黄金法则1.2从逻辑到因果1.2.1因果的逻辑基础1.2.2亚里士多德的“四因说”1.3中国古代的因果观念1.3.1墨学的因果必然1.3.2道学的因果分层1.3.3佛学的因果缘起1.4对于因果科学的追求1.4.1因果关系的重生1.4.2因果关系数学模型的引入1.4.3因果关系的现代诠释1.4.4珀尔的因果分析框架1.5本章结束语第2章因果关系——决策与反思2.1什么是混杂2.2如何表示因果关系2.2.1因果结构图2.2.2因果结构图中的关系传递2.2.3因果关系量化2.2.4因果关系与概率2.2.5因果结构图与贝叶斯网络2.3如何从观察数据中识别因果结构2.3.1为什么可以识别因果结构2.3.2识别因果结构的基本假设2.3.3识别因果结构的方法:以IC算法为例2.3.4识别因果结构的方法:评分优化2.3.5统计时间与物理时间2.4如何估计因果效应2.4.1什么是干预2.4.2如何在因果结构图中表示干预2.4.3为什么可以利用观察数据估计干预的效果2.4.4观察数据校正与随机对照试验2.4.5校正变量的筛选——后门准则2.4.6结构方程与因果效应2.4.7线性系统中的因果效应估计2.4.8工具变量与工具变量悖论2.5如何实现个体反思2.5.1什么是反事实2.5.2反事实与干预的关系2.5.3反事实与最邻近世界2.5.4反事实推断的基本过程2.5.5反事实推断与校正公式2.5.6线性系统中的反事实2.5.7直接原因和间接原因2.6因果分析的待解问题2.6.1亚群反转2.6.2抽样偏差与变量选择2.6.3假设检验2.6.4因果区域2.7本章结束语第3章现实世界与实际原因3.1究竟哪个是原因3.1.1从吸烟致癌谈起3.1.2因果解释3.1.3特异因果和一般因果3.1.4必要原因与充分原因3.2因果关系效应估计3.2.1诺贝尔奖的故事——因果关系可识别性3.2.2断点回归3.2.3双重差分3.2.4倾向得分匹配3.3不完美实验中的因果估计3.3.1不完美实验问题3.3.2不完美实验因果图3.3.3意向性因果分析3.3.4不完美实验的边界估计3.4关于实际原因的困惑3.4.1什么是实际原因3.4.2如何确定实际原因3.4.3因果抢占3.4.4过度确定3.5本章结束语第4章机器学习与因果分析4.1机器学习的神话4.1.1什么是机器学习4.1.2机器学习的起源和历史4.1.3机器学习的趋势和未来4.2大数据时代的信任危机4.2.1到底需要多大量的数据呢4.2.2为什么数据质量很重要4.2.3统计数据也会说谎吗4.2.4机器学习模型稳健吗4.2.5结果可解释吗4.3从因果关系中寻求突破4.3.1因果机器学习4.3.2因果发现4.3.3因果模型对机器学习的意义4.4下一代人工智能4.4.1因果建模的层次4.4.2因果之梯——构筑稳固的基石4.5本章结束语参考文献
|
內容試閱:
|
前言人类对于因果和因果关系的探索与追求,自人类文明起源开始,一直延绵至今。从上古时代人们对于动物活动规律的认知,到现代人们对于各种现象之间本质联系的挖掘,因果关系贯穿了其中的每一个环节。当前,几乎所有学科的研究内容都离不开对因果关系的分析,因果关系成为当代科学的基石之一。但令人深思的是,这样一个重要的基础概念,长时间以来却一直处于朦胧和神秘的状态。几千年来,人们一直通过经验和直觉来理解因果关系,从而形成了所谓的常识因果知识,直到20世纪初叶,仍然能够看到有关因果关系的一些模糊的,甚至是相互矛盾的叙述。概念的含糊性和歧义性,并不影响人们在各种场合毫无顾忌地谈论因果关系,但同时也难免会让人们陷于各种各样的争论。这种现象在现代科学中即使不是绝无仅有的,也是极为个别的。这种混乱的场面,到了100多年前才开始得到扭转,在耶日·内曼和罗纳德·费希尔等人的共同推动下,对于因果关系的理解开始走向了科学的道路,因果关系这个充满谜团的神奇之物变得逐渐清晰起来。用数学和统计学的语言描述因果和因果关系,终于使人们可以在一个共同认可的基础上讨论因果关系。正如马克思所说:“一种科学只有在成功地运用数学时,才算达到了真正完善的地步。”对于因果关系的科学表述使因果关系从一个“自然之物”一跃成为“科学之物”,并且在众多学科领域的研究中获得巨大成功,特别是医学、经济学、心理学、生态学、管理学等这些不便做随机对照试验的学科。到目前为止,已经在绝大多数学科中发现了因果关系的成功应用,并且借助计算机科学和人工智能的推动,因果关系正在焕发新的青春和力量。尽管还有一些质疑的声音,但是总的趋势已经向着光明的未来前进。这本《因果漫步》将带我们开启这段因果认知启蒙和发展的漫步之旅,去感知人们对于因果关系的理解在历史长河中如何一步步地发生变化,以及因果关系是如何成为一个科学的研究对象的。在这个过程中,许多科学家做出了重要贡献,使得因果关系从一个有些玄奥的哲学概念变为可以分析、计算、评价和比对的学术概念,同时借助各种精巧的算法,还使得我们可以在复杂的环境变量中知道应该做什么和怎样去做,并由此得到关于因果关系的具体结论。总而言之,科学使得人们在关于因果关系的认知和应用上产生了巨大的飞跃。有两个贯穿全书的重要概念:因果效应和因果关系。因果效应指的是原因变量对于结果变量的影响程度,而因果关系指的是这个程度超越了设定的阈值,具有了显著性。两个概念之间相互联系而又有所区别。因果效应是客观存在的,具有数量上的刻画,而因果关系则是根据问题的需要和对问题的理解而主观设定的。因果效应使得因果关系具备了量化性质,而可量化的因果关系是现代因果关系研究的重要标志。当前普遍用概率统计的语言来描述因果效应,因为一个原因有时导致结果出现,有时可能不导致,即因果的发生是一个概率现象。常识因果论一般认为“有因必有果”,即原因必然导致结果,但是现实世界是复杂的,在人们可以观察的世界中,因果并不是必然发生的,而是“固然”发生的(金岳霖语),因此概率化的因果关系描述更加符合客观实际,也比常识因果更为科学。只有使用了科学的观察手段和描述方法,因果理论才能真正成为人们认知世界的工具,进而成为不同学科增添新方法的源头和做出新发现的利器。现实世界是复杂的,需要面对的因果分析问题通常是一个庞大的系统,从中既简明又准确地给出有关因果关系的结论是一个十分有意义却困难的任务。例如一场山火,导致其发生的原因有很多,其中主要有两个:一个是火种的存在,一个是氧气的存在。但是氧气这个原因显然不是因果分析所要针对的目标,更需要针对的是那些不常发生的事情,也就是火种。毫无疑问,因果分析应该符合人们潜在的期望,但是这种期望经常处于一种朦胧和不清晰的状态,有时候人们希望因果分析告诉人们自己都说不清楚的结果,这就导致了因果分析天生就具有某种非计算性质和不确定性。全面的不分巨细的因果分析似乎并不是人们所追求的,试想一下,导致一场山火的原因多如牛毛,例如温度、水汽、植被分布、风向、风力等,如果机器真的开列了1000条理由(这是经常有的),这可不是什么好事,实际上只要知道一条,即火种的来源。那么我们追求的目标究竟是什么,如何向计算机描述我们的期冀(这经常因为目标的不同而不同),成为因果分析中一个极其特别的问题,这也使得因果分析始终无法脱去哲学的外衣而成为一个纯粹的学术问题。2021年的诺贝尔经济学奖与2022年的诺贝尔物理学奖都与因果关系有关,2021年的经济学奖授予三位在美国工作的经济学家,分别是加州大学伯克利分校的大卫·卡德、麻省理工学院的乔舒亚·安格里斯特,以及斯坦福大学的吉多·因本斯,在颁奖词中,对卡德教授的表彰是“对劳动经济学的经验性贡献”,而对安格里斯特教授和因本斯教授的表彰则是“对因果关系分析的方法学贡献”。卡德教授正是应用了因果分析方法解决了劳动经济学的诸多问题,这是因果分析在经济学中成功应用的卓越案例。2022年诺贝尔物理学奖授予法国科学家阿兰·阿斯佩、美国科学家约翰·克劳泽和奥地利科学家安东·塞林格,以表彰他们“用纠缠光子进行的实验,证伪了贝尔不等式,并开创了量子信息科学”的贡献。他们用实验说明,在量子世界里,“决定论”并不成立,因此以“决定论”为基础的因果论也不成立,但是这并不意味着在宏观世界范围里的因果论的终结,因为微观世界和宏观世界之间横亘着一道墙,在墙的两边有着完全不同的风景。尽管从理论上讲,可以通过描述每一个量子的行为来描述宏观物体的行为,但是实际上,这既不可能也无必要。人类几百年来建立的描述宏观世界的原理依然有效并且简明,因果关系依然是描述这个日常世界的基本法则。当然,从量子世界到宏观世界,随机论如何过渡到因果论,即因果涌现的问题,是当前人们关心的一个热点问题。本书总共分为4章,第1章讲述了人类对于因果关系认知的发展历史脉络,特别是中国的古代先贤们对于因果关系的朴素理解和精辟表述,比如战国时期的哲学家墨子提出的“二故说”,描述了原因的充分性和必要性,早于亚里士多德的“四因说”。苏格兰哲学家休谟于18世纪提出类似的对于因果关系的表述,已经相差2000多年了。文艺复兴以后,诸多科学家在这个问题上的研究逐步深入,从古代的直觉主义过渡到现代的科学认知。人类天生就具备因果抽象能力,但是要将因果形成一门科学却并不容易,其中一些过程耐人寻味。第2章主要介绍了当代因果关系的基本理论和分析方法,这些介绍主要基于2011年图灵奖得主朱迪亚·珀尔提出的关于因果分析的框架,同时也介绍了其他的一些理论与流派。珀尔所开创的因果分析框架具有算法性特点,适合在计算机上予以实现,当然,与其他理论相比也各有优缺点,需要取长补短,综合应用。第3章介绍了因果论中一些颇为有趣的专题,通过吸烟是否导致肺癌的争论案例,讨论了在复杂背景下如何通过有效地处理各种因素而找出真正起关键作用的原因。介绍了处理因果关系的几种观点以及统计因果分析的三大方法,即断点回归、双重差分和倾向得分匹配。讨论了如何根据问题性质去确定和获取所需要的实际原因,这些实际原因经常因具有独特性而被“一般的”因果分析方法所忽略,但在医疗、司法和决策中至关重要。第3章还介绍了在不完美实验中如何正确评估因果关系,这在观察和实验研究中是经常遇到的。第4章专门讨论了因果分析与机器学习的关系,这在人工智能中是一个躲避不开且亟须解决的关键问题,通过将因果分析引入机器学习,可以创造出更加“聪明”的智能体,并使其行为更加类似人类智能。因果分析与机器学习的“联姻”,正在催生新一代的智能技术,并引发第二次因果革命。写一本具有普及性质的“漫步型”书籍,对于我们来讲是一种全新的经历,其中有许多挫折和起伏,对于因果关系的学术理解并不足以胜任这样的一本书的编写,熟悉内容是一回事,能够给读者通俗地讲出来并讲好是另一回事。我们尽力处理好科学性与通俗性的平衡,但难免存在不当或遗漏之处,恳请读者批评指正。十分感谢北京大学李晓明教授在本书写作过程中自始至终给予的鼓励和支持,感谢北京大学耿直教授、浙江大学吴飞教授、广东工业大学蔡瑞初教授对本书提出的许多有益建议,使我们进一步明确了这本书的基调和内容。感谢梁知音老师细心地为本书创作了插图,使得这本书增色不少。正是在他们的支持下,本书才得以出版,希望读者能够通过阅读本书受益,增强对于因果关系研究的兴趣。作者2023年3月
|
|