登入帳戶  | 訂單查詢  | 購物車/收銀台(0) | 在線留言板  | 付款方式  | 聯絡我們  | 運費計算  | 幫助中心 |  加入書簽
會員登入   新用戶註冊
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2024年度TOP分類閱讀雜誌 香港/國際用戶
最新/最熱/最齊全的簡體書網 品種:超過100萬種書,正品正价,放心網購,悭钱省心 送貨:速遞 / 物流,時效:出貨後2-4日

2025年02月出版新書

2025年01月出版新書

2024年12月出版新書

2024年11月出版新書

2024年10月出版新書

2024年09月出版新書

2024年08月出版新書

2024年07月出版新書

2024年06月出版新書

2024年05月出版新書

2024年04月出版新書

2024年03月出版新書

2024年02月出版新書

2024年01月出版新書

『簡體書』Python金融大数据风控建模实战:基于机器学习

書城自編碼: 3510066
分類: 簡體書→大陸圖書
作者: 王青天,孔越
國際書號(ISBN): 9787111655794
出版社: 机械工业出版社
出版日期: 2020-06-01

頁數/字數: /
書度/開本: 16开 釘裝: 平装

售價:NT$ 714

我要買

share:

** 我創建的書架 **
未登入.



內容簡介:
本书的定位是一本Python金融大数据风控建模的入门级读物。全书包括4篇:背景篇旨在由浅入深地引领读者走进金融科技领域,了解智能风控,系统、全面地认识评分卡;基础篇围绕评分卡构建的全流程,向读者一一讲述每个环节的理论知识,随之进行代码实践,帮助读者获得从0至1构建评分卡模型的工程能力;进阶篇旨在从建模中可能遇到问题出发,提供一些问题解决或模型提升的思路,使建立的评分卡具有更好的业务适应及预测能力;实战篇结合真实信贷场景的数据集,带领读者完成从数据分析至评分卡生成的各个流程,旨在让读者体验真实场景,具备评分卡实战能力,亦可作为读者实际工作中构建评分卡的参考。本书适合有一定Python语言基础的金融风控相关技术人员阅读,也适合想要了解人工智能如何在金融场景应用的开发及业务人员。另外,也适合专业培训机构的学员和相关专业的学生。
目錄
前言
第1篇智能风控背景
第1章金融科技介绍2
1.1金融科技的前世今生2
1.2金融科技正深刻地改变和塑造着金融业态4
1.3新兴科技不断强化金融科技的应用能力5
1.4金融风险控制面临着前所未有的挑战7
1.5智能风控和评分卡8
1.6评分卡模型的开发流程11
第2章机器学习介绍17
2.1机器学习的概念17
2.2机器学习的分类17
2.2.1有监督学习18
2.2.2无监督学习18
2.2.3强化学习19
2.3机器学习与人工智能的关系20
2.4机器学习与数学的关系20
2.5机器学习与深度学习22
第3章评分卡模型介绍25
3.1申请评分卡25
3.1.1数据获取26
3.1.2好坏样本定义26
3.1.3观察期与表现期确定29
3.1.4样本分层32
3.1.5数据清洗与预处理33
3.1.6特征工程33
3.1.7模型训练与优化35
3.2行为评分卡36
3.2.1数据获取37
3.2.2时间窗口37
3.2.3特征工程38
3.3催收评分卡40
3.3.1催收评分卡分类40
3.3.2催收策略41
3.4反欺诈模型42
3.4.1欺诈风险与信用风险比较42
3.4.2欺诈模型好坏样本定义43
3.4.3欺诈主体分析44
3.4.4反欺诈方法介绍44
第2篇评分卡理论与实战基础
第4章数据清洗与预处理48
4.1数据集成49
4.2数据清洗50
4.3探索性数据分析52
4.4Python代码实践54
4.4.1数据集成54
4.4.2数据清洗58
4.4.3探索性数据分析61
第5章变量编码方法66
5.1无监督编码66
5.1.1One-hot编码66
5.1.2Dummy variable编码68
5.1.3Label编码69
5.2有监督编码70
5.2.1WOE编码70
5.2.2WOE编码与One-hot编码比较73
5.3Python代码实践75
5.3.1One-hot编码76
5.3.2Dummy variable编码80
5.3.3Label编码82
5.3.4WOE编码85
第6章变量分箱方法89
6.1变量分箱流程91
6.2最优Chi-merge卡方分箱方法92
6.3Best-KS分箱方法94
6.4最优IV分箱方法95
6.5基于树的最优分箱方法95
6.6Python代码实践98
6.6.1最优Chi-merge分箱98
6.6.2最优IV分箱106
6.6.3基于树的分箱107
第7章变量选择109
7.1过滤法变量选择109
7.2包装法变量选择112
7.3嵌入法变量选择113
7.4Python代码实践115
7.4.1过滤法变量选择115
7.4.2包装法变量选择118
7.4.3嵌入法变量选择120
第8章Logistic回归模型123
8.1Logistic回归模型原理123
8.2过拟合与欠拟合128
8.3Python代码实践130
第9章模型的评估指标136
9.1正负样本的选择137
9.2标准评估指标139
9.3概率密度评估指标141
9.4概率分布评估指标144
9.5Python代码实践153
第10章评分卡分数转化157
10.1由概率到分数的转换157
10.2变量的分值计算159
10.3评分卡性能评估161
10.4Python代码实践163
第11章模型在线监控169
11.1稳定性监控169
11.2单调性监控172
11.3性能监控指标173
11.4Python代码实践174
第3篇评分卡理论与实战进阶
第12章样本不均衡处理180
12.1数据层下采样样本不均衡的处理方法181
12.1.1随机下采样方法181
12.1.2样本邻域选择的下采样方法182
12.1.3样本邻域清理的下采样方法184
12.1.4Bagging集成的下采样方法185
12.1.5Boosting集成的下采样方法187
12.2数据层上采样样本不均衡的处理方法188
12.2.1随机上采样方法188
12.2.2SMOTE样本生成方法189
12.2.3Borderline-SMOTE样本生成方法190
12.3算法层样本不均衡的处理方法190
12.4模型评估层样本不均衡的处理方法191
12.5Python代码实践191
12.5.1数据层下采样样本不均衡处理代码实现192
12.5.2数据层上采样样本不均衡处理代码实现201
第13章特征工程进阶206
13.1数据层特征工程206
13.2算法层特征工程211
13.2.1基于树模型的特征生成211
13.2.2FM特征交叉215
13.3Python代码实践219
13.3.1数据层特征工程代码实现219
13.3.2算法层特征工程代码实现222
第14章决策树模型229
14.1决策树模型的原理229
14.2决策树学习229
14.3决策树与过拟合234
14.4Python代码实践236
第15章神经网络模型241
15.1神经元模型241
15.2神经网络的网络结构242
15.3神经网络的学习策略247
15.4Python代码实践253
第16章支持向量机模型257
16.1感知器模型257
16.1.1感知器模型的原理257
16.1.2感知器与支持向量机模型260
16.2线性可分支持向量机261
16.3线性支持向量机267
16.4非线性支持向量机272
16.5感知器相关模型比较278
16.6Python代码实践280
16.6.1线性支持向量机模型代码实现280
16.6.2非线性支持向量机模型代码实现282
第17章集成学习286
17.1Bagging与Boosting对比286
17.2Random Forest模型原理288
17.3Adaboost模型原理289
17.4GBDT模型原理292
17.5Xgboost模型原理297
17.6Python代码实践304
17.6.1Random Forest模型304
17.6.2Adaboost模型308
17.6.3GBDT模型310
17.6.4Xgboost模型313
第18章
內容試閱
自2016年以来,金融科技(Fintech)开始风靡国内外金融行业,备受关注。Fintech基于大数据、云计算和人工智能等一系列创新技术,全面应用于支付清算、借贷融资、财富管理、零售银行、保险、交易结算六大金融领域,是金融业未来的主流趋势。Fintech以数据和技术为核心驱动力,正在改变金融行业的生态格局。
Fintech在技术上带来的创新,对金融领域的业务模式、应用和产品产生了深刻的甚至颠覆性的影响。人工智能呼啸而来,催生了智能投顾、智能客服和智能风控等行业的发展。本书聚焦智能风控,结合人工智能技术解决金融行业最核心的问题——风险控制。进行风险控制的关键在于解决信息不对称性,信用评分卡模型是解决这一问题的关键策略。尤其是在金融领域积累了大量数据的前提下,为了充分发挥人工智能的优势,评分卡模型正在逐渐成为信用审核等环节的必要且倚重的手段,其发展前景不可估量。
纵观国内,智能风控领域的图书以信贷理论和业务指导类书籍居多,鲜有能帮助技术人员将业务需求落地实现的工程代码类书籍。本书旨在填补这一空缺,结合真实信贷数据,配合代码实践,引领读者从0至1地构建评分卡模型。
本书采用Python语言进行代码实战。Python在各行各业的应用越来越普及,从云端到客户端,再到物联网终端,Python应用无处不在。更为重要的是,Python语言是人工智能的首选编程语言,本书聚焦的智能风控领域,正是人工智能对金融数据的应用场景,对此,Python具有无可比拟的优势。关于Python语言实践和人工智能算法理论与实践的书籍颇为丰富,而结合信贷领域场景的算法应用类图书却比较稀缺,本书的出版将会改变这一现状。本书的核心内容包括算法理论与Python代码实践,旨在在构建评分卡的全流程内,先进行算法理论讲解,然后再进行代码实践,全面提升读者构建评分卡的理论造诣和工程能力。
本书特色
1. 深入剖析业务背景,易学易用
本书覆盖了大量的业务知识,并力争以对比的方式展现不同业务需求下的建模差异。
* 介绍风控建模流程;
* 以全生命周期为主线介绍不同模型的特点;
* 对建模过程中的每一步都力求给出原因、思考思路和解决办法。
2. 简明介绍机器学习的建模思想,覆盖广泛
本书力争以简明的语言阐述算法原理,并借助少量的公式推导让读者理解算法的实质,广泛覆盖大部分常用算法,梳理并对比不同算法族类的异同。
* 详细介绍机器学习体系,并以整个建模流程为主线展开介绍;
* 重点阐明算法思想,弱化繁杂的公式推导;
* 力争以算法族为基础,比较同一问题的不同解决方法;
* 由浅入深,从基本建模流程开始逐步介绍建模过程,进阶部分还介绍大量的复杂模型以提升建模效果。
3. 全程使用Python 3编程语言,通用、方便
本书用Python语言完成评分卡模型的代码编写,易学易用。
* 评分卡实战章节的最后都会给出Python代码,方便读者学习和开发;
* 算法部分以scikit-learn包为基础,对算法的关键参数力争给出详细说明,方便读者调参;
* 不同章节采用同一组实验数据,方便读者对比不同算法的实战效果;
* 给出详细充足的代码注释,以方便读者理解。
4. 真实数据建模,注重实战
本书最后一章以真实的数据为基础展示了完整的建模流程,注重提升读者从理论到实践的动手能力。
* 以真实的数据为例,复现建模过程;
* 阐明建模过程中需要注意的问题与处理方法;
* 给出代码,实现从0到1的全流程代码实战。
本书内容
本书是一本Python金融大数据风控建模的入门级读物,全书共19章,分为4篇。
第1篇智能风控背景(第1~3章)
本篇引领读者走进金融科技领域,了解智能风控,系统、全面地认识评分卡。其中,第1章介绍金融科技的概念、发展史和相关新兴科技,简述智能风控的重要性、评分卡的类型和通用建模流程;第2章介绍机器学习的概念与分类及其与数学的关系;第3章介绍4种常用评分卡模型的开发流程,明确模型开发需要经历的不同阶段。
第2篇评分卡理论与实战基础(第4~11章)
本篇围绕构建评分卡的全流程,以“理论+代码实践”的形式对构建评分卡模型的必要环节进行讲解,帮助读者获得从0到1构建评分卡模型的工程能力。其中,第4章介绍数据集成、清洗与预处理;第5章介绍变量编码;第6章介绍变量分箱;第7章介绍变量选择;第8章介绍经典的Logistic回归模型;第9章介绍模型评估;第10章介绍评分卡分数转化;第11章介绍模型在线监控。
第3篇评分卡理论与实战进阶(第12~18章)
本篇从数据层、特征层和模型层三个维度为读者提供一些解决实际问题或提升模型效果的思路,使构建的评分卡具有更好的业务适应能力及预测能力。其中,第12章从数据层的维度介绍样本不均衡处理的策略,旨在从建模最前端(数据源头)寻找提升评分卡模型效果的方法;第13章从特征层的维度介绍显式的特征交叉、半显式的特征生成、隐式的特征交叉方法,用以提高特征工程的效率;第14~18章从模型层的维度介绍更多比经典Logistic回归模型更为复杂的机器学习模型,以便从提高模型的预测能力和扩大模型的容量的角度提升评分卡模型的性能。
第4篇Lending Club数据集实战(第19章)
本篇以Lending Club数据集作为处理对象,带领读者体验处理真实信贷数据的完整流程,包括数据的获取与预处理、特征工程、模型构建与评估、评分卡生成。本篇可带领读者实际演练真实工作场景中评分卡模型的构建过程,从而让他们在整个流程中把对业务的理解、机器学习技术及代码编写能力结合起来,形成自己的模型开发体系。
本书配套资源获取方式
本书涉及的源代码文件和Demo需要读者自行下载。请在华章网站www.hzbook.com上搜索到本书,然后单击“资料下载”按钮,即可在本书页面上找到“配书资源”下载链接。
本书读者对象
* 有一定Python语言基础的金融科技从业人员;
* 用Python语言开发风控模型的技术人员;
* 对风控建模感兴趣的业务人员;
* 想转行到风控建模领域的技术人员;
* 对机器学习算法感兴趣,正在寻找算法应用场景的人员;
* 喜欢编程的自学人员;
* 金融或者计算机等相关专业的学生;
* 相关培训机构的学员。
本书阅读建议
* 本书假定读者已经具有一定的Python编码能力。若你完全没有Python语言基础,建议同步阅读一本讲解Python语言编程的图书,推荐张頔所著的《Python编程从0到1》一书。
* 以练带学。学习编码的最好方式就是练,请你跟随书中的代码多加练习,以加强对知识的吸收与巩固。
* 业务至上。本书讲解的评分卡最终的服务对象是业务,因此需要结合业务场景,在深入理解业务需求的前提下思考构建不同模型时遇到的问题与处理方法。
* 万变不离其宗。不要只停留在算法应用的表面做一个机械的“调参者”,而应注重深入学习算法原理及不同算法的使用范围,并适当理解数学推导过程,以加深对相关知识的理解,让调参环节更加有的放矢。
* 知识网络化。多对比理解不同框架的算法原理,以及同一框架下各种算法的异同,使相关知识成为一个网络,这样你对知识的理解才会更为透彻。
* 正式阅读本书前,请读者首先阅读本书附录B中的相关内容,以了解本书所使用的Python版本、集成开发环境及相关的Python包。
本书作者
本书由王青天和孔越合作编写。本书能得以顺利出版,要感谢胡周杰的引荐!还要感谢在写作和出版过程中给予作者大量指导和帮助的各位编辑!
由于作者水平所限,加之写作时间较为仓促,书中可能还存在一些疏漏和不足之处,敬请各位读者批评与指正。联系邮箱:htw202018@163.com或hzbook2017@163.com。
最后祝阅读快乐!

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 台灣用户 | 香港/海外用户
megBook.com.tw
Copyright (C) 2013 - 2025 (香港)大書城有限公司 All Rights Reserved.