新書推薦:
《
中文版SOLIDWORKS 2024机械设计从入门到精通(实战案例版)
》
售價:NT$
450.0
《
旷野人生:吉姆·罗杰斯的全球投资探险
》
售價:NT$
345.0
《
希腊人(伊恩·莫里斯文明史系列)
》
售價:NT$
845.0
《
世界巨变:严复的角色(王中江著作系列)
》
售價:NT$
500.0
《
塔西佗(全二册)(二十世纪人文译丛)
》
售價:NT$
1800.0
《
宋初三先生集(中国思想史资料丛刊)
》
售價:NT$
990.0
《
简帛时代与早期中国思想世界(上下册)(王中江著作系列)
》
售價:NT$
1400.0
《
天生坏种:罪犯与犯罪心理分析
》
售價:NT$
445.0
|
內容簡介: |
本书既是关于联邦学习技术和上手实践方法的介绍,又是关于联邦学习在业界,特别是金融科技行业应用实践的案例展示。 第1章介绍联邦学习的发展背景和历程,以及金融业中数据共享的机遇和挑战。第2章~第5章介绍不同类型的机器学习方法在联邦学习模式下的实现,以及关键算法原理。第6章介绍联邦学习开源框架FATE的架构和部署,以及在金融控股集团内大数据平台上建立跨机构统一数据科学平台的实施方案。第7章从建模者的角度展示了典型建模流程的实战过程。第8章和第9章结合在金融相关行业的实践,以多个应用案例和解决方案的形式,介绍联邦学习在营销运营和风险管理等不同业务方向上不同层次的应用实践。第10章从人工智能的不同方向介绍联邦学习应用扩展及前景。附录介绍了联邦学习框架中相关的密码学工具。
|
關於作者: |
向小佳,光大科技有限公司副总经理,。光大科技有限公司植根于金融科技领域,于2018年就开始探索数据的加密共享。曾任中国科学院副研究员和硕士生导师、哥伦比亚大学访问学者、华为架构师。他在云计算、大数据、机器学习领域具有丰富的学术与产业应用经验。在国内金控领域,他于2018年个发起联邦学习应用研究,并将其在风控、营销方面落地,建设了自主可控的联邦学习平台。他曾任中国科学院副研究员和硕士生导师、哥伦比亚大学访问学者、华为架构师。他在云计算、大数据、机器学习领域具有丰富的学术与产业应用经验。他于2010年在清华大学获得博士学位,曾参与多个“863”“973”项目,主持国家自然科学基金项目一项,发表期刊和会议论文20余篇。 李琨,光大科技有限公司追光实验室负责人。他于2011年在北京大学获得计算数学博士学位,发表算法相关的期刊和会议论文10余篇,拥有国内外多个行业数据挖掘建模和算法创新领域的多年实践经验,现在致力于金控集团数据协同和数据挖掘方向的解决方案实现与算法创新。王鹏,光大科技有限公司大数据研究团队负责人。他现在负责金控集团联邦学习生态系统的建设和技术创新,参与了多个隐私计算行业标准制定,是联邦学习开源项目FATE专家技术指导委员会成员。他拥有10余年的大数据、人工智能系统设计经验,并在金控集团应用领域中实现了技术创新,其创新成果获得了多项行业奖项。 郑方兰,光大科技有限公司追光实验室技术专家。他于2012年获得博士学位,在国际主流的学术会议和期刊上发表论文10余篇,在多个业务场景中有丰富的数据挖掘经验,现主要致力于开发算法模块解决实际业务问题和算法创新。田江,工学博士,光大科技有限公司大数据部负责人,在大数据、人工智能领域拥有丰富的理论研究及实践经验,发表国内外期刊和会议论文30余篇,参与起草国家标准《数据管理能力成熟度评估模型》并受聘为评估专家,同时多次获得中国人民银行信息科技课题研究奖项。
|
目錄:
|
目 录
第1章 / 联邦学习与金融科技应用介绍 1
1.1 联邦学习的发展背景和历程 1
1.2 金融数据价值挖掘的联邦学习实践 8
第2章 / 联邦学习算法之建模准备 13
2.1 联邦学习的分类 13
2.2 样本对齐的实现方式 16
2.2.1 基于哈希函数的普通对齐方式 16
2.2.2 基于非对称加密算法的隐私保护对齐方式 17
2.3 特征工程的联邦学习实现方式 20
2.3.1 特征工程简介 20
2.3.2 联邦特征工程 23
第3章 / 联邦学习算法之模型实现 25
3.1 线性模型的联邦学习实现方式 25
3.1.1 横向联邦学习中的线性模型 27
3.1.2 纵向联邦学习中的线性模型 29
3.2 梯度提升树的联邦学习实现方式 39
3.2.1 XGBoost算法介绍 40
3.2.2 SecureBoost算法介绍 42
3.3 深度学习类算法的联邦学习实现方式 48
3.3.1 深度学习的基本概念 48
3.3.2 常用的深度学习算法介绍 49
3.3.3 联邦深度学习算法介绍 52
第4章 / 基于联邦学习的推荐系统 62
4.1 信息推荐与推荐系统 62
4.2 矩阵分解和因子分解机的实现方式 64
4.2.1 基于隐语义模型的推荐算法 65
4.2.2 矩阵分解算法 65
4.2.3 因子分解机模型 67
4.3 联邦推荐系统算法 69
4.3.1 联邦推荐算法的隐私保护 69
4.3.2 联邦推荐系统的分类 70
4.3.3 横向联邦推荐系统 71
4.3.4 纵向联邦推荐系统 76
第5章 / 联邦学习应用之数据要素价值 87
5.1 联邦学习贡献度 87
5.1.1 背景介绍 87
5.1.2 基于缺失法的贡献度计算 87
5.1.3 基于Shapley值的贡献度计算 89
5.2 基于联邦学习的数据要素交易 92
5.2.1 数据要素交易的背景与现状 92
5.2.2 基于联邦学习的交易机制构建 95
第6章 / 联邦学习平台搭建实践 98
6.1 联邦学习开源框架介绍 98
6.2 FATE架构与核心功能 100
6.3 金融控股集团联邦学习平台简介 106
6.4 FATE集群部署实践 108
6.4.1 All-in-one方式部署FATE集群[63] 110
6.4.2 Docker-Compose方式部署FATE集群[62] 119
6.4.3 在Kubernetes上部署FATE集群[63] 126
6.4.4 FATE集群部署验证 141
6.4.5 FATE集群配置管理及注意事项 144
6.5 与异构平台对接 152
6.5.1 与大数据平台对接 152
6.5.2 与区块链平台对接 156
6.5.3 多参与方自动统计任务 160
第7章 / 联邦学习平台实践之建模实战 165
7.1 横向联邦学习场景 165
7.1.1 建模问题与环境准备 165
7.1.2 横向联邦学习建模实践过程 168
7.2 纵向联邦学习场景 187
7.2.1 建模问题与环境准备 187
7.2.2 纵向联邦学习建模实践过程 190
第8章 / 跨机构联邦学习运营应用案例 210
8.1 跨机构数据统计 210
8.2 在交叉营销场景中的联邦学习实践 215
8.2.1 联邦学习在交叉营销场景中的应用 215
8.2.2 信用卡交叉营销的联邦学习案例 216
8.3 联邦规则抽取算法及其在反欺诈与营销场景中的应用 220
8.3.1 基于F-score的联邦集成树模型和其对应的业务背景 220
8.3.2 损失函数、剪枝和自动化规则抽取 222
8.3.3 纵向和横向Fed-FEARE 227
8.3.4 横向Fed-FEARE应用于金融反欺诈 229
8.3.5 纵向Fed-FEARE应用于精准营销 232
第9章 / 跨机构联邦学习风控应用案例 235
9.1 联邦学习下的评分卡建模实践 235
9.1.1 背景需求介绍 235
9.1.2 联邦学习框架下的评分卡建模 236
9.1.3 联邦学习框架下的评分卡模型优化 237
9.1.4 应用案例 239
9.2 对企业客户评估的联邦学习和区块链联合解决方案 243
9.2.1 金融控股集团内对企业客户评估的应用背景 243
9.2.2 联邦解决方案的内容 244
9.2.3 券商对公客户的评级开发 245
9.3 在保险核保场景中银行保险数据联邦学习实践 247
9.3.1 保险核保 247
9.3.2 智能核保 248
9.3.3 联邦学习与智能核保 249
第10章 / 联邦学习应用扩展 256
10.1 基于联邦学习的计算机视觉应用 256
10.1.1 联邦计算机视觉简述 257
10.1.2 研究现状与应用展望 259
10.2 联邦学习在自然语言处理领域的应用 261
10.2.1 联邦自然语言处理技术进展 261
10.2.2 联邦自然语言处理应用 262
10.2.3 挑战与展望 263
10.3 联邦学习在大健康领域中的应用 263
10.3.1 联邦学习的大健康应用发展历程 264
10.3.2 挑战与顾虑 266
10.4 联邦学习在物联网中的应用 268
10.4.1 物联网与边缘计算 268
10.4.2 人工智能物联网 270
10.4.3 研究现状与挑战 271
附录1 RSA公钥加密算法 272
附录2 Paillier半同态加密算法 275
附录3 安全多方计算的SPDZ协议 285
参考文献 290
|
內容試閱:
|
“数据是新时代的石油”。石油需要经过勘探、开采、提炼才能成为石化产品,服务人类,体现价值。数据同样需要经过治理和挖掘才能产生价值。在数据治理和挖掘的过程中,数据的应用面临很多困难和挑战。解决“数据孤岛”问题是其中突出的难点。隐私保护是近年来从个人用户到政府都高度关注的内容。如何在保护个人隐私和数据安全的情况下,实现跨机构的数据联合使用,是当前大数据产业和人工智能技术应用的重要课题与探索方向。
2020年被认为是国内联邦学习和隐私保护计算的应用元年。无论是掌握丰富数据资源的互联网“大厂”,掌握大量金融数据的银行和丰富通信数据的电信企业,还是传统的提供数据服务的第三方科技公司,都开始布局联邦学习,或提出应用架构框架,或结合业务建立行业解决方案。这既是数据共享和价值挖掘有着巨大的应用需求与价值的表现,也是面对严格的法律和监管要求,数据相关工作的一种必然的选择。
联邦学习作为一种隐私保护计算技术,为数据的联合建模和价值挖掘提供了可行的解决路径,正在实践中高速发展。在金融科技发展的过程中,对于数据的跨机构联合使用有强烈的应用需求。在服务中国光大集团打造世界一流金融控股集团的战略目标过程中,特别是在服务集团数字化转型和E-SBU协同战略的实践中,光大科技有限公司作为集团科技创新的实践者,聚焦数字化、智能化,从2019年年初就开始积极跟进联邦学习的发展,加入联邦学习FATE开源社区并提交代码为社区做贡献,积极参与行业技术标准的制定。光大科技有限公司在集团协同场景中探索,并在中国光大集团数据港上打造联邦学习平台,帮助集团内成员企业实现跨机构联合数据应用。
作为金融科技行业的参与者,我们把在联邦学习上的探索和实践经验分享给业界,希望为大数据和人工智能在金融行业的落地应用、数字经济发展和国有企业数字化转型贡献一份力量。这也是我们编写本书的初心和动机。我们尝试从联邦学习发展的背景、技术方法和工具的原理、落地实践的详细过程、与金融业务相关的应用案例、应用展望等方面,多角度、多层次地展示联邦学习及其在金融科技行业应用的全貌。
在编写本书的过程中,特别是在资料收集方面,我们得到了光大科技有限公司大数据部同事的大力帮助,在此特别向张明锐、凌立、周权、魏乐、额日和、卢格润、彭成霞、原田、毕光耀、樊昕晔、李钰、王义文、解巧巧等表示衷心的感谢。本书的编写和出版得到了电子工业出版社博文视点公司石悦老师,从选题策划到布局谋篇等方面的帮助。我们也对石悦老师表达感谢。此外,我们还要特别感谢香港科技大学的杨强教授和联邦学习FATE开源社区创始人陈天健,他们阅读了本书初稿并提出了很多宝贵的意见和建议,使我们对FATE框架的介绍更加准确与深入。
后,我们还要感谢光大科技有限公司和中国光大集团,以及集团内的其他成员企业。它们鼎力支持,并提供了强大的技术平台和良好的协同环境,让我们能够终完成本书的写作。
|
|