新書推薦:
《
泉舆日志 幻想世界宝石生物图鉴
》
售價:NT$
611.0
《
养育女孩 : 官方升级版
》
售價:NT$
230.0
《
跨界:蒂利希思想研究
》
售價:NT$
500.0
《
千万别喝南瓜汤(遵守规则绘本)
》
售價:NT$
203.0
《
大模型启示录
》
售價:NT$
510.0
《
东法西渐:19世纪前西方对中国法的记述与评价
》
售價:NT$
918.0
《
养育男孩:官方升级版
》
售價:NT$
230.0
《
小原流花道技法教程
》
售價:NT$
500.0
|
編輯推薦: |
(1)作者背景资深:阿里巴巴高级技术专家,负责淘宝电商广告流量反作弊和内容风控业务的算法工程方向,曾就职于百度和第四范式。(2)作者经验丰富:深耕互联网广告与营销行业一线多年,对流量反作弊和内容风控背后的利益链条和攻防博弈有丰富的实践经验。(3)业务与技术结合:从业务角度深入剖析广告与营销领域的黑灰产业链,以及商家、渠道、用户、平台等不同参与方的利益链;从技术角度详细讲解各种风控技术,并提供一套立体的风控技术解决方案。(4)图解呈现,通俗易懂:重要的、复杂的知识点全部以图解方式呈现,让读者一看就懂,一学就会。(5)行业知名专家推荐:阿里云前首席安全科学家吴翰清、第四范式创始人兼CEO戴文渊等行业知名专家联袂推荐。
|
內容簡介: |
内容简介本书从技术和业务角度全面阐述互联网广告与营销的黑灰产业链,以及应对各种风险的风控思路和解决方案。在业务层面,结合行业发展现状以及当前AIGC技术快速爆发的背景,对广告与营销领域的黑灰产业链进行了深入剖析,特别是人、货、场之间的博弈关系,以及商家、渠道、用户、平台等不同参与方的利益链等。在技术层面,基于前置的业务剖析,深入探讨了基于概率统计、近邻算法、图分析和时序分析等异常检测方法,并结合内容风控技术,提供了一套立体的面向互联网广告与营销场景的风控解决方案。每一章都结合了理论与实践,通过丰富的案例分析,帮助读者深入理解风控技术的应用,并掌握如何应对AIGC时代广告与营销领域的新挑战。本书的读者对象包括互联网广告与营销行业的算法、工程、运营、产品从业者,既包括正向的搜索、推荐、广告业务人员,也包括负向的风险控制业务方向,以及广告报表、结算、埋点、归因等中间数据团队人员。此外,对互联网安全攻防感兴趣的爱好者、开设相关课程的在校师生也可阅读本书。通过阅读本书,你可以收获以下知识。(1)互联网广告的发展历程和演变过程,以及常见的互联网广告形态。(2)互联网广告与营销领域背后的攻防博弈和黑灰产利益链。(3)基于概率统计、近邻相似检索、图关系分析、时序序列等异常检测方法。(4)图像、文本、视频、直播等多媒体内容安全识别方法。(5)在线、近线、离线互补的风控系统架构,风控领域MLOps循环。(6)AIGC技术爆发下的新风险对抗思路。希望读者朋友在本书中,能够找到和自己业务或研究方向相匹配的内容,知行合一,把书中介绍的方法应用到自身具体的业务场景,让知识发挥更大的价值,一起“建设更安全的互联网”!
|
關於作者: |
王东旭
毕业于北京邮电大学,师从国内著名安全组织“幻影旅团”成员luoluo,在2013年通过为多家厂商挖掘、提报安全漏洞成为WooYun社区白帽子。先后在百度垂直搜索部、第四范式先知机器学习平台任职,目前担任阿里巴巴高级技术专家,负责淘宝电商广告流量反作弊和内容风控业务的算法工程方向工作,深耕互联网广告与营销行业一线,对流量反作弊和内容风控背后的利益链条和攻防博弈有丰富的实践经验,带领团队完成了风控引擎的全面升级,打造了百亿流量规模在线、近线、离线互补的互联网电商风控系统。
|
目錄:
|
前 言
第1章 互联网广告与营销1
1.1 营销、广告与流量1
1.1.1 营销、广告、流量的定义2
1.1.2 流量的价值3
1.1.3 流量商业化变现模式3
1.1.4 自然流量和广告流量6
1.1.5 流量质量和无效流量7
1.2 互联网广告营销基础知识9
1.2.1 互联网广告发展史10
1.2.2 主流广告形式11
1.2.3 广告营销参与方14
1.2.4 归因分析模型17
1.2.5 计费方式和作弊风险20
1.3 互联网广告营销形势23
1.3.1 营收发展形势24
1.3.2 新媒体创新形势25
1.3.3 监管合规形势26
1.4 本章小结27
第2章 广告与营销黑灰产业链28
2.1 营销的人、货、场28
2.1.1 人:用户需求29
2.1.2 货:精准获客30
2.1.3 场:流量为王30
2.2 广告与营销的利益链31
2.2.1 商家视角的利益和风险32
2.2.2 渠道视角的利益和风险43
2.2.3 用户视角的利益和风险48
2.2.4 平台视角的利益和风险51
2.3 黑灰产作弊上下游链路55
2.3.1 黑灰产上游55
2.3.2 黑灰产中游63
2.3.3 黑灰产下游65
2.4 本章小结66
第3章 广告与营销领域的立体风控思路67
3.1 广告与营销风控范畴67
3.1.1 流量反作弊67
3.1.2 内容风控68
3.2 风控业务生命周期70
3.2.1 事前阶段71
3.2.2 事中阶段73
3.2.3 事后阶段75
3.3 风控立体防御体系77
3.3.1 在线风控78
3.3.2 近线风控81
3.3.3 离线风控83
3.4 风控MLOps84
3.4.1 什么是风控MLOps85
3.4.2 风控MLOps流水线85
3.5 本章小结88
第4章 异常检测技术概述90
4.1 什么是异常检测90
4.1.1 有监督异常检测91
4.1.2 半监督异常检测91
4.1.3 无监督异常检测92
4.2 异常检测面临的问题和挑战92
4.2.1 异常的稀疏性92
4.2.2 异常的多样性93
4.2.3 异常的对抗性95
4.2.4 异常检测的鲁棒性96
4.2.5 异常检测的可解释性97
4.2.6 异常检测的可控制性99
4.3 基于规则的异常检测99
4.3.1 基于名单的规则99
4.3.2 基于窗口聚合的规则100
4.4 基于模型的异常检测101
4.5 本章小结102
第5章 基于概率统计的异常检测103
5.1 异常检测中的概率知识103
5.1.1 抛硬币问题103
5.1.2 独立同分布104
5.1.3 离散概率分布104
5.1.4 连续概率分布109
5.2 拟合优度114
5.2.1 卡方检验114
5.2.2 G检验116
5.2.3 K-S检验118
5.3 极值分析和尾概率约束119
5.3.1 马尔可夫不等式119
5.3.2 切比雪夫不等式121
5.3.3 切尔诺夫界123
5.3.4 中心极限定理124
5.4 多维随机变量异常检测125
5.4.1 COPOD126
5.4.2 ECOD134
5.5 集成决策方法135
5.5.1 Bagging135
5.5.2 Boosting136
5.5.3 Stacking137
5.6 本章小结138
第6章 基于近邻的异常检测139
6.1 LOF139
6.1.1 算法原理139
6.1.2 刷单骗补应用案例142
6.2 KNN144
6.2.1 K近邻分类144
6.2.2 K近邻距离度量145
6.3 ANN151
6.3.1 风险向量表示方法153
6.3.2 风险向量检索算法163
6.3.3 相似风险检索业务应用168
6.4 近邻聚类169
6.4.1 K-Means169
6.4.2 DBSCAN172
6.5 本章小结174
第7章 基于图的异常检测175
7.1 什么是图175
7.1.1 图的基本概念176
7.1.2 图的分类177
7.1.3 作弊图的构建分析178
7.2 作弊社区发现181
7.2.1 标签传播181
7.2.2 连通分量182
7.2.3 Louvain187
7.2.4 Fraudar190
7.3 图嵌入193
7.3.1 为什么需要图嵌入193
7.3.2 图嵌入方法194
7.3.3 风控应用场景202
7.4 本章小结207
第8章 基于时序的异常检测208
8.1 风控中的时序特征208
8.1.1 什么是时序特征208
8.1.2 时序特征工程210
8.2 基于时序的异常检测算法214
8.2.1 统计类算法215
8.2.2 深度学习类算法222
8.3 CEP技术226
8.4 本章小结228
第9章 内容风控技术229
9.1 文本风控230
9.1.1 关键词过滤230
9.1.2 文本分类237
9.1.3 相似文本检索242
9.2 图像风控246
9.2.1 图像分类247
9.2.2 图像检测251
9.2.3 图像检索253
9.2.4 OCR技术253
9.3 短视频和直播风控257
9.3.1 视频抽帧257
9.3.2 关键帧提取260
9.3.3 视频相似检索263
9.3.4 直播间风控264
9.4 本章小结268
第10章 广告与营销风控未来思考269
10.1 业务:理解业务,服务于业务269
10.2 数据:合规埋点和科学归因271
10.3 算法:经验驱动和数据驱动相结合274
10.4 系统:在线、近线、离线互补,可持续的架构277
10.5 AIGC:带来的新挑战279
10.6 本章小结281
|
內容試閱:
|
为何写作本书
十年前的一个上午,我参加了一场面试,面试官是国内安全组织“幻影旅团”和“80sec”的核心成员luoluo。那天,我第一次知道了黑客杂志Phrack,通过luoluo接触到道哥和他的《白帽子讲Web安全》,获赠签名“建设更安全的互联网”,这些深深地影响了年少的我。后来,我逐渐参与到Wooyun社区中,通过挖掘Web漏洞并被多家厂商采纳而成为白帽子(白客)。
我再次回到安全这个领域的时候,聚焦于互联网广告与营销风控行业,阅读了很多相关的书籍,发现市面上相关图书大多以平台视角来介绍风控思路,而鲜有对广告、营销、流量业务,以及流量背后的参与角色攻防动机的剖析。这些知识零散分布在互联网的各个角落里,想深入研究的读者往往只能碎片化地获取,这间接地使行业的学习曲线异常陡峭。
此外,广告与营销行业的迅速发展,诸如短视频和直播带货、“社交 电商”模式崛起、全域流量推广、AIGC(生成式人工智能)技术爆发等,也让过去传统单一的搜索广告、推荐广告不足以满足商家和广告主日益增长的营销推广诉求,而变化的背后暗藏着作弊和对抗。为了应对行业的新业务风险、新技术挑战,我们有必要打开思路,探索更适合特定领域的风控解决方案。
因此,我撰写了本书。本书是一本从广告与营销业务实践视角出发介绍风控技术的书籍,希望能通过业务和技术的结合,更加结构化地剖析领域问题和应对的技术思路,帮助对广告与营销风控感兴趣的读者建立更加完善、更加体系化的业务认识,并使其掌握更多风控问题的解决思路。同时,希望本书能够像十年前道哥的赠言一样,帮助更多有志于“建设更安全的互联网”的读者快速成长,成为行业的中坚力量。
请读者注意,方法只是工具,不能形而上学,对风险的业务认识、特征抽象才是本质。由于行业风控特征的敏感性,本书并未深入剖析,请读者在学习方法的同时将其和自身的具体业务场景相结合,灵活应用。
本书读者对象
本书面向的主要受众是互联网广告与营销风控行业的从业者、上下游合作方,以及对互联网攻防感兴趣的群体。根据工作性质,读者群体划分如下:
●互联网广告与营销风控行业或相关行业的从业者,包括技术、产品、运营人员等。
●互联网广告与营销行业的上下游合作方,如广告需求方、流量供给方、数据平台等。
●对互联网攻防,尤其是广告与营销领域攻防感兴趣,并致力于通过技术建设更安全的互联网环境的爱好者。
●开设相关课程的学校的师生。
本书主要内容
本书共10章。
第1章和第2章从互联网广告与营销业务出发,介绍了营销、广告、流量相关的基础知识,从流量背后的利益动机引申出无效流量,以及营销漏斗中各个环节的常见作弊手段和黑灰产业链,目的是帮助没有任何基础的读者快速入门。
第3章和第4章从相对宏观的视角概述了行业风控的范畴、立体的风控思路,并由浅入深地阐述了异常检测面临的难点和挑战,以及常见的异常检测方法。
第5~9章通过理论和实践相结合的方式,在前4章的基础上,更加结构化地介绍了基于概率统计的异常检测方法、基于近邻的异常检测方法、基于图和时序的异常检测方法、内容风控技术等。
第10章是我对行业未来发展的一些思考,包括业务、数据、算法、系统和AIGC等行业的动向,帮助有需要的读者提前做好规划。
本书各章内容相对独立,读者可以根据自己的实际情况选取相应的章节阅读。
本书内容特色
本书采取业务和技术相结合的方式进行内容编排。
●业务层面。本书聚焦于广告与营销领域,从主流业务机制出发,剖析了行业发展背后的利益动机,以及人、货、场三个视角的作弊产业链和风控面临的挑战。
●技术层面。从流量(行为)反作弊和内容风控两个视角,结合领域业务风险问题,由浅入深地介绍了传统规则风控方法、基于概率统计的异常检测方法、基于近邻的异常检测方法、基于图和时序的异常检测方法,以及内容风控技术。
勘误
本书涉及的研究工作和公司无关,文中观点为个人观点,不代表公司观点。
由于我的写作水平有限,书中难免会出现一些错误或者表述不准确的地方,尤其是在互联网广告与营销业务迅速发展的背景下。在写作过程中,我更觉得个人的所见所知仅仅是行业的冰山一角,很多作弊手法、利益博弈以及背后的产业链都还没来得及去深入实践,书中表述难免片面,恳请读者朋友批评指正。联系邮箱:wdxbupt2009@gmail.com。
致谢
写这本书不是一蹴而就的,用了近两年的时间。书中的很多想法从不成熟,到拨云见雾,又到自我质疑,写的内容越多,越觉得自己认识的东西越少,对行业也更加敬畏。
感谢luoluo带我进入安全这个领域,感谢大师带我回到安全这个领域。除了专业技术以外,他们带给我更多的是对安全的热爱和执着。写作过程中还有很多同事、朋友对内容进行了指导,在此一并致谢。
感谢家人的支持,工作之余,我额外挤出近两年时间写作,占用了很多本该陪伴他们的时间。尤其是我的妻子一一,在写作过程中,她除了陪伴和支持,还从法律和经济学的专业视角,让我更加笃定在宏观周期和微观个体的关系中应该坚持自己热爱的事情,就像我们孩子的平衡车课的标语:“唯有热爱,方能始终。”
|
|