新書推薦:
《
560种野菜野果鉴别与食用手册
》
售價:NT$
305.0
《
中国官僚政治研究(一部洞悉中国政治制度演变的经典之作)
》
售價:NT$
286.0
《
锂电储能产品设计及案例详解
》
售價:NT$
505.0
《
首辅养成手册(全三册)(张晚意、任敏主演古装剧《锦绣安宁》原著小说)
》
售價:NT$
551.0
《
清洁
》
售價:NT$
296.0
《
组队:超级个体时代的协作方式
》
售價:NT$
352.0
《
第十三位陪审员
》
售價:NT$
245.0
《
微观经济学(第三版)【2024诺贝尔经济学奖获奖者作品】
》
售價:NT$
709.0
|
編輯推薦: |
·源于作者在加利福尼亚大学圣迭戈分校讲授的“推荐系统”和“网络挖掘”课程,在线提供代码示例和数据集,适合第一次接触机器学习相关课程的读者。 ·涵盖从电子商务到健康领域的一系列案例研究,专注于在大型的真实数据集上构建示例,提高读者为不同应用设计模型和系统的能力。 ·快速构建可行的解决方案,并涵盖广泛的方法,而不是过于深入研究某一种方法背后的理论知识,帮助读者了解构建系统时的实际考虑因素。
|
內容簡介: |
本书主要介绍支持各种设置和模态的个性化预测模型设计的通用原理和方法。首先修订“传统”机器学习模型,重点关注如何使它们适应涉及用户数据的设置,然后介绍基于矩阵分解、深度学习和生成式建模等高级原理的技术,最后详细研究部署个性化预测系统的影响和风险。
|
關於作者: |
朱利安·麦考利(Julian McAuley)加州大学圣地亚哥分校教授。他的主要研究领域是个性化机器学习,其应用范围从个性化推荐到对话、医疗保健和时装设计。他与亚马逊、Facebook、微软、Salesforce和Etsy等公司有广泛的合作,并曾获得众多奖项,包括美国国家科学基金会职业奖,以及亚马逊、Salesforce、Facebook和高通等公司的教师奖。
|
目錄:
|
译者序
前言
常用数学符号
常用缩写
第1章 引言1
1.1 本书写作目的1
1.2 对于学习者:涵盖的内容和未涵盖的内容2
1.3 对于讲师:课程和内容大纲3
1.4 在线资源4
1.5 关于作者5
1.6 日常生活中的个性化5
1.6.1 推荐5
1.6.2 个性化健康6
1.6.3 计算社会科学6
1.6.4 语言生成、个性化对话和交互式代理7
1.7 个性化技术7
1.7.1 作为流形的用户表示7
1.7.2 上下文个性化和基于模型的个性化8
1.8 个性化的伦理和影响8
第一部分 机器学习入门
第2章 回归和特征工程12
2.1 线性回归13
2.2 评估回归模型16
2.2.1 均方误差16
2.2.2 为什么是均方误差17
2.2.3 模型参数的极大似然估计18
2.2.4 决定系数R219
2.2.5 如果误差不是正态分布该怎么办20
2.3 特征工程21
2.3.1 简单特征变换21
2.3.2 二元特征和分类特征:独热编码22
2.3.3 缺失特征24
2.3.4 时序特征25
2.3.5 输出变量的转换26
2.4 解释线性模型参数27
2.5 梯度下降拟合模型28
2.6 非线性回归29
习题30
项目1:出租车小费预测(第1部分)31
第3章 分类和学习流程32
3.1 对数几率回归32
3.1.1 拟合对数几率回归器34
3.1.2 小结34
3.2 其他分类技术34
3.3 评估分类模型35
3.3.1 分类的平衡度量36
3.3.2 优化平衡错误率37
3.3.3 使用和评估用于排名的分类器38
3.4 学习流程41
3.4.1 泛化、过拟合和欠拟合41
3.4.2 模型复杂度和正则化43
3.4.3 模型流程准则46
3.4.4 使用TensorFlow的回归和分类47
3.5 实现学习流程48
习题51
项目2:出租车小费预测(第2部分)52
第二部分 个性化机器学习的
基础知识
第4章 推荐系统简介54
4.1 基本设置和问题定义54
4.2 交互数据的表示56
4.3 基于记忆的推荐方法57
4.3.1 定义相似度函数57
4.3.2 杰卡德相似度58
4.3.3 余弦相似度60
4.3.4 皮尔逊相似度62
4.3.5 使用相似度测量方法进行评分预测64
4.4 随机游走方法65
4.5 案例研究:Amazon.com的推荐67
习题68
项目3:针对书籍的推荐系统
(第1部分)69
第5章 基于模型的推荐方法70
5.1 矩阵分解71
5.1.1 拟合潜在因子模型73
5.1.2 用户特征或物品特征发生了什么变化75
5.2 隐式反馈和排序模型76
5.2.1 样本重加权方案76
5.2.2 贝叶斯个性化排序77
5.3 基于“无用户”模型的方法79
5.3.1 稀疏线性方法80
5.3.2 分解的物品相似度模型81
5.3.3 其他无用户方法81
5.4 评估推荐系统82
5.4.1 精确率@K和召回率@K83
5.4.2 平均倒数排名83
5.4.3 累积增益和NDCG84
5.4.4 模型准确率之外的评估指标84
5.5 用于推荐的深度学习84
5.5.1 为什么是内积84
5.5.2 基于多层感知机的推荐85
5.5.3 基于自编码器的推荐87
5.5.4 卷积和循环网络88
5.5.5 基于深度学习的推荐器能多有效88
5.6 检索89
5.7 在线更新90
5.8 Python中带有Surprise库和Implicit库的推荐系统90
5.8.1 潜在因子模型91
5.8.2 贝叶斯个性化排序91
5.8.3 在TensorFlow中实现潜在因子模型92
5.8.4 TensorFlow中的贝叶斯个性化排序92
5.8.5 基于批处理的高效优化93
5.9 超越推荐的“黑箱”观点94
5.10 历史和新兴方向94
习题95
项目4:针对书籍的推荐系统
(第2部分)96
第6章 推荐系统中的内容和结构97
6.1 分解机98
6.1.1 神经因子分解机99
6.1.2 在Python中使用FastFM的分解机99
6.2 冷启动推荐100
6.2.1 用边信息解决冷启动问题101
6.2.2 通过问卷解决冷启动问题101
6.3 多边推荐102
6.3.1 在线交友102
6.3.2 易货平台103
6.4 群体感知推荐和社交感知推荐104
6.4.1 社交感知推荐104
6.4.2 社交贝叶斯个性化排序106
6.4.3 群体感知推荐107
6.4.4 群体贝叶斯个性化排序108
6.5 推荐系统中的价格动态109
6.5.1 分离价格和偏好109
6.5.2 在会话中估计愿意支付的价格110
6.5.3 价格敏感性和价格弹性111
6.6 推荐中的其他上下文特征112
6.6.1 音乐和音频112
6.6.2 基于位置的网络中的推荐113
6.6.3 时序、文本和视觉特征114
6.7 在线广告114
6.7.1 匹配问题115
6.7.2 AdWords115
习题117
项目5:Amazon上的冷启动推荐118
第7章 时序和序列模型119
7.1 时间序列回归简介119
7.2 推荐系统中的时序动态121
7.2.1 时序推荐方法122
7.2.2 案例研究:时序推荐和Netflix竞赛123
7.2.3 关于时序模型Netflix能教会我们什么126
7.3 时序动态的其他方法126
7.3.1 意见的长期动态127
7.3.2 短期动态和基于会话的推荐127
7.3.3 用户层面的时间演变128
7.4 个性化马尔可夫链129
7.5 案例研究:用于推荐的马尔可夫链模型130
7.5.1 分解的个性化马尔可夫链130
7.5.2 社交感知的序列推荐131
7.5.3 基于局部性的序列推荐132
7.5.4 基于平移的推荐133
7.5.5 TensorFlow实现FPMC134
7.6 循环网络135
7.7 基于神经网络的序列推荐137
7.7.1 基于循环网络的推荐139
7.7.2 注意力机制139
7.7.3 小结140
7.8 案例研究:个性化心率建模141
7.9 个性化时序模型的历史142
习题142
项目6:商业评论中的时序和
序列动态143
第三部分 个性化机器学习的
新兴方向
第8章 文本个性化模型146
8.1 文本建模基础:词袋模型146
8.1.1 情感分析146
8.1.2 N-gram149
8.1.3 词相关性和文档相似度151
8.1.4 使用tf-idf进行搜索和检索153
8.2 分布式词和物品表示153
8.2.1 item2vec155
8.2.2 使用Gensim实现word2vec和item2vec155
8.3 个性化情感和推荐156
8.4 个性化文本生成158
8.4.1 基于RNN的评论生成160
8.4.2 案例研究:个性化食谱生成161
8.4.3 基于文本的解释和证明162
8.4.4 对话式推荐163
8.5 案例研究:Google Smart Reply165
习题166
项目7:个性化文档检索167
第9章 视觉数据个性化模型168
9.1 个性化图像搜索和检索168
9.2 视觉感知推荐和个性化排序169
9.3 案例研究:视觉和时尚兼容性171
9.3.1 从共同购买中估计兼容性171
9.3.2 在开放场景的图像中学习兼容性173
9.3.3 生成时尚衣柜174
9.3.4 时尚之外的领域175
9.3.5 可替代和互补产品推荐的其他技术175
9.3.6 在TensorFlow中实现兼容模型177
9.4 图像的个性化生成模型178
习题179
项目8:生成兼容的服装搭配180
第10章 个性化机器学习的影响182
10.1 度量多样性183
10.2 过滤气泡、多样性和极端化184
10.2.1 通过模拟探索多样性184
10.2.2 实证度量推荐多样性185
10.2.3 审核极端内容的途径185
10.3 多样化技术186
10.3.1 最大边缘相关186
10.3.2 多样化推荐的其他重排序方法187
10.3.3 行列式点过程187
10.4 实现一个多样化推荐器189
10.5 关于推荐和消费多样性的案例研究191
10.5.1 Spotify上的多样性191
10.5.2 过滤气泡和在线新闻消费192
10.6 准确率之外的其他指标194
10.6.1 惊喜度194
10.6.2 意外度195
10.6.3 校准196
10.7 公平性197
10.7.1 多方面公平性198
10.7.2 在TensorFlow中实现公平性目标199
10.8 关于推荐中性别偏置的案例研究200
10.8.1 数据重采样和流行度偏置200
10.8.2 书籍推荐中的偏置和作者性别201
10.8.3 营销中的性别偏置201
习题202
项目9:多样性和公平推荐203
参考文献204
|
內容試閱:
|
前 言
Personalized Machine Learning
我们每天都在与机器学习系统进行交互,它为我们的娱乐、社交关系、购物和健康提供了个性化的预测。这些交互过程会涉及一些数据模态,从点击序列到文本、图像和社交互动。本书介绍了支持各种设置和模态的个性化预测模型设计的通用原理和方法。
本书首先修订了“传统”机器学习模型,重点关注如何使它们适应涉及用户数据的设置,然后介绍了基于矩阵分解、深度学习和生成模型等高级原理的技术,最后详细研究了部署个性化预测系统的影响和风险。
从电子商务到健康等领域的一系列案例研究,加上实践项目和代码示例,将会帮助读者了解和体验大规模的真实世界数据集,提高为众多应用设计模型和系统的能力。
|
|