新書推薦:
《
中文版SOLIDWORKS 2024机械设计从入门到精通(实战案例版)
》
售價:NT$
450.0
《
纯数学教程
》
售價:NT$
390.0
《
威尔士史:历史与身份的演进
》
售價:NT$
490.0
《
黄金、石油和牛油果:16件商品中的拉丁美洲发展历程
》
售價:NT$
395.0
《
母亲的选择:看不见的移民保姆与女性工作
》
售價:NT$
340.0
《
城邦政治与灵魂政治——柏拉图《理想国》中的政治哲学研究
》
售價:NT$
590.0
《
3分钟漫画墨菲定律:十万个为什么科普百科思维方式心理学 胜天半子人定胜天做事与成事的权衡博弈之道
》
售價:NT$
249.0
《
1911:危亡警告与救亡呼吁
》
售價:NT$
349.0
|
內容簡介: |
本书从机器学习的基本概念出发,系统地介绍了各种机器学习算法的原理与应用,帮助读者深入理解并灵活运用这些算法。书中强调了算法在实际问题中的应用与案例分析,通过完整的解决步骤和结果展示,使读者能够充分掌握算法建模的技术。本书涵盖了监督学习、无监督学习、半监督学习等主要机器学习算法,并结合多种常见应用场景,通过实际实例帮助读者了解算法的实现效果,提升在实际工作中的应用能力,并积累宝贵的实战经验。此外,作者分享了在机器学习领域的独特见解,为读者提供了更深层次的理解。
本书不仅适用于从事数据挖掘、文本分类、情感分析、特征选择和聚类研究等领域的研究人员、工程师和数据分析师,也可以作为学生的参考资料,为他们提供理论与实践结合的学习资源。
|
目錄:
|
第一章 机器学习算法概述
1.1 垃圾邮件分类算法
1.2 情感分类方法
1.3 噪声数据消除算法
1.4 朴素贝叶斯算法
1.5 空间密度聚类算法
1.6 数据集群存储策略
1.7 K近邻分类算法
1.8 特征选择算法
1.9 半监督混合聚类算法
1.10 本书主要研究内容
第二章 基于主动学习和否定选择的垃圾邮件分类算法研究
2.1 主动否定学习算法基本思想
2.1.1 准备工作
2.1.2 建立用户兴趣集
2.1.3 主动否定学习算法
2.2 实验结果及分析
2.2.1 数据集
2.2.2 评价标准
2.2.3 准确率和召回率分析
2.2.4 AUC分析
2.2.5 分类耗时分析
2.2.6 用户标注负担分析
2.3 本章小结
第三章 基于迁移学习的微博短文本情感分类算法研究
3.1 基本理论
3.2 新的微博短文本情感分类方法
3.2.1 基本思想
3.2.2 关键特征选择算法
3.2.3 基于迁移学习的分类算法
3.3 实验验证及分析
3.3.1 实验数据集
3.3.2 基准方法
3.3.3 实验结果及分析
3.4 本章小结
第四章 海量文本分类并行化噪声数据消除算法研究
4.1 基本理论
4.1.1 主成分分析方法
4.1.2 词频逆文档频率方法
4.1.3 噪声数据
4.2 主成分分析的消除噪声算法
4.3 实验及分析
4.3.1 实验设置
4.3.2 度量标准
4.3.3 数据集
4.3.4 结果分析
4.4 本章小结
第五章 基于粒子群优化算法的朴素贝叶斯改进算法研究
5.1 文本预处理
5.1.1 互信息算法的改进
5.1.2 改进的类别散度互信息特征评价函数
5.2 朴素贝叶斯优化算法
5.2.1 粒子群优化算法
5.2.2 粒子群优化的朴素贝叶斯算法
5.3 实验及结果分析
5.3.1 互信息参数和粒子群参数的选取
5.3.2 评价指标
5.3.3 粒子群优化的朴素贝叶斯算法验证
5.4 本章小结
第六章 基于并行计算模式的空间密度聚类改进算法研究
6.1 空间密度聚类算法改进
6.1.1 空间密度聚类算法
6.1.2 遗传算法改进方案
6.1.3 基于遗传算法的空间密度聚类算法设计与改进
6.2 基于并行计算的遗传空间密度聚类算法
6.2.1 映射过程
6.2.2 规约过程
6.3 实验结果分析总结
6.4 本章小结
第七章 一致性哈希的数据集群存储优化策略研究
7.1 一致性哈希数据存储算法
7.1.1 基本原理
7.1.2 一致性哈希算法描述
7.2 优化策略
7.2.1 数据存储空间优化调整
7.2.2 数据调整策略
7.2.3 性能分秒
7.3 实验与结果分析
7.4 本章小结
第八章 基于并行计算模式编程模型的改进K近邻分类算法研究
8.1 相关知识
8.1.1 K近邻分类算法的基本原理
8.1.2 并行计算模式框架
8.1.3 属性约简方法
8.2 改进K近邻算法
8.2.1 基于属性约简的K近邻分类算法
8.2.2 改进后的K近邻算法的并行计算模式并行化
8.3 实验分析
8.3.1 实验环境及数据
8.3.2 实验过程及分析
8.4 本章小结
第九章 一种结合改进词频的卡方统计算法和融合特征选择的随机森林算法的特征选择算法研究
9.1 传统词频的卡方统计特征选择算法
9.2 改进词频的卡方统计特征选择算法
9.2.1 特征词词频与类别相关性分析
9.2.2 结合文档频率与词频的卡方统计算法
9.3 融合特征选择的随机森林算法
9.4 分类模型构建
9.4.1 数据预处理
9.4.2 文本向量化
9.4.3 分类器训练测试
9.5 实验与结果分析
9.5.1 实验数据
9.5.2 数据预处理
9.5.3 分类性能评估
9.6 本章小结
第十章 参数自适应学习的半监督混合聚类算法
10.1 人工蜂群的聚类
10.2 半监督人工蜂群聚类算法
10.2.1 算法框架
10.2.2 改进的目标函数
10.2.3 聚类算法优化
10.2.4 参数自适应学习的半监督混合聚类算法
10.3 实验结果与分析
10.3.1 实验准备工作
10.3.2 算法验证
10.3.3 参数自适应优化实验结果
10.3.4 参数自适应学习的半监督}昆合聚类算法验证
10.4 本章小结
第十一章 总结与展望
参考文献
|
|