新書推薦:
《
那本书是(吉竹伸介与又吉直树 天才联动!)
》
售價:NT$
454.0
《
传播的跃迁:人工智能如何革新人类的交流
》
售價:NT$
505.0
《
纯粹·古代中国的历史与制度
》
售價:NT$
286.0
《
生活来来往往 别等来日方长 新版(伍佰:“讲好了这一辈子,再度重相逢。”别等,别遗憾!珍惜当下才是最好的解药)
》
售價:NT$
265.0
《
一个英国军事顾问眼中的二战
》
售價:NT$
1265.0
《
就业、利息和货币通论(徐毓枬译本)(经济学名著译丛)
》
售價:NT$
306.0
《
瘦肝
》
售價:NT$
454.0
《
股票大作手回忆录
》
售價:NT$
254.0
|
編輯推薦: |
由于目前尚没有发现从理论本质到设计原理以及实施方案角度全程对敏感数据防泄漏方法进行揭示的书籍,特点主要有:
(1)或将成为最早揭示敏感数据防泄漏统一模型所涉及的从系统架构到相关理论技术的书籍;
(2)将综合包含机器学习、可信计算平台、数据库安全以及安全协议等部分最新的研究成果;
(3)书中实现和实施的部分将围绕着安全中间件的模式进行详细介绍;
(4)是理论和实践方案的结合,既不缺乏理论基础,也不会缺乏设计和实施细节,有利于读者了解数据防泄漏保护的本质。
|
內容簡介: |
《基于支持向量机的聚类及文本分类关键技术研究》在国内外已有相关工作成果的基础上,研究了以支持向量机理论为基础的聚类分析方法及文本分类中的关键技术,内容涉及模型基本原理、参数分析、数据预处理、聚类分析关键问题与改进及文本表示策略等,旨在系统地总结作者近年来在该领域的研究工作,并帮助读者快速了解影响支持向量聚类和分类器的关键因素及发挥优势、规避局限的分析方法和改进思路。全书共分为6章,第1章为绪论;第2章介绍支持向量机理论基础,并重点总结和分析了支持向量机分类机、聚类器及回归机的研究现状;第3章先给出了噪声数据定义及其消除算法,后引入簇原型思想建立了双质心支持向量聚类算法;第4章进一步分析了原型对簇标定的影响,论证了在特征空间对数据集进行凸分解的可行性及分解后影响簇连接性判断准确率的原因,并提出了基于凸分解的簇标定算法;第5章提出了直接用簇边界样本构造支持函数的快速支持向量聚类算法,并通过文本聚类和P2P流量分析实验验证了算法的有效性;第6章通过对最大间隔原理、结构化风险与数据集可分性的关系和文本表示关键问题的分析,以丰富文本向量所携带信息量为目的,从多个角度提出了对基于支持向量机的文本分类性能提升方案。最后为全书总结和在本领域进一步研究的建议。
《基于支持向量机的聚类及文本分类关键技术研究》可供从事机器学习、文本分类相关理论及应用研究,尤其对支持向量机相关研究感兴趣的科研、教学和工程技术人员参考。
|
目錄:
|
第1章 绪论
1.1 引言
1.2 机器学习理论
1.2.1 无监督学习
1.2.2 有监督学习
1.2.3 半监督学习
1.2.4 增强学习
1.3 支持向量机与聚类分析
1.4 支持向量机与文本分类
1.5 本书的主要工作
第2章 支持向量机技术基础
2.1 引言
2.2 统计学习理论
2.3 支持向量机技术
2.3.1 支持向量分类机
2.3.2 L2-支持向量机
2.3.3 多类问题的决策方法
2.3.4 支持向量回归机模型
2.3.5 支持向量机研究现状
2.4 支持向量聚类
2.4.1 支持向量聚类模型
2.4.2 影响支持向量聚类的关键因素
2.5 本章小结
第3章 双质心支持向量聚类
3.1 引言
3.2 噪声数据点消除策略
3.2.1 噪声数据分布结构分析
3.2.2 噪声数据消除算法
3.3 双质心簇标定策略
3.3.1 簇的分解策略
3.3.2 单组件双质心的构造
3.3.3 成员关系的判定规则
3.3.4 算法描述
3.4 DBC时间性能分析
3.5 聚类实验分析
3.5.1 数据集
3.5.2 实验对比算法
3.5.3 噪声数据消除实验
3.5.4 DBC聚类效果测试
3.5.5 DBC整体性能测试
3.5.6 DBC模型的半监督应用测试
3.6 本章小结
第4章 基于凸分解的簇标定算法
4.1 引言
4.2 基于凸分解的簇标定算法
4.2.1 簇在特征空间中的凸性质
4.2.2 支持超凸多面体的凸分解
4.2.3 凸包的标定算法
4.2.4 标定非凸包样本
4.3 CDCL算法时间性能分析
4.4 聚类实验分析
4.4.1 数据集
4.4.2 实验对比算法
4.4.3 CDCL算法适应能力分析
4.4.4 CDCL算法整体性能测试
4.5 本章小结
第5章 快速支持向量聚类算法
5.1 引言
5.2 快速支持向量聚类算法FASVC
5.2.1 选择簇边界样本
5.2.2 构造超球面
5.2.3 自适应的簇标定策略
5.2.4 FASVC算法的实现
5.3 FASVC时间性能及特点分析
5.3.1 FASVC时间性能分析
5.3.2 FASVC算法特点
5.4 聚类实验分析
5.4.1 数据集
5.4.2 实验对比算法
5.4.3 FASVC参数敏感性测试
5.4.4 FASVC算法整体性能测试
5.4.5 利用FASVC进行文本聚类
5.4.6 利用FASVC识别P2P流量
5.5 本章小结
第6章 基于支持向量机的多模式文本分类研究
6.1 引言
6.2 文本表示的关键问题与启示
6.2.1 场景1:特征的文档频率之外的信息
6.2.2 场景2:最大值保留的特征权重与特征的多类别分布信息
6.2.3 场景3:文本的结构信息
6.3 基于支持向量机的多模式文本分类方案
6.3.1 自适应的文本块划分算法
6.3.2 兼顾类别贡献度和类间区分度的特征权重方案
6.3.3 融合多类别倾向的特征类间区分能力强化方案
6.3.4 基于文本块重要性分布加权的特征频率方案
6.4 分类实验分析
6.4.1 数据集
6.4.2 实验对比方案
6.4.3 评价指标
6.4.4 CCE方案实验结果与分析
6.4.5 C2TCTVT算法框架实验结果与分析
6.4.6 NWET与N2WET组合方案实验结果与分析
6.5 本章小结
结束语
参考文献
名词索引
|
|