登入帳戶  | 訂單查詢  | 購物車/收銀台( 0 ) | 在線留言板  | 付款方式  | 聯絡我們  | 運費計算  | 幫助中心 |  加入書簽
會員登入 新註冊 | 新用戶登記
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2023年度TOP分類閱讀雜誌 香港/國際用戶
最新/最熱/最齊全的簡體書網 品種:超過100萬種書,正品正价,放心網購,悭钱省心 送貨:速遞 / EMS,時效:出貨後2-3日

2024年08月出版新書

2024年07月出版新書

2024年06月出版新書

2024年05月出版新書

2024年04月出版新書

2024年03月出版新書

2024年02月出版新書

2024年01月出版新書

2023年12月出版新書

2023年11月出版新書

2023年10月出版新書

2023年09月出版新書

2023年08月出版新書

2023年07月出版新書

『簡體書』大数据挖掘与应用(第二版)

書城自編碼: 3849747
分類: 簡體書→大陸圖書→教材研究生/本科/专科教材
作者: 王振武
國際書號(ISBN): 9787302628323
出版社: 清华大学出版社
出版日期: 2023-03-01

頁數/字數: /
書度/開本: 16开 釘裝: 平装

售價:NT$ 342

我要買

share:

** 我創建的書架 **
未登入.



新書推薦:
神经形态光子学 Neuromorphic Photonics
《 神经形态光子学 Neuromorphic Photonics 》

售價:NT$ 879.0
困顿与超越 : 心理学家的逆境人生与智慧指引
《 困顿与超越 : 心理学家的逆境人生与智慧指引 》

售價:NT$ 307.0
Web3时代的AI战略:构建BASICs框架,引领企业数字化转型
《 Web3时代的AI战略:构建BASICs框架,引领企业数字化转型 》

售價:NT$ 411.0
一岁一喜欢
《 一岁一喜欢 》

售價:NT$ 223.0
巨浪:生成式AI的史诗与现实
《 巨浪:生成式AI的史诗与现实 》

售價:NT$ 416.0
萧条中的生存智慧与策略(套装2册)
《 萧条中的生存智慧与策略(套装2册) 》

售價:NT$ 519.0
饮食的迷思:关于营养、健康和遗传的科学真相(2024修订版)
《 饮食的迷思:关于营养、健康和遗传的科学真相(2024修订版) 》

售價:NT$ 359.0
未来科技大爆炸
《 未来科技大爆炸 》

售價:NT$ 311.0

建議一齊購買:

+

NT$ 715
《 诊断学(第9版/本科临床/配增值) 》
+

NT$ 568
《 罗宾斯 管理学(第15版)(工商管理经典译丛) 》
+

NT$ 342
《 大学生创新创业理论与实践 》
+

NT$ 568
《 货币金融学(第十二版)(经济科学译丛) 》
+

NT$ 244
《 大学生职业生涯规划(慕课版 第3版) 》
+

NT$ 274
《 统计学(第8版) 》
編輯推薦:
本书内容在安排上循序渐进,对大数据挖掘的基本算法进行了详细的讲解。本书最大的特点是理论与实践相结合,算法理论与产业一线实践相结合,全书几乎所有的算法都配有实例和基于阿里云数加平台的演示,这种理论与实际相结合的方法克服了只重理论轻实践的内容组织方式,大大方便了读者的理解。
內容簡介:
本书对大数据挖掘与应用的基本算法进行了系统的介绍,每种算法不仅包括对算法基本原理的介绍,而且配有大量的例题以及基于阿里云大数据平台(数加平台)的演示,这种理论与实践相结合的方式极大地方便了读者对抽象的数据挖掘算法的理解和掌握。 本书共11章,内容覆盖了数据预处理、分类算法、聚类算法及常见的数据挖掘应用,具体章节包括大数据简介、数据预处理技术、逻辑回归方法、KNN算法、朴素贝叶斯分类算法、随机森林分类算法、支持向量机、 Kmeans聚类算法,以及社交网络分析方法及应用、文本分析方法及应用和推荐系统方法及应用等内容。 本书可作为高等院校数据挖掘课程的教材,也可作为数据挖掘及相关工程技术工作人员的参考书。
目錄
第一篇基础篇
第1章大数据简介
1.1大数据
1.1.1大数据的定义
1.1.2大数据的特点
1.1.3大数据处理的挑战
1.2大数据挖掘
1.2.1大数据挖掘的定义
1.2.2大数据挖掘的特点
1.3大数据挖掘的相关方法
1.3.1数据预处理技术
1.3.2关联规则挖掘
1.3.3分类
1.3.4聚类
1.3.5孤立点挖掘
1.3.6演变分析
1.3.7特异群组分析
1.4大数据挖掘类型
1.4.1Web数据挖掘
1.4.2空间数据挖掘
1.4.3流数据挖掘
1.5大数据挖掘的常见应用
1.5.1社交网络分析
1.5.2文本分析
1.5.3推荐系统
1.6常用的大数据统计分析方法
1.6.1百分位
1.6.2皮尔森相关系数
1.6.3直方图
1.6.4T检验
1.6.5卡方检验
1.7常用的大数据挖掘评估方法
1.8大数据平台相关技术
1.8.1分布式存储技术
1.8.2分布式任务调度技术
1.8.3并行计算技术
1.8.4其他技术
1.9大数据平台实例——阿里云数加平台
1.9.1数加平台简介
1.9.2数加平台产品简介
1.9.3数加平台优势特色
1.9.4机器学习平台简介
1.9.5机器学习平台功能
1.9.6机器学习平台操作流程
1.10小结
思考题
第二篇技术篇
第2章数据预处理技术
2.1数据预处理的目的
2.2数据采样
2.2.1加权采样
2.2.2随机采样
2.2.3分层采样
2.3数据清理
2.3.1填充缺失值
2.3.2光滑噪声数据
2.3.3数据清理过程
2.4数据集成
2.4.1数据集成简介
2.4.2常用数据集成方法
2.5数据变换
2.5.1数据变换简介
2.5.2数据规范化
2.6数据归约
2.6.1数据立方体聚集
2.6.2维归约
2.6.3数据压缩
2.6.4数值归约
2.6.5数据离散化与概念分层
2.7特征选择
2.7.1特征选择简介
2.7.2Relief算法
2.7.3Fisher判别法
2.7.4基于GBDT的过滤式特征选择
2.8特征提取
2.8.1特征提取简介
2.8.2DKLT特征提取方法
2.8.3主成分分析法
2.9基于阿里云数加平台的数据采样与特征选择实例
2.10小结
思考题
第3章逻辑回归方法
3.1基本概念
3.1.1回归概述
3.1.2线性回归简介
3.2逻辑回归
3.2.1二分类逻辑回归
3.2.2多分类逻辑回归
3.2.3逻辑回归应用举例
3.2.4逻辑回归方法的特点
3.2.5逻辑回归方法的应用
3.3逻辑回归源代码结果分析
3.3.1线性回归
3.3.2多分类逻辑回归
3.4基于阿里云数加平台的逻辑回归实例
3.4.1二分类逻辑回归应用实例
3.4.2多分类逻辑回归应用实例
3.5小结
思考题
第4章KNN算法
4.1KNN算法简介
4.1.1KNN算法原理
4.1.2KNN算法应用举例
4.2KNN算法的特点及改进
4.2.1KNN算法的特点
4.2.2KNN算法的改进策略
4.3KNN源代码结果分析
4.4基于阿里云数加平台的KNN算法应用实例
4.5小结
思考题
第5章朴素贝叶斯分类算法
5.1基本概念
5.1.1主观概率
5.1.2贝叶斯定理
5.1.3朴素贝叶斯分类模型
5.1.4朴素贝叶斯分类器实例分析
5.2朴素贝叶斯算法的特点及应用
5.2.1朴素贝叶斯算法的特点
5.2.2朴素贝叶斯算法的应用场景
5.3朴素贝叶斯源代码结果分析
5.4基于阿里云数加平台的朴素贝叶斯实例
5.5小结
思考题
第6章随机森林分类算法
6.1随机森林算法简介
6.1.1随机森林算法原理
6.1.2随机森林算法应用举例
6.2随机森林算法的特点及应用
6.2.1随机森林算法的特点
6.2.2随机森林算法的应用
6.3随机森林算法源程序结果分析
6.4基于阿里云数加平台的随机森林分类实例
6.5小结
思考题
第7章支持向量机
7.1基本概念
7.1.1支持向量机理论基础
7.1.2统计学习核心理论
7.1.3学习过程的一致性条件
7.1.4函数集的VC维
7.1.5泛化误差界
7.1.6结构风险最小化归纳原理
7.2支持向量机原理
7.2.1支持向量机核心理论
7.2.2最大间隔分类超平面
7.2.3支持向量机
7.2.4核函数分类
7.3支持向量机的特点及应用
7.3.1支持向量机的特点
7.3.2支持向量机的应用
7.4支持向量机分类实例分析
7.5基于阿里云数加平台的支持向量机分类实例
7.6小结
思考题
第8章Kmeans聚类算法
8.1Kmeans聚类算法原理
8.1.1Kmeans聚类算法原理解析
8.1.2Kmeans聚类算法应用举例
8.2Kmeans聚类算法的特点及应用
8.2.1Kmeans聚类算法的特点
8.2.2Kmeans聚类算法的应用
8.3K均值聚类算法源程序结果分析
8.4基于阿里云数加平台的K均值聚类算法实例
8.5基于MaxCompute Graph模型的Kmeans算法源程序分析
8.6小结
思考题
第三篇综合应用篇
第9章社交网络分析方法及应用
9.1社交网络简介
9.2K核方法
9.2.1K核方法原理
9.2.2基于阿里云数加平台的K核方法实例
9.3单源最短路径方法
9.3.1单源最短路径方法原理
9.3.2基于阿里云数加平台的单源最短路径方法实例
9.4PageRank算法
9.4.1PageRank算法原理
9.4.2PageRank算法的特点及应用
9.4.3基于阿里云数加平台的PageRank算法实例
9.5标签传播算法
9.5.1标签传播算法原理
9.5.2基于阿里云数加平台的标签传播聚类应用实例
9.6最大联通子图算法
9.7聚类系数算法
9.7.1聚类系数算法原理
9.7.2基于阿里云数加平台的聚类系数算法应用实例
9.8基于阿里云数加平台的社交网络分析实例
9.9小结
思考题
第10章文本分析方法及应用
10.1文本分析简介
10.2TFIDF方法
10.3中文分词方法
10.3.1基于字典或词库匹配的分词方法
10.3.2基于词的频度统计的分词方法
10.3.3其他中文分词方法
10.4PLDA方法
10.4.1主题模型
10.4.2PLDA方法原理
10.5Word2Vec基本原理
10.5.1词向量的表示方式
10.5.2统计语言模型
10.5.3霍夫曼编码
10.5.4Word2Vec原理简介
10.6基于阿里云数加平台的文本分析实例
10.7小结
思考题
第11章推荐系统方法及应用
11.1推荐系统简介
11.2基于内容的推荐算法
11.2.1基于内容的推荐算法原理
11.2.2基于内容的推荐算法的特点
11.3协同过滤推荐算法
11.3.1协同过滤推荐算法简介
11.3.2协同过滤推荐算法的特点
11.4混合推荐算法
11.5基于阿里云数加平台的推荐算法实例
11.6小结
思考题
参考文献
內容試閱
大数据泛指大规模、超大规模的数据集,因可从中挖掘出有价值的信息而备受关注。数据挖掘是一个涉及数据库技术、人工智能、统计学、机器学习等多个学科的领域,并且已经在各行各业有了非常广泛的应用。为适应我国数据挖掘的教学工作,作者在数据挖掘教学实践的基础上,参阅了多种国内外最近版本的教材,编写了本书。本书可以作为高等院校研究生的教材,也可以为相关行业的工程技术人员提供有益的参考。
本书内容循序渐进,对大数据挖掘的基本算法进行了详细的讲解。本书最大的特点是理论与实践相结合,算法理论与产业一线实践相结合,几乎所有的算法都配有实例和基于阿里云大数据平台(数加平台)的演示,这种理论与实际相结合的方法克服了只重理论、轻实践的内容组织方式,极大地方便了读者的理解。具体而言,本书11章内容之间的关系如下图所示。

本书提供的教学课件,读者可登录www.tup.com.cn网站自行下载。由于编者水平有限,书中必定存在不足之处,恳请专家和读者批评指正。

编者2023年1月

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 香港用户  | 台灣用户 | 海外用户
megBook.com.tw
Copyright (C) 2013 - 2024 (香港)大書城有限公司 All Rights Reserved.