登入帳戶  | 訂單查詢  | 購物車/收銀台(0) | 在線留言板  | 付款方式  | 聯絡我們  | 運費計算  | 幫助中心 |  加入書簽
會員登入   新用戶註冊
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2023年度TOP分類閱讀雜誌 香港/國際用戶
最新/最熱/最齊全的簡體書網 品種:超過100萬種書,正品正价,放心網購,悭钱省心 送貨:速遞 / 物流,時效:出貨後2-4日

2024年10月出版新書

2024年09月出版新書

2024年08月出版新書

2024年07月出版新書

2024年06月出版新書

2024年05月出版新書

2024年04月出版新書

2024年03月出版新書

2024年02月出版新書

2024年01月出版新書

2023年12月出版新書

2023年11月出版新書

2023年10月出版新書

2023年09月出版新書

『簡體書』数据挖掘基础(第2版)

書城自編碼: 3881651
分類: 簡體書→大陸圖書→教材高职高专教材
作者: 刘鹏 陶建辉
國際書號(ISBN): 9787302634492
出版社: 清华大学出版社
出版日期: 2023-06-01

頁數/字數: /
書度/開本: 16开 釘裝: 平装

售價:NT$ 250

我要買

share:

** 我創建的書架 **
未登入.



新書推薦:
《往事和近事(增订本)》(著名学者葛剑雄教授代表作,新增修订、全新推出。跨越三十多年的写作,多角度讲述中华文明)
《 《往事和近事(增订本)》(著名学者葛剑雄教授代表作,新增修订、全新推出。跨越三十多年的写作,多角度讲述中华文明) 》

售價:NT$ 349.0
往事和近事:历史地理学泰斗、百家讲坛主讲葛剑雄经典文集
《 往事和近事:历史地理学泰斗、百家讲坛主讲葛剑雄经典文集 》

售價:NT$ 349.0
父母的关键认知
《 父母的关键认知 》

售價:NT$ 225.0
第三帝国:一部新的历史(纳粹主义具有何种魔力?纳粹运动会卷土重来吗?一部全面揭示希特勒及其罪恶帝国黑暗的历史)
《 第三帝国:一部新的历史(纳粹主义具有何种魔力?纳粹运动会卷土重来吗?一部全面揭示希特勒及其罪恶帝国黑暗的历史) 》

售價:NT$ 490.0
强迫症的历史:德国人的犹太恐惧症与大屠杀(德国历史上的反犹文化源自哪里?如何演化为战争对犹太人灭绝性的种族杀戮?德国历史研究专家克劳斯·费舍尔叙述德国反犹史及其极端形态的典范之作)
《 强迫症的历史:德国人的犹太恐惧症与大屠杀(德国历史上的反犹文化源自哪里?如何演化为战争对犹太人灭绝性的种族杀戮?德国历史研究专家克劳斯·费舍尔叙述德国反犹史及其极端形态的典范之作) 》

售價:NT$ 440.0
粤港澳大湾区舆论引导与舆情应对精品案例:基于媒介化治理的思考
《 粤港澳大湾区舆论引导与舆情应对精品案例:基于媒介化治理的思考 》

售價:NT$ 445.0
大地的勇士
《 大地的勇士 》

售價:NT$ 340.0
中华老学·第十一辑
《 中华老学·第十一辑 》

售價:NT$ 380.0

建議一齊購買:

+

NT$ 189
《 园林工程施工管理实务 》
+

NT$ 380
《 麒麟操作系统应用与实践 》
+

NT$ 265
《 民航危险品运输 》
+

NT$ 228
《 园林树木整形修剪学(第2版高等院校园林与风景园林规划教材) 》
+

NT$ 1185
《 制冷与空气调节技术(第五版) 》
+

NT$ 245
《 大数据分析与可视化 》
編輯推薦:
本教材帮助应用型院校学生学习和掌握数据挖掘的基本知识以及应用技能,以通俗、简明并结合实际应用的方式编写本教材。详细讲述了数据挖掘概念及常用方法,包括分类方法、聚类方法和关联规则方法。此外,从实际应用出发,讲解了日志的挖掘与应用方法,以及多个数据挖掘应用案例。
內容簡介:
本书介绍数据挖掘的基本概念,包括数据挖掘的常用算法、常用工具、用途和应用场景及应用状况,讲述常用数据挖掘方法,如分类、聚类、关联规则的概念、思想、典型算法、应用场景等。此外,本书还从实际应用出发,讲解基于日志的大数据挖掘技术的原理、工具、应用场景和成功案例。 通过本书的学习,读者将了解数据挖掘的基本概念、思想和算法,并掌握其应用要领。本书可以作为培养应用型人才的课程教材,也可作为相关开发人员的自学教材和参考手册。
關於作者:
刘鹏,清华大学博士毕业,现任南京云创大数据科技股份有限公司总经理,兼任中国大数据应用联盟人工智能专家委员会主任、中国信息协会教育分会人工智能专家委员会主任、全国普通高校毕业生就业创业指导委员会委员、第45届世界技能大赛中国区云计算选拔赛裁判长/专家指导组组长、2019年全国大学生数据建模比赛命题人、工信部云计算研究中心专家。
陶建辉,现任IT信息科技公司总经理,中国计算机学会(CCF)高级会员,历任数据服务公司(上海市大数据产业技术创新战略联盟成员单位)副总经理、DEC/Compaq/HP技术顾问、高级技术顾问、部属研究所课题组长等。
目錄
第1 章 数据挖掘的概念
1.1 数据挖掘概述 1
1.1.1 什么是数据挖掘 2
1.1.2 数据挖掘常用算法概述 2
1.1.3 数据挖掘常用工具概述 3
1.2 数据探索 5
1.2.1 数据概述 5
1.2.2 数据质量 6
1.2.3 数据预处理 8
1.3 数据挖掘的应用 10
1.3.1 数据挖掘的现状及发展趋势 10
1.3.2 数据挖掘需要解决的问题 10
1.3.3 数据挖掘的应用场景 12
1.4 作业与练习 15
参考文献 15
第2 章 分类
2.1 分类概述 16
2.1.1 分类的基本概念 16
2.1.2 解决分类问题的一般方法 16
2.1.3 分类模型的过拟合 18
2.2 决策树 18
2.2.1 决策树的工作原理及构建 18
2.2.2 决策树归纳算法 19
2.2.3 处理决策树中的过拟合 21
2.3 贝叶斯决策与分类器 21
2.3.1 规则分类器 21
2.3.2 贝叶斯定理在分类中的应用 22
2.3.3 朴素贝叶斯在分类中的应用 23
2.4 支持向量机 24
2.4.1 最大边缘超平面 24
VIII 数据挖掘基础(第2 版)
2.4.2 线性支持向量机SVM 25
2.4.3 非线性支持向量机SVM 27
2.5 分类在实际场景中的应用案例 31
2.5.1 在关键字检索中的应用 31
2.5.2 在甄别欺诈行为中的应用 32
2.5.3 在在线广告推荐中的应用 32
2.5.4 在Web 机器人检测中的应用 34
2.6 作业与练习 35
参考文献 35
第3 章 聚类
3.1 聚类概述 36
3.1.1 聚类的基本概念 36
3.1.2 聚类的评价标准 37
3.1.3 聚类算法的选择 39
3.2 聚类算法 39
3.2.1 层次聚类算法 39
3.2.2 划分聚类算法 40
3.2.3 基于密度的聚类算法 41
3.2.4 基于网格的聚类算法 42
3.2.5 基于模型的聚类算法 43
3.2.6 使用Spark 实现K-means 的训练 43
3.3 聚合分析方法 45
3.3.1 欧氏距离 45
3.3.2 聚合过程 45
3.3.3 聚类树 47
3.3.4 聚合分析方法应用实例 48
3.4 聚类在实际场景中的应用案例 49
3.4.1 在电网中的应用 49
3.4.2 在电力用户用电行为分析中的应用 49
3.4.3 在电商中的应用 50
3.4.4 聚类实现的例子 50
3.5 作业与练习 56
参考文献 56
第4 章 关联规则
4.1 关联规则概述 57
4.1.1 经典案例导入 57
4.1.2 关联规则的基本概念和定义 58
4.1.3 关联规则的分类 60
4.2 关联规则的挖掘过程 61
4.2.1 知识回顾 61
4.2.2 频繁项集产生 62
4.2.3 强关联规则 63
4.2.4 关联规则评价标准 64
4.3 关联规则的Apriori 算法 65
4.3.1 知识回顾 65
4.3.2 Apriori 算法的核心思想 66
4.3.3 Apriori 算法描述 66
4.3.4 Apriori 算法评价 68
4.3.5 Apriori 算法改进 68
4.4 关联规则的FP-growth 算法 69
4.4.1 构建FP 树 70
4.4.2 从FP 树中挖掘频繁项集 72
4.4.3 FP-growth 算法与Apriori 算法的区别 73
4.4.4 使用Spark 实现FP-growth 算法的训练 73
4.5 实战:关联规则挖掘实例 74
4.5.1 关联规则挖掘技术在国内外的应用现状 74
4.5.2 关联规则应用实例 75
4.5.3 关联规则在大型超市中应用的步骤 77
4.6 作业与练习 79
参考文献 79
第5 章 综合实战—日志的挖掘与应用
5.1 日志的概念 80
5.1.1 日志是什么 80
5.1.2 日志能做什么 81
5.2 日志处理 82
5.2.1 产生日志 82
5.2.2 传输日志 83
5.2.3 存储日志 85
5.2.4 分析日志 88
5.2.5 日志规范与标准 97
5.3 R 语言与日志分析工具 99
5.3.1 R 语言 99
5.3.2 日志分析工具 103
5.3.3 日志分析系统的规划建设 106
5.4 日志挖掘应用 110
5.4.1 安全运维 110
5.4.2 系统健康分析 110
5.4.3 用户行为分析 111
5.4.4 业务分析设计 112
5.5 日志分析挖掘实例 113
5.6 作业与练习 115
参考文献 115
第6 章 数据挖掘应用案例
6.1 电力行业采用聚类方法进行主变油温分析 116
6.1.1 需求背景及采用的大数据分析方法 116
6.1.2 大数据分析方法的实现过程 117
6.1.3 大数据分析方法的实现结果 119
6.2 银行信贷评价 119
6.2.1 简介 119
6.2.2 神经网络模型 120
6.2.3 实证检验 120
6.3 指数预测 121
6.3.1 金融时间序列概况 121
6.3.2 小波消噪 122
6.3.3 向量机 123
6.3.4 指数预测 123
6.4 客户分群的精准智能营销 124
6.4.1 挖掘目标 124
6.4.2 分析方法和过程 124
6.4.3 建模仿真 128
6.5 使用WEKA 进行房屋定价 129
6.6 作业与练习 133
参考文献 133
附录A
內容試閱
数据挖掘是知识发现不可缺少的部分,是将未加工的数据转换为有用信息的过程。为了贯彻国家大数据战略,尽快帮助应用型院校学生学习和掌握数据挖掘的基本知识以及基本应用技能,我们以通俗、简明并结合实际应用的方式编写了本教材。
本教材讲述了数据挖掘概念、数据挖掘的常用方法,包括分类方法、聚类方法和关联规则方法。此外,本教材还从实际应用出发,讲解了日志的挖掘与应用方法,以及多个数据挖掘应用案例。
分类是数据挖掘中的一种重要方法,在给定数据基础上构建分类函数或分类模型,该函数或模型能够将数据归类为给定类别中的某一类别。一般通过构建分类器实现具体分类,分类器是对样本进行分类的方法统称。本教材将对分类的基本概念及知识,如决策树、分类器、贝叶斯分类器、支持向量机等内容进行讲解和研究。聚类的过程,就是将相似数据归并到一类,使数据形成同类对象具有共同特征,不同类对象之间有显著区别的形态。聚类的目的是通过数据间的相似性将数据归类,并根据数据的概念描述来制定对应的策略。本教材将对聚类基本概念及常用算法进行讲解,着重研究聚合分析方法,并介绍聚类方法应用场景。此外,本教材还详细讲解了聚类方法的实现例子。
关于关联规则,我们从营销界流传的“啤酒与尿布”经典案例入手,介绍关联规则的概念、定义和分类,并分析关联规则的挖掘过程,包括频繁项集产生、强关联规则和关联规则评价标准,重点介绍关联规则的经典算法—Apriori 算法,并分析关联规则挖掘技术在国内外的应用现状,以及关联规则挖掘实例。
综合实战—日志的挖掘与应用章节讲述了日志概念、日志处理、日志分析原理及工具、日志挖掘应用,以及日志分析挖掘实例。
我们衷心希望本教材可以帮助读者学习数据挖掘的基础知识,掌握数据挖掘的基本方法,并体会到数据挖掘在实际应用中的精妙之处。
感谢编写组的全体老师,他们相互鼓励、相互学习、相互促进,为本教材的编写付出了辛勤的劳动!本书的问世也要感谢清华大学出版社王莉编辑给予的宝贵意见和指导。
编者
2023 年1 月

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 台灣用户 | 香港/海外用户
megBook.com.tw
Copyright (C) 2013 - 2024 (香港)大書城有限公司 All Rights Reserved.