《数据挖掘原理与算法（第3版）》 - 台灣·大書城 - 毛国君段立娟 - 清华大学出版社

	登入帳戶　 \|　訂單查詢　 \|　購物車/收銀台(0)　\|　在線留言板　 \|　付款方式　 \|　聯絡我們　 \|　運費計算　 \|　幫助中心　\|　加入書簽
		會員登入新用戶註冊

HOME

新書上架

暢銷書架

好書推介

2024年度TOP

香港／國際用戶

最新/最熱/最齊全的簡體書網

品種：超過100萬種書，正品正价，放心網購，悭钱省心

送貨：速遞 / 物流，時效：出貨後2-4日

『簡體書』数据挖掘原理与算法（第3版）

書城自編碼： 2723711
分類：簡體書→大陸圖書→教材→研究生/本科/专科教材
作者：毛国君段立娟
國際書號(ISBN)： 9787302415817
出版社：清华大学出版社
出版日期： 2015-12-01
版次： 3 印次： 1

書度/開本： 128开釘裝：平装

售價：NT$ 328

我要買件

** 我創建的書架 **
未登入.

編輯推薦：

《数据挖掘原理与算法（第3版）》在经典教材的基础上，重点增加了大数据挖掘等新的数据挖掘的需求和技术分析，对Web挖掘的内容进行了重新编排，并增加了必要的新方法。近年来出现的公认的典型算法和技术也得到加强，使之很好地适应读者在教学或者学习中的新需求。
本书内容相对全面，各章之间耦合度小。作为教材，教师可以根据学生类型、学时安排等进行选择性教学。作为参考书，读者可以根据自己的基础进行选择性学习或查阅。在每章后面都设置专门一节来对本章内容和文献引用情况进行归纳，它不仅可以帮助读者对相关内容进行整理，而且对读者，特别是研究人员，也起到文献的注释性索引功能。

內容簡介：

本书是一本全面介绍数据挖掘和知识发现技术的专业书籍，系统地阐述了数据挖掘和知识发现技术的产生、发展、应用以及相关概念、原理和算法，对数据挖掘中的主要技术分支，包括关联规则、分类、聚类、序列、空间以及Web挖掘等进行了理论剖析和算法描述。本书的许多内容是作者们在攻读博士学位期间的工作总结，一方面，对于相关概念和技术的阐述尽量先从理论分析入手，在此基础上进行技术归纳；另一方面，为了保证技术的系统性，所有的挖掘模型和算法描述都在统一的技术归纳框架下进行。同时，为了避免抽象算法描述给读者带来的理解困难，本书的所有典型算法都通过具体跟踪执行实例来进一步说明。
全书共分8章，各章相对独立成篇，以利于读者选择性学习。在每章后面都设置专门一节来对本章内容和文献引用情况进行归纳，它不仅可以帮助读者对相关内容进行整理，而且也起到对本章内容相关文献的注释性索引功能。
本书可作为计算机专业研究生或高年级本科生教材，也可以作为从事计算机研究和开发人员的参考资料。作为教材，教师可以根据课时安排进行选择性教学。为了更好地让教师进行选择性教学，本书配有专门的教师用书，对内容的重点、难点和课时分配给出了对应的建议，对重要的和难度较大的习题进行了分析和解答。对于研究人员，本书是一本高参考价值的专业书籍。对于软件技术人员，可以把它当作提高用书或参考资料，一些算法可以通过改造用于实际的应用系统中。

第1章绪论

1.1数据挖掘技术的产生与发展

1.1.1数据挖掘技术的商业需求分析

1.1.2数据挖掘产生的技术背景分析

1.1.3大数据时代的数据挖掘技术需求分析

1.2数据挖掘研究的发展趋势

1.3数据挖掘概念

1.3.1从商业角度看数据挖掘技术

1.3.2数据挖掘的技术含义

1.3.3数据挖掘研究的理论基础

1.4数据挖掘技术的分类问题

1.5数据挖掘常用的知识表示模式与方法

1.5.1广义知识挖掘

1.5.2关联知识挖掘

1.5.3类知识挖掘

1.5.4预测型知识挖掘

1.5.5特异型知识挖掘

1.6不同数据存储形式下的数据挖掘问题

1.6.1事务数据库中的数据挖掘

1.6.2关系型数据库中的数据挖掘

1.6.3数据仓库中的数据挖掘

1.6.4在关系模型基础上发展的新型数据库中的
数据挖掘

1.6.5面向应用的新型数据源中的数据挖掘

1.6.6Web数据源中的数据挖掘

1.7粗糙集方法及其在数据挖掘中的应用

1.7.1粗糙集的一些重要概念

1.7.2粗糙集应用举例

1.7.3粗糙集方法在KDD中的应用范围

1.8数据挖掘的应用分析

1.8.1数据挖掘与CRM

1.8.2数据挖掘与社会网络

1.8.3数据挖掘应用的成功案例分析

1.9本章小结和文献注释

习题1

第2章知识发现过程与应用结构

2.1知识发现的基本过程

2.1.1数据抽取与集成技术要点

2.1.2数据清洗与预处理技术要点

2.1.3数据的选择与整理技术要点

2.1.4数据挖掘技术要点

2.1.5模式评估技术要点

2.2数据库中的知识发现处理过程模型

2.2.1阶梯处理过程模型

2.2.2螺旋处理过程模型

2.2.3以用户为中心的处理模型

2.2.4联机KDD模型

2.2.5支持多数据源多知识模式的KDD处理模型

2.3知识发现软件或工具的发展

2.3.1独立的知识发现软件

2.3.2横向的知识发现工具集

2.3.3纵向的知识发现解决方案

2.3.4KDD系统介绍

2.4知识发现项目的过程化管理

2.5数据挖掘语言介绍

2.5.1数据挖掘语言的分类

2.5.2数据挖掘查询语言

2.5.3数据挖掘建模语言

2.5.4通用数据挖掘语言

2.5.5DMQL挖掘查询语言介绍

2.6本章小结和文献注释

习题2

第3章关联规则挖掘理论和算法

3.1基本概念与解决方法

3.2经典的频繁项目集生成算法分析

3.2.1项目集空间理论

3.2.2经典的发现频繁项目集算法

3.2.3关联规则生成算法

3.3Apriori算法的性能瓶颈问题

3.4Apriori的改进算法

3.4.1基于数据分割的方法

3.4.2基于散列的方法

3.4.3基于采样的方法

3.5项目集空间理论的发展

3.5.1Close算法

3.5.2FPtree算法

3.6项目集格空间和它的操作

3.7基于项目集操作的关联规则挖掘算法

3.7.1关联规则挖掘空间

3.7.2三个实用算子

3.7.3最大频繁项目集格的生成算法

3.7.4ISSDM算法执行示例

3.8改善关联规则挖掘质量问题

3.8.1用户主观层面

3.8.2系统客观层面

3.9约束数据挖掘问题

3.9.1约束在数据挖掘中的作用

3.9.2约束的类型

3.10时态约束关联规则挖掘

3.11关联规则挖掘中的一些更深入的问题

3.11.1多层次关联规则挖掘

3.11.2多维关联规则挖掘

3.11.3数量关联规则挖掘

3.12数量关联规则挖掘方法

3.12.1数量关联规则挖掘问题

3.12.2数量关联规则的分类

3.12.3数量关联规则挖掘的一般步骤

3.12.4数值属性离散化问题及算法

3.13本章小结和文献注释

习题3

第4章分类方法

4.1分类的基本概念与步骤

4.2基于距离的分类算法

4.3决策树分类方法

4.3.1决策树基本算法概述

4.3.2ID3算法

4.3.3C4.5算法

4.4贝叶斯分类

4.4.1贝叶斯定理

4.4.2朴素贝叶斯分类

4.4.3EM算法

4.5规则归纳

4.5.1AQ算法

4.5.2CN2算法

4.5.3FOIL算法

4.6与分类有关的其他问题

4.6.1分类数据预处理

4.6.2分类器性能的表示与评估

4.7本章小结和文献注释

习题4

第5章聚类方法

5.1概述

5.1.1聚类分析在数据挖掘中的应用

5.1.2聚类分析算法的概念与基本分类

5.1.3距离与相似性的度量

5.2划分聚类方法

5.2.1k平均算法

5.2.2PAM

5.2.3其他方法

5.3层次聚类方法

5.3.1AGNES算法

5.3.2DIANA算法

5.3.3其他聚类方法

5.4密度聚类方法

5.5其他聚类方法

5.5.1STING算法

5.5.2SOM算法

5.5.3COBWEB算法

5.5.4模糊聚类算法FCM

5.6本章小结和文献注释

习题5

第6章时间序列和序列模式挖掘

6.1时间序列及其应用

6.2时间序列预测的常用方法

6.2.1确定性时间序列预测方法

6.2.2随机时间序列预测方法

6.2.3其他方法

6.3基于ARMA模型的序列匹配方法

6.3.1基本概念

6.3.2利用基本概念建立模型

6.3.3构造判别函数

6.4基于离散傅里叶变换的时间序列相似性查找

6.4.1完全匹配

6.4.2子序列匹配

6.5基于规范变换的查找方法

6.5.1基本概念

6.5.2查找方法

6.6序列挖掘

6.6.1基本概念

6.6.2数据源的形式

6.6.3序列模式挖掘的一般步骤

6.7AprioriAll算法

6.8AprioriSome算法

6.9GSP算法

6.10本章小结和文献注释

习题6

第7章Web挖掘技术

7.1Web挖掘的意义

7.2Web挖掘的分类

7.3Web挖掘的含义

7.3.1Web挖掘与信息检索

7.3.2Web挖掘与信息抽取

7.4Web挖掘的数据来源

7.4.1服务器日志数据

7.4.2在线市场数据

7.4.3Web页面

7.4.4Web页面超链接关系

7.4.5其他信息

7.5Web内容挖掘方法

7.5.1爬虫与Web内容挖掘

7.5.2虚拟的Web视图

7.5.3个性化与Web内容挖掘

7.5.4对Web页面内文本信息的挖掘

7.5.5对Web页面内多媒体信息挖掘

7.5.6Web页面内容的预处理

7.6Web访问信息挖掘方法

7.6.1Web访问信息挖掘的特点

7.6.2Web访问信息挖掘的意义

7.6.3Web访问信息挖掘的数据源

7.6.4Web访问信息挖掘的一般过程

7.6.5Web访问信息挖掘的数据清理

7.6.6用户识别方法

7.6.7会话识别方法

7.6.8其他预处理技术

7.6.9Web访问挖掘的应用方法

7.6.10Web访问信息挖掘的要素构成

7.6.11Web访问信息挖掘应用

7.7Web结构挖掘方法

7.7.1页面等级（分级）的评价方法

7.7.2PageRank算法

7.7.3权威页面和中心页面

7.7.4Web站点结构的预处理

7.8本章小结和文献注释

习题7

第8章空间挖掘

8.1引言

8.2空间数据概要

8.2.1空间数据的复杂性特征

8.2.2空间查询问题

8.2.3空间数据结构

8.2.4专题地图

8.3空间数据挖掘基础

8.4空间统计学

8.5泛化与特化

8.5.1逐步求精

8.5.2泛化

8.5.3最临近方法

8.5.4统计信息网格方法

8.6空间规则

8.7空间分类算法

8.7.1ID3扩展

8.7.2空间决策树

8.8空间聚类算法

8.8.1基于随机搜索的聚类方法CLARANS扩展

8.8.2大型空间数据库基于距离分布的聚类算法DBCLASD

8.8.3BANG

8.8.4小波聚类

8.8.5近似值

8.9空间挖掘的其他问题

8.10空间数据挖掘原型系统介绍

8.11空间数据挖掘的研究现状

8.12空间数据挖掘的研究与发展方向

8.13空间数据挖掘与相关学科的关系

8.13.1空间数据挖掘与空间数据库

8.13.2空间数据挖掘与空间数据仓库

8.13.3空间数据挖掘与空间联机分析处理

8.13.4空间数据挖掘与地理信息系统

8.14数字地球

8.15本章小结和文献注释

习题8

参考文献

內容試閱：

《数据挖掘原理与算法》经过第1版和第2版，历经十几年的历程，得到了研究者、教师、学生及计算机从业者的肯定和鼓励，在此表示衷心的感谢。据不完全统计，前两版已经被国内二十多所高校作为研究生或者本科生教材使用。在使用过程中，许多人也对第2版中的文字错误、内容编排等提出一些很好的建议。加之数据挖掘技术本身的发展对再次改版提出了强烈需求。第3版除了对必要的文字等错误进行修正外，重点增加了大数据挖掘等新的数据挖掘的需求和技术分析，对Web挖掘的内容进行了重新编排，并增加了必要的新方法。这样，第3版的内容及其编排更趋合理，近年来出现的公认的典型算法和技术也得到加强，使之很好地适应读者在教学或者学习中的新需求。
数据库技术从20世纪80年代开始，已经得到广泛的普及和应用。随着数据库容量的膨胀，特别是数据仓库以及Web等新型数据源的日益普及，人们面临的主要问题不再是缺乏足够的信息可以使用，而是面对浩瀚的数据海洋如何有效地利用这些数据。面对这一挑战，数据挖掘和知识发现技术应运而生，并显示出强大的生命力。数据挖掘和知识发现使数据处理技术进入了一个更高级的阶段。它不仅能对过去的数据进行查询，而且能够找出过去数据之间的潜在联系，进行更高层次的分析，以便更好地解决决策、预测等问题。历经十几年的发展，数据挖掘技术本身已经积累了一批有价值的理论和技术成果。同时，包括统计学、人工智能等在内的相关学科的发展，从某种程度上对数据挖掘技术的发展起到了极大的推动作用。根据麻省理工学院的《科技评论》评估，数据挖掘技术是对未来人类产生重大影响的十大新兴技术之一。毫不夸张地说，如今的数据挖掘已经成为计算机、信息科学以及相关领域的一个时髦名词，而且在诸如银行、电信、保险、交通、零售（如超级市场）以及天文学、分子生物学等领域得到应用。可以预见，随着大数据概念的提出和应用，数据挖掘也必将是支撑大数据分析的最重要和最核心的技术之一。
诚然，要真正理解数据挖掘技术并不是一件容易的事。一方面，数据挖掘技术覆盖范围很广泛，需要从理论到应用、从概念到算法的完整过程；另一方面，作为比较新的交叉研究领域，不同背景的研究人员（数据库、人工智能、数学等）可能提供不同的视点，而且本身仍在发展中。本书第一作者长期从事相关方面的教学工作，其中面临的问题之一就是教材的选择。由于目前相关书籍较少，而且侧重点不同，内容的完整性和科学性有待商榷。由于没有合适的教材可用，在教学的初期不得不通过指定大量参考书或文献来解决，之后也采用补充讲义的形式来扩充。同时，对于一些软件工程师或工程硕士、在职硕士进修班等要求提高实践能力的人员来说，也需要在科学的理论（原理）框架下理解和掌握数据挖掘技术。基于这样的要求，第一作者在多年各类教学和软件工程的实践基础上，对积累的素材进行了整理和加工，并且邀请段立娟博士、王实博士和石云博士参与本书的编写。本书的许多内容是作者们在攻读博士学位期间的工作总结。这些保证了本书的系统性、先进性和实用性。
本书可作为计算机专业研究生教材、高年级本科生的选修教材，也可以作为从事计算机研究和开发人员的参考资料。为了保证内容的先进性和深度，对重点内容进行了重点阐述。本书内容相对全面，各章之间耦合度小。作为教材，教师可以根据学生类型、学时安排等进行选择性教学。作为参考书，读者可以根据自己的基础进行选择性学习或查阅。在每章后面都设置专门一节来对本章内容和文献引用情况进行归纳，它不仅可以帮助读者对相关内容进行整理，而且对读者，特别是研究人员，也起到文献的注释性索引功能。本书的所有典型算法都通过具体跟踪执行实例来进一步说明，这对于读者正确理解和应用算法是有益的。对于工程技术人员来说，这些算法完全可以在理解的基础上进行改进或改造应用到实际工作中。
全书共8章。第1章是绪论，系统地介绍了数据挖掘的概念、产生背景以及应用价值；第2章给出了知识发现的过程分析和应用体系结构设计，并对数据挖掘应用系统的主要功能部件和关键步骤进行了较为详尽的剖析；第3章全面阐述了关联规则挖掘的原理和算法，并对一些新的焦点问题（如多维、数量、约束关联规则挖掘）的最新成果尽可能地加以介绍；第4章给出分类的主要理论和算法描述；第5章讨论聚类的常用技术和算法；第6章对时间序列分析技术和序列挖掘算法进行论述；第7章系统地介绍了Web挖掘的主要研究领域和相关技术及算法；第8章是对空间数据挖掘技术和算法的分析和讲解。
特别感谢北京工业大学刘椿年教授和中国科学院高文和孙玉方研究员，作为作者的导师，他们在作者攻读博士学位期间对本书素材的积累提供了极大的帮助。本书也凝聚了北京工业大学和中央财经大学一些研究生的心血，他们在本书算法实例整理和验证等方面做了很多工作，在此就不一一列举了。此外，也感谢使用第2版图书的教师和学生，他们的使用给予我们进一步编好该书的动力，同时提出的许多意见也提升了第3版内容编排的质量。
作者2015年9月于北京

書城介紹　 \|　合作申請　\|　索要書目　 \|　新手入門　\|　聯絡方式　 \|　幫助中心　\|　找書說明　 \|　送貨方式　\|　付款方式	台灣用户　\|　香港/海外用户

megBook.com.tw
Copyright (C) 2013 - 2025 （香港）大書城有限公司　All Rights Reserved.