新書推薦:
《
怪谈百物语:不能开的门(“日本文学史上的奇迹”宫部美雪重要代表作!日本妖怪物语集大成之作,系列累销突破200万册!)
》
售價:NT$
296.0
《
罗马政治观念中的自由
》
售價:NT$
230.0
《
中国王朝内争实录:宠位厮杀
》
售價:NT$
281.0
《
凡事发生皆有利于我(这是一本读了之后会让人运气变好的书”治愈无数读者的心理自助经典)
》
售價:NT$
203.0
《
未来特工局
》
售價:NT$
254.0
《
高术莫用(十周年纪念版 逝去的武林续篇 薛颠传世之作 武学尊师李仲轩家世 凸显京津地区一支世家的百年沉浮)
》
售價:NT$
250.0
《
英国简史(刘金源教授作品)
》
售價:NT$
449.0
《
便宜货:廉价商品与美国消费社会的形成
》
售價:NT$
352.0
|
編輯推薦: |
一本结合实例、由R语言来实现的数据挖掘教材
|
內容簡介: |
本书介绍数据挖掘的基本技术和相应的算法,突出案例的示范作用,并用R语言实现.旨在紧扣重大科技突破和新兴市场对大数据分析的需求,从高维海量数据中挖掘有用的信息,形成可运行的智能算法,解决实际问题,给业界带来实际的丰厚回报,不断拓展新的产业领域,延伸产业链条,形成集群发展、多点支撑的战略性新兴产业发展格局. 全书共9章,分别介绍了R语言基础、关联规则的挖掘、感知机、朴素贝叶斯算法、K近邻法、决策树、支持向量机、提升算法和隐马尔可夫模型.本书为专业学位研究生所编写,也可以作为统计、金融数学、计算机科学和计算机软件专业的本科生教材,还可以作为零基础读者的自学教材.各章自成体系,读者可以从头逐章学习,也可随意挑选自己所需要的章节学习.
|
目錄:
|
目录
第1章R语言基础
1.1R的安装
1.2R数据结构
1.3数据输入
1.4程序控制流语句
1.5用户自编函数
1.6运算符
1.7数学统计函数
第2章关联规则的挖掘
2.1关联规则模型
2.2关联规则的支持度、可信度和提升度
2.3关联规则Apriori算法
第3章感知机
3.1数据集的线性可分性
3.2感知机模型
3.3感知机学习策略
3.4感知机学习算法
第4章朴素贝叶斯算法
4.1朴素贝叶斯频次表
4.2朴素贝叶斯条件概率表
4.3朴素贝叶斯分类器
4.4拉普拉斯校准子
4.5连续型数据特征的处理
第5章K近邻法
5.1近邻的距离度量方法
5.2Kd树寻找K近邻
5.3分类决策规则
5.4K值的选择
5.5K近邻算法
第6章决策树
6.1决策树模型
6.2决策树学习
6.3决策树的生成
6.4决策树的剪枝
6.5分类与回归树模型
第7章支持向量机
7.1线性可分支持向量机与硬间隔最大化
7.2线性支持向量机与软间隔最大化
7.3非线性支持向量机与核函数
7.4序列最小最优化算法
第8章提升算法
8.1AdaBoost提升算法
8.2AdaBoost算法解释
8.3提升树
第9章隐马尔可夫模型
9.1基本概念
9.2概率计算算法
9.3学习算法
9.4预测算法
参考文献
|
內容試閱:
|
前言
随着信息技术的革命性发展,人类社会已经进入了大数据时代,未来各行业
的核心竞争力在很大程度上依赖于将数据转化为信息和知识的速度和能力,
这取决于数据挖掘的应用水平.数据挖掘可以解决众多国家重大需求问题,提
供了社会科学的方法论; 实现基于数据的决策,支持管理科学与实践的革命
; 提供科学研究的新范式,支持基于数据的科学发现; 形成高新科技的新
领域,推动行业深化发展并形成大数据产业; 形成社会进步的新引擎,深刻
改变人们的思维、生产、生活方式,推动社会的进步.任何地区或国家要想获
得竞争优势,数据挖掘技术是一个极具战略价值的领域.
数据挖掘的核心是从高维、海量的大数据中提取有用的信息,解决实际问题
,给业界带来实际的丰厚回报.这一事实使得数据挖掘非常适合于今天的大数
据时代.如果没有数据挖掘,要跟上海量信息数据流的步伐几乎是不可能的.
对数据的探索、分析、预测成为数据挖掘领域的热门技能之一.也许你阅读电
子邮件时,垃圾邮件可能已被某个数据挖掘算法(很可能是贝叶斯算法)过
滤掉了; 在网页上浏览时,可能会看到一些由数据挖掘算法预测出吸引你的
广告; 在申请贷款或信用卡时,申请的批准与否取决于数据挖掘算法的输出
结果; 有人盗取了你的信用卡,发卡银行希望当此卡被用于欺诈消费时他们
部署的数据挖掘算法能够识别出该类偷盗消费.
鉴于R语言本身是一款十分优秀的数据挖掘和数据可视化共享软件,提供了一
套功能强大且易于学习的工具,是一个跨平台、零成本的数据挖掘编程环境
,还包括大量用于数据挖掘的添加包.这些工具可以帮助你发现数据背后隐藏
的信息,应用到自己的研究项目中.
本书以数据挖掘算法为主线,突出案例教学,算法采用R语言来实现,重在培
养读者解决实际问题的能力,提升其职业能力.脉络清晰,各章自成体系,读
者可以从头逐章学习,也可随意挑选自己所需要的章节内容学习.
本书的撰写是易正俊教授在援疆期间联合伊犁师范学院(辛巧)、石河子大
学(阳红英)和新疆农业大学(黄华)共同完成的.另外,参加本书编写工作
的还有易校石、曾杰和谢恒悦三位研究生,没有他们的支持和讨论,写作本
书是根本不可能的,是他们与我们一起努力,最终为读者带来了具有丰富案
例的这本数据挖掘教材.
由于编者水平有限,书中难免有错,敬请读者批评指正.
作者2017年12月
|
|