登入帳戶  | 訂單查詢  | 購物車/收銀台( 0 ) | 在線留言板  | 付款方式  | 聯絡我們  | 運費計算  | 幫助中心 |  加入書簽
會員登入 新註冊 | 新用戶登記
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2023年度TOP分類閱讀雜誌 香港/國際用戶
最新/最熱/最齊全的簡體書網 品種:超過100萬種書,正品正价,放心網購,悭钱省心 送貨:速遞 / EMS,時效:出貨後2-3日

2024年08月出版新書

2024年07月出版新書

2024年06月出版新書

2024年05月出版新書

2024年04月出版新書

2024年03月出版新書

2024年02月出版新書

2024年01月出版新書

2023年12月出版新書

2023年11月出版新書

2023年10月出版新書

2023年09月出版新書

2023年08月出版新書

2023年07月出版新書

『簡體書』New Internet:大数据挖掘(来自一线大数据挖掘企业的一手实战剖析)

書城自編碼: 2038879
分類: 簡體書→大陸圖書→計算機/網絡數據庫
作者: 谭磊
國際書號(ISBN): 9787121196706
出版社: 电子工业出版社
出版日期: 2013-03-01
版次: 1 印次: 1
頁數/字數: 354/370000
書度/開本: 16开 釘裝: 平装

售價:NT$ 642

我要買

share:

** 我創建的書架 **
未登入.



新書推薦:
对话的力量,风靡全球的教练式沟通
《 对话的力量,风靡全球的教练式沟通 》

售價:NT$ 307.0
人的行为
《 人的行为 》

售價:NT$ 499.0
北京中轴线知识一点通
《 北京中轴线知识一点通 》

售價:NT$ 411.0
牛津世界历史研究指南
《 牛津世界历史研究指南 》

售價:NT$ 978.0
人间珍贵:澎湃夜读集3
《 人间珍贵:澎湃夜读集3 》

售價:NT$ 354.0
孩子一生的底气
《 孩子一生的底气 》

售價:NT$ 307.0
撒哈拉海计划:技术、殖民与气候危机
《 撒哈拉海计划:技术、殖民与气候危机 》

售價:NT$ 411.0
制造亚洲:一部地图上的历史
《 制造亚洲:一部地图上的历史 》

售價:NT$ 562.0

建議一齊購買:

+

NT$ 531
《 大数据技术全解:基础、设计、开发与实践(三分虚拟技术,七分分布式管理,十二分大数据,深入大数据系统设计、环境安装、开发实践,助你快速投入实战,直接具备大数据系统研发能力 ) 》
+

NT$ 456
《 驾驭大数据(百道网2013年潜力新书推荐!国内外知名数据分析专家、行业领袖联袂推荐!) 》
+

NT$ 456
《 数据挖掘的应用与实践——大数据时代的案例分析 》
+

NT$ 549
《 Hadoop大数据处理 》
+

NT$ 735
《 数据挖掘:实用案例分析(10余个行业、数十家大型企业、近10年数据挖掘应用与咨询经验结晶,涵盖金融、电信、互联网、生产制造和公共服务等行业近20个完整案例) 》
+

NT$ 549
《 数据挖掘与数据化运营实战:思路、方法、技巧与应用(阿里巴巴BI部门数据分析专家卢辉多年数据挖掘应用实践经验结晶,以大案例展现了数据挖掘与数据化运营的商业实践) 》
內容簡介:
本书全面地介绍了如何使用数据挖掘技术从各种结构的(数据库)或非结构(Web)的海量数据中提取和产生业务知识。作者梳理了各种数据挖掘常用算法和信息采集技术,系统地描述了实际应用时如何在互联网日志分析、电子邮件营销、互联网广告和电子商务上进行数据挖掘,着重介绍了数据挖掘的原理和算法在互联网海量数据挖掘中的应用。本书主要特点:全面介绍了数据挖掘和大数据的基本概念和技术;大量采用了实际案例,实用性强;详细介绍了大数据挖掘领域最新的商业应用。
關於作者:

磊复旦大学计算机学士,美国杜克大学计算机硕士,在美国微软服务时间超过13年,曾经担任多家公司多个层级技术管理岗位,在搜索、互联网广告、数据挖掘、电子商务等方面有丰富的经验,是互联网技术领域资深专家。
目錄
第1章 绪论——从淘金客到矿山主
1.1 大数据时代的“四V”
1.2 什么是大数据挖掘
1.2.1 从数据分析到数据挖掘
1.2.2 Web挖掘
1.2.3 大数据挖掘之“大”
1.3 大数据挖掘的国内外发展
1.3.1 数据挖掘的应用发展
1.3.2 数据挖掘研究发展
1.4 本书内容
第2章 一小时了解数据挖掘
2.1 数据挖掘是如何解决问题的
2.1.1 尿不湿和啤酒
2.1.2 Target和怀孕预测指数
2.1.3 电子商务网站流量分析
2.2 分类:从人脸识别系统说起
2.2.1 分类算法的应用
2.2.2 数据挖掘分类技术
2.2.3 分类算法的评估
2.3 一切为了商业
2.3.1 什么是商业智能(Business Intelligence)
2.3.2 数据挖掘的九大定律
2.4 数据挖掘很纠结
2.5 数据挖掘的基本流程
2.5.1 数据挖掘的一般步骤
2.5.2 几个数据挖掘中常用的概念
2.5.3 CRISP-DM
2.5.4 数据挖掘的评估
2.5.5 数据挖掘结果的知识表示
2.6 本章相关资源
第3章 数据仓库——数据挖掘的基石
3.1 存放数据的仓库
3.1.1 数据仓库的定义
3.1.2 数据仓库和数据库
3.2 传统的数据仓库介绍
3.3 数据仓库基本结构
3.4 OLAP联机分析处理
3.5 云存储上的数据仓库
3.5.1 Google公司的云架构
3.5.2 开源的分布式系统Hadoop
3.5.3 Facebook的数据仓库
3.5.4 NoSQL
3.6 本章相关资源
第4章 数据挖掘算法及原理
4.1 数据挖掘中的算法
4.2 数据挖掘十大经典算法
4.3 分类算法(Classification)
4.4 聚类算法(Clustering)
4.5 关联算法
4.5.1 关联算法中的概念
4.5.2 关联规则数据挖掘过程
4.5.3 关联规则的分类
4.5.4 Apriori算法的执行实例
4.5.5 关联规则挖掘算法的研究与优化
4.6 序列挖掘(Sequence Mining)
4.7 数据挖掘建模语言PMML
4.8 本章相关资源
第5章 在进行数据挖掘之前
5.1 数据集成
5.2 为何要做数据预处理
5.3 数据预处理
5.3.1 数据清理
5.3.2 数据转换
5.3.3 数据规约
5.4 本章相关资源
第6章 R语言和其他数据挖掘工具
6.1 R语言的历史
6.1.1 R语言的特点
6.1.2 R语言和数据挖掘
6.2 其他数据挖掘工具
6.2.1 MATLAB
6.2.2 其他商用数据挖掘工具
6.2.3 开源数据挖掘工具Weka
6.3 数据挖掘和云
6.4 本章相关资源
第7章 互联网上的日志分析
7.1 网站日志简介
7.2 网站日志处理
7.2.1 Web日志预处理
7.2.2 Web日志分析和数据挖掘
7.3 邮件日志
7.4 本章相关资源
第8章 数据挖掘和电子邮件
8.1 邮件营销与垃圾邮件过滤
8.2 数据挖掘和邮件营销
8.2.1 如何有效地进行邮件营销
8.2.2 邮件营销案例分享之一
8.2.3 邮件营销案例分享之二
8.2.4 运用数据挖掘RFM模型提高邮件营销效果
8.3 数据挖掘和垃圾邮件过滤
8.3.1 垃圾邮件
8.3.2 垃圾邮件过滤技术
8.3.3 垃圾邮件过滤案例
8.4 本章相关资源
第9章 数据挖掘和互联网广告
9.1 互联网广告
9.2 广告作弊行为
9.3 网站联盟广告
9.4 网站联盟广告上的数据挖掘
9.4.1 数据助力网盟广告
9.4.2 如何应对网盟广告作弊
9.5 本章相关资源
第10章 数据挖掘和电子商务
10.1 中国电子商务现状
10.2 在互联网上卖米
10.3 用数据来掌握客户
10.3.1 客户何时来、从哪来
10.3.2 客户最喜欢哪种商品
10.3.3 竞争与反竞争分析
10.3.4 客户还会买什么
10.3.5 哪些客户是我们需要的
10.4 电子商务案例
10.4.1 电子商务企业案例一
10.4.2 电子商务企业案例二
10.5 本章相关资源
第11章 数据挖掘和Web挖掘
11.1 互联网上的个性化–Like
11.1.1 Like=像
11.1.2 Like=喜欢
11.2 Web挖掘和SNS
11.2.1 SNS上的数据价值
11.2.2 SNS上的数据关联关系
11.2.3 SNS上的用户关系
11.3 数据挖掘和隐私
11.4 本章相关资源
第12章 数据挖掘和移动互联网
12.1 移动互联网的特殊性
12.1.1 锁定用户的数据价值
12.1.2 移动互联网上数据的形式
12.1.3 移动互联网地理位置信息的价值
12.2 数据挖掘和LBS
12.2.1 用PU学习算法做文本挖掘
12.2.2 用相似匹配算法做地点挖掘
12.3 移动互联网数据面临的问题
12.4 本章相关资源
附录1 技术词汇表
附录2 英语参考文献表
附录3 中文参考文献表
附录4 微博
附录5 博客和其他网址
內容試閱
 在研究采掘关联规则的过程中,许多学者发现在一些实际应用中,对于很多的应用来说,由于数据分布的分散性,数据比较少,所以很难在数据最细节的层次上发现一些强关联规则。要想在原始的概念层次上发现强的(Strong)和有意义的(Interesting)关联规则是比较困难的,因为好多项集往往没有足够的支持数。当我们引入概念层次后,就可以在较高的层次上进行挖掘。虽然较高层次上得出的规则可能是更普通的信息,但是对于一个用户来说是普通的信息,对于另一个用户却未必如此。所以数据挖掘应该提供这样一种在多个层次上进行挖掘的功能。

概念层次在要采掘的数据库中是经常存在的,比如在一个超市中会存在这样的概念层次:蒙牛牌牛奶是牛奶,伊利牌牛奶是牛奶,王子牌饼干是饼干,康师傅牌饼干是饼干等。如果我们只是在数据基本层发掘关系,{蒙牛牌牛奶,王子牌饼干},{蒙牛牌牛奶,康师傅牌饼干},{伊利牌牛奶,王子牌饼干},{伊利牌牛奶,康师傅牌饼干}都不符合最小支持度。如若上升一个层级,我们会发现{牛奶,饼干}的关联规则是有一定支持度的。

我们称高层次的项是低层次项的父亲层次(Parent),这种概念层次关系通常用一个有向非循环图(DAG)来表示。这样我们就可以在较高的概念层次上发现关联规则。

根据规则中涉及的层次和多层关联的规则,我们可以把关联规则分为同层关联规则和层间关联规则。多层关联规则的挖掘基本上可以沿用“支持度-置信度”的框架。不过,在支持度设置的问题上有一些要考虑的东西。
同层关联规则可以采用两种支持度策略:

统一的最小支持度。对于不同的层次,都使用同一个最小支持度。这样对于用户和算法实现来说都比较容易,但是弊端也是显然的。

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 香港用户  | 台灣用户 | 海外用户
megBook.com.tw
Copyright (C) 2013 - 2024 (香港)大書城有限公司 All Rights Reserved.