新書推薦:
《
虚弱的反攻:开禧北伐
》
售價:NT$
429.0
《
泰山:一种中国信仰专论(法国汉学经典译丛)
》
售價:NT$
380.0
《
花外集斠箋
》
售價:NT$
704.0
《
有兽焉.8
》
售價:NT$
305.0
《
大学问·明清经济史讲稿
》
售價:NT$
330.0
《
中国国际法年刊(2023)
》
售價:NT$
539.0
《
早点知道会幸福的那些事
》
售價:NT$
295.0
《
迈尔斯普通心理学
》
售價:NT$
760.0
|
編輯推薦: |
1.本书作者参与了中国百亿的数据项目经验,有30多年IT从业和15年大数据从业的经历。
2.本书深入简出地讲解了大数据分析的原理,提供分析大数据实用的方法和技巧,帮助读者针对不同的现实问题进行预测性建模。同时,本书有详尽的案例,帮助读者理解和掌握所学内容。
3.此书的内容覆盖大数据分析、应用,尤其是数据分析覆盖了主流的大数据平台,案例都是真实存在的。
|
內容簡介: |
本书首先参阐述大数据出现的背景,解释数据资产、数据驱动等基本概念,剖析数据分析的重要性,介绍了大分析的内容和范围、关键点等;其次,阐述了大数据建设的基本内容和有关应用领域等,涉及收集、存储、标准、技术选择等内容,重点介绍了数据质量、安全管理等数据管控的内容;结尾,给出了大数据建设配套的人才、管理结构等方面的内容和经验,分享如何引入互联网思维,开辟新视野的理念。
|
關於作者: |
段云峰,从20世纪80年代开始从事IT的学习,并一直从事IT工作。他在2001年开始主持国内某大型数据仓库项目实际设计和建设,积累了丰富的运营经验。他一直从事大数据等行业的理论和建设工作,主持了100多亿投资项目,创建并培养了一支从事大数据系统建设和运营的电信运营商队伍。他的主要作品有:《数据仓库技术及其在电信领域中的应用、《数据仓库基础》。
|
目錄:
|
第1章 背景
1.1 大数据的引出和影响
1.1.1 “大数据,大商机”
1.1.2 “数据资产”的引出
1.1.3 数据量庞大
1.1.4 数据结构复杂
1.1.5 数据价值有待挖掘
1.1.6 “数据驱动”的变革
1.1.7 互联网发展中的“数联网”
1.2 为何需要大分析
1.2.1 数据价值评估
1.2.2 “数据资产”变现问题
1.2.3 大分析的技术基础
1.2.4 大分析面临的问题
1.3 大分析的应用案例
1.3.1 新的“啤酒和尿布”
1.3.2 KPI信息地图
1.3.3 “大数据、超细分、微营销”
1.4 小结
第2章 大数据基础
2.1 大数据的基本理念
2.1.1 概念和定义探索
2.1.2 大数据的技术基础
2.1.3 没有大分析,大数据就是大垃圾
2.1.4 大数据如何借鉴“数据仓库”的经验
2.1.5 企业级数据中心
2.2 大数据与数据仓库的关系
2.2.1 大数据扩展数据仓库理论架构
2.2.2 大数据继承数据仓库数据管理的经验
2.2.3 大数据开启了非结构化数据的处理
2.2.4 大数据要借鉴数据仓库的生态圈
2.2.5 大数据应继承数据分析技术
2.2.6 与数据库的关系
2.2.7 数据仓库借鉴大数据的营销模式
2.3 大数据的基本特点
2.3.1 “4V”特点
2.3.2 大分析角度的大数据特征
2.4 大数据的价值和意义
2.4.1 围绕客户信息,提供全方位服务
2.4.2 构筑“虚拟团队”,提升团队管理水平
2.4.3 让“智慧城市”“智能交通”等变为可能
2.4.4 构筑“理性社会”终于成为可能
2.4.5 中国前所未有的一次“弯道超车”机遇
2.5 大数据的问题和挑战
2.5.1 数据质量问题越发突出
2.5.2 数据分析技术尚缺实质突破
2.5.3 大数据应用水平需要逐步演进、逐步深化
2.5.4 大数据技术架构面临突破
2.5.5 数据理念与国外仍然相距甚远
2.5.6 大数据是一项系统工程
2.6 小结
第3章 大数据的管理
3.1 数据如何收集
3.1.1 能获取哪些数据
3.1.2 基于数据价值,决定数据的收集、存放策略
3.1.3 没有应用时,是否收集数据
3.2 数据的标准
3.2.1 数据接口
3.2.2 数据模型
3.3 大数据的ETL过程
3.4 大数据如何存储
3.4.1 数据库数据仓库
3.4.2 分布式文件系统(HDFS)
3.4.3 混搭模式
3.4.4 Hive Hbase等
3.4.5 MPP
3.5 数据如何估值和计费
3.5.1 什么数据**卖
3.5.2 市场价格
3.5.3 数据的开放
3.6 大数据的“数据资产”管理
3.7 数据如何保障安全
3.8 小结
第4章 大数据的技术架构
4.1 大数据处理架构
4.1.1 大数据处理层级和域
4.1.2 哪些计算适合并行
4.2 为何是混搭架构
4.2.1 大数据混搭架构的利弊分析
4.2.2 架构是否去IOE
4.2.3 大数据混搭架构实例
4.3 数据集市的模式
4.3.1 数据沙盒模式
4.3.2 贴近角色的平台及应用
4.3.3 文件集市
4.4 数据管控模块
4.4.1 元数据
4.4.2 数据质量
4.5 大数据的“爬虫”技术
4.5.1 定制爬虫Nutch
4.5.2 分词技术—庖丁分词
4.5.3 索引及全文检索—Splunk
4.5.4 上网数据解析流程
4.6 大数据安全管理框架
4.6.1 安全管控技术架构
4.6.2 管理制度建设
4.6.3 去隐私化技术举例
4.7 小结
第5章 大数据的数据质量管控
5.1 数据质量概念
5.1.1 基本概念
5.1.2 大数据就不考虑质量了吗
5.2 元数据
5.2.1 数据的数据
5.2.2 元数据的CWM标准
5.2.3 元数据分类
5.3 数据质量管控
5.3.1 数据质量管控目标
5.3.2 数据质量子系统架构
5.4 如何建立数据质量管理制度
5.4.1 数据质量分工管理流程
5.4.2 及时监控和告警
5.5 数据质量管控产品的客户体验
5.5.1 降低技术门槛
5.5.2 产品的手机App化
5.6 小结
第6章 大数据如何带来大分析
6.1 没有应用的数据是垃圾数据
6.1.1 应用的广度
6.1.2 应用的深度
6.1.3 应用的实时性融合性
6.2 大分析(BA)的概念
6.2.1 “大分析”的发展变化
6.2.2 大分析的“群众路线”
6.3 大分析(BA)的产品开发
6.3.1 基于数据分析,解决实际问题
6.3.2 BA产品和分析工具产品的区隔
6.3.3 自助分析
6.3.4 导航式分析
6.4 应用推广问题
6.4.1 市场的“冬天”就是大分析的“春天”
6.4.2 为何需要应用推广
6.4.3 如何证明分析的独特价值
6.4.4 如何解决员工实际的问题
6.4.5 电信和互联网行业应用推广对比
6.4.6 不同的企业用不同的推广方法
6.5 大分析的“闭环”问题
6.5.1 分析和执行的闭环执行
6.5.2 营销流程的设计—营销管理平台
6.6 小结
第7章 大分析应用案例
7.1 大分析的应用阶段
7.2 非结构化数据的分析
7.2.1 客户投诉内容分析
7.2.2 互联网舆情监控分析
7.3 客户分析
7.3.1 客户生命周期
7.3.2 客户内容属性
7.3.3 客户行为属性
7.3.4 客户新业务分析
7.3.5 客户满意度分析
7.3.6 客户流失分析
7.4 产品分析
7.4.1 建设背景和目的
7.4.2 整体流程
7.4.3 建设中涉及的模型
7.5 内容营销分析
7.5.1 手机视频产品营销触发
7.5.2 手机视频内容分析
7.5.3 目标客户筛选和细分
7.5.4 方案设计
7.5.5 营销脚本设计
7.5.6 营销方式选择
7.5.7 营销方式使用效果
7.5.8 效益评估
7.6 网格化管理分析
7.7 社会渠道欺诈分析
7.7.1 概述
7.7.2 模型方法
7.7.3 模型定义
7.7.4 业务应用
7.7.5 优化方法
第8章 大数据中的互联网思维
8.1 互联网思维介绍
8.1.1 九大特征
8.1.2 大数据为何需要互联网思维
8.1.3 大数据如何借助互联网思维
8.2 BA产品定义
8.3 BA产品的客户体验
8.3.1 客户是谁
8.3.2 客户的体验是什么
8.3.3 提升客户体验的展示形式
8.3.4 提升客户体验的解决问题能力
8.4 BA产品迭代开发
8.4.1 如何构建共享方式
8.4.2 提供API接口
8.4.3 提供类似App Store开发环境
8.5 BA产品的“客户
……
第9章 大数据的管理架构及探索
第10章 后记
|
|