新書推薦:
《
佛山华家班粤菜传承 华家班59位大厨 102道粤菜 图文并茂 菜式制作视频 粤菜故事技法 佛山传统文化 广东科技
》
售價:NT$
1010.0
《
武人琴音(十周年纪念版 逝去的武林系列收官之作 形意拳一门三代:尚云祥、韩伯言、韩瑜的人生故事 凸显百年武人命运)
》
售價:NT$
199.0
《
剑桥斯堪的纳维亚戏剧史(剑桥世界戏剧史译丛)
》
售價:NT$
704.0
《
禅心与箭术:过松弛而有力的生活(乔布斯精神导师、世界禅者——铃木大拙荐)
》
售價:NT$
301.0
《
先进电磁屏蔽材料——基础、性能与应用
》
售價:NT$
1010.0
《
可转债投资实战
》
售價:NT$
454.0
《
王氏之死(新版,史景迁成名作)
》
售價:NT$
250.0
《
敢为天下先:三年建成港科大
》
售價:NT$
352.0
|
內容簡介: |
本书从概念、思维、存储和处理、分析与应用等方面系统介绍了大数据的相关知识,主要内容包括:大数据的基本概念,大数据思维,大数据采集与获取技术,大数据批处理、流式处理和交互式处理框架,Hadoop?项目结构与技术分布,分布式并行编程MapReduce?模型,Spark?技术架构和基本流程,数据特征工程及数据可视化等内容,通过大数据与人工智能技术助力新冠疫情防控、非法集资预警、大型活动安全预警、智慧法院数据融合分析与集成应用等案例,再现场景、数据、数据分析特征选择及分析技术应用的过程,有助于读者对大数据技术、分析及应用有更深刻的体会和了解。本书可作为高等院校计算机、大数据等相关专业的大数据课程导论教材,也可供相关技术人员参考。
|
關於作者: |
方建文,男,所长/教授,衢州学院电气与信息工程学院,获得浙江大学 计算机科学与技术专业 工学博士
|
目錄:
|
第1章 大数据概述11.1 数据11.1.1 数据的概念11.1.2 大数据的概念11.2 大数据发展的技术背景21.2.1 互联网技术的发展21.2.2 存储技术的发展21.2.3 计算能力的发展21.3 大数据的主要来源31.3.1 互联网大数据31.3.2 传统行业大数据31.3.3 音频、视频和数据41.3.4 移动设备的实时记录与跟踪41.4 大数据的特征51.4.1 规模性51.4.2 多样性61.4.3 高速性61.4.4 价值密度低61.5 大数据的应用61.5.1 大数据的应用环境61.5.2 大数据的应用领域71.6 中国的大数据产业链71.7 我国大数据的发展态势101.8 大数据与数字经济12第2章 大数据思维142.1 大数据的思维特点142.1.1 大数据的总体思维142.1.2 大数据的非精确思维152.1.3 大数据的非因果性思维152.1.4 以数据为中心162.1.5 大数据的运营思维162.1.6 数据的收集162.1.7 数据的分类162.2 大数据的应用思维172.3 大数据的价值思维192.3.1 识别与串联价值192.3.2 描述价值192.3.3 时间价值192.3.4 组合价值192.3.5 预测价值202.4 大数据的分析思维202.5 大数据分析的特点21第3章 大数据采集与获取技术253.1 数据源分布253.2 内部数据263.2.1 政府内部数据263.2.2 各利益主体自营数据263.2.3 物联网数据273.2.4 互联网数据273.3 内部数据获取方法283.3.1 内部数据的ETL技术283.3.2 常用ETL工具说明303.4 外部数据及获取方法323.4.1 网络数据源的特性与价值323.4.2 网络爬虫333.4.3 网络爬虫应用注意事项343.5 深网的数据及获取的方法353.5.1 深网的含义353.5.2 深网数据的特点363.5.3 深网数据的获取方法36第4章 大数据存储与管理技术384.1 数据存储的基本概念384.1.1 存储容量384.1.2 存储性能384.1.3 存储可靠性和可用性394.1.4 存储成本404.2 常用的数据存储介质404.2.1 机械硬盘404.2.2 固态硬盘414.2.3 可记录光盘424.2.4 U盘424.2.5 闪存卡434.2.6 数据存储介质的选择原则434.3 数据存储模式434.3.1 DAS444.3.2 NAS454.3.3 SAN464.3.4 存储模型选择474.4 大数据管理技术474.1.1 文件系统474.4.2 分布式文件系统484.4.3 数据库514.4.4 键-值数据库524.4.5 分布式数据库534.4.6 关系型数据库544.4.7 数据仓库554.4.8 文档数据库564.4.9 图形数据库574.4.10 云存储58第5章 大数据处理技术615.1 大数据处理框架分类615.1.1 批处理框架615.1.2 流式处理框架625.1.3 交互式处理框架635.2 Hadoop635.2.1 Hadoop?项目结构及技术分布645.2.2 MapReduce?模型655.3 Spark675.3.1 技术架构685.3.2 基本流程685.3.3 Spark?程序运行流程69第6章 大数据分析技术716.1 大数据分析的概念716.2 大数据的处理流程716.3 大数据分析的方法726.4 数据特征工程736.4.1 特征构建746.4.2 特征选择756.4.3 特征提取766.5 大数据分析的主要技术766.5.1 深度学习766.5.2 知识计算806.6 数据可视化896.6.1 数据可视化分析方法906.6.2 可视化分析的常用工具926.6.3 数据可视化的应用举例93第7章 大数据安全947.1 大数据安全概述947.1.1 大数据安全的意义957.1.2 大数据安全面临的问题957.2 大数据隐私保护977.2.1 数据保护与保密987.2.2 国内隐私保护相关政策法规987.3 典型案例1007.3.1 棱镜门事件1007.3.2 维基解密1017.3.3 Facebook?数据滥用事件1017.3.4 手机应用软件过度采集个人信息1027.3.5 12306?数据泄露1037.3.6 免费Wi-Fi?窃取用户信息1037.3.7 收集个人隐私信息的“探针盒子”104第8章 大数据与云计算、物联网、人工智能1058.1 云计算1058.1.1 云计算的概念1058.1.2 云计算的特点1058.1.3 云计算的分类1068.1.4 云计算的服务模式1078.1.5 主流的云计算厂商1088.2 物联网1118.2.1 物联网的概念1118.2.2 物联网的核心技术1118.2.3 物联网的特点1128.3 人工智能1138.3.1 人工智能的概念1138.3.2 人工智能的关键技术1148.4 大数据与云计算、物联网和人工智能的关系116第9章 大数据应用1189.1 大数据与人工智能技术在新冠疫情防控中的应用1189.1.1 助力新型冠状病毒疫情防控的进展1189.1.2 助力新型冠状病毒智能医疗诊断服务1199.1.3 助力新型冠状病毒疫苗研发和药物筛选1209.1.4 助力抗疫资源的生产组织与调度1209.1.5 助力新型冠状病毒疫情溯源与监测预警1219.2 大数据用于非法集资预警1229.2.1 挑战1239.2.2 实施过程/解决方案1239.2.3 效果总结1269.3 大数据在大型活动安全预警中的应用1269.3.1 问题分析1279.3.2 总体架构1279.3.3 核心技术1299.3.4 实际应用1309.4 ?“智慧法院”数据融合分析与集成应用1309.4.1 应用背景1309.4.2 ?“智慧法院”数据融合分析及集成应用示范平台架构1319.4.3 共性关键技术1339.4.4 应用案例135参考文献138
|
|