新書推薦:
《
启微·狂骉年代:西洋赛马在中国
》
售價:NT$
357.0
《
有趣的中国古建筑
》
售價:NT$
305.0
《
十一年夏至
》
售價:NT$
347.0
《
如何打造成功的商业赛事
》
售價:NT$
407.0
《
万千教育学前·透视学前儿童的发展:解析幼儿教师常问的那些问题
》
售價:NT$
265.0
《
慈悲与玫瑰
》
售價:NT$
398.0
《
启蒙的辩证:哲学的片简(法兰克福学派哲学经典,批判理论重要文本)
》
售價:NT$
347.0
《
心跳重置
》
售價:NT$
269.0
|
編輯推薦: |
1.体系完整、层次清晰:本书内容全面但不厚重,既全面介绍了大数据分析基础认知、核心架构、计算模式,大数据与网络空间安全,大数据与自然语言处理等理论知识。同时呈现了大数据分析应用案例、大数据与医学信息处理等实践操作。内容涵盖多门单项技术的同时保持结构的清晰和知识的系统性。
2.技术先进:本书在系统梳理基础知识的基础上融入了作者团队多年的研究成果,引入新理论、新技术、新方法、心安理得,保证了其理论技术的先进性、应用性和前瞻性。
3.多学科交叉融合:本书内容涵盖了计算机科学与技术、信息与通信工程、网络空间安全等多学科知识,也成为网络空间安全、信息与通信工程、计算机科学与技术、软件工程等学科的必修教学内容。
4.注重人才培养:本书有助于全面培养学生的大数据理论技术能力,引导培养有竞争力的数据科学家。本书还融入人文素养的培养,主要涉及大数据与数据分析相关的算法可用、道德、隐私、法律、只是产权保护、经济和社会影响等。
|
內容簡介: |
本书系统、全面地研究和论述大数据分析理论与技术,主要内容包括大数据分析基础认知、大数据分析核心架构、大数据分析计算模式、大数据与网络空间安全、大数据与自然语言处理、大数据与医学信息处理。
本书可满足各类高校多样化人才长期培养的需求,可供从事网络空间安全、计算机科学与技术、软件工程、人工智能、信息与通信工程等相关学科专业的教学、科研、应用人员阅读和使用,对从事大数据分析相关研究的人员具有重要的实用和参考价值。此外,本书也可供其他非专业及相关研究人员参考使用,具有重要的指导意义。
|
關於作者: |
罗森林,1968年出生,教授、博导。1992、1995年分获得哈尔滨电工学院电子工程系电磁测量及仪表专业学士和硕士学位;1998年获得北京理工大学电子工程系通信与电子系统博士学位;2000年10月于中国科学院计算技术研究计算机科学博士后流动站出站后到北京理工大学工作。
北京市教学名师,信息与通信工程学科责任教授、信息对抗技术专业责任教授,信息系统及安全对抗实验中心(工信部)主任、信息安全与对抗技术研究所所长,深圳北理莫斯科大学电子与计算机专业责任教授,首批国家一流本科专业、教育部、北京市、国防特色专业和工信部重点专业建设负责人。
出版著作15部(规划教材4部,北京市精品教材4部),累计出版5万册以上。发表学术论文200多篇,获批专利近30项,国内项信息安全与对抗技术竞赛(ISCC)发起人(2004起每年1届,18届累计参赛者超过7.2万人,每年参加院校数1000多所),在线开放课程7门次(6门次,累计学习者7.5万人次以上),获省部级以上荣誉近50项。
国家网络安全产业园区专家咨询委员会委员,中国兵工学会理事会理事,中国兵器学会信息安全与对抗专业委员会总干事,广西信息安全学会理事长,中国计算机用户协会信息安全分会副理事长,中国人工智能学会人工智能与安全专业委员会常务委员,北京高校“习近平新时代中国特色社会主义思想”市级思想政治理论课授课教师,北京理工大学课程思政研究中心专家,北京理工大学教师发展指导专家等。
|
目錄:
|
第1章 大数据分析基础认知 001
1.1 引言 001
1.2 知识基础 001
1.2.1 基本概念 001
1.2.2 数据科学与其他学科的关系 004
1.3 历史现状 006
1.3.1 发展历史 006
1.3.2 研究现状 008
1.3.3 中国大数据研究与发展战略 010
1.4 主要应用 011
1.4.1 互联网行业主要应用 011
1.4.2 医疗行业主要应用 012
1.4.3 金融行业主要应用 014
1.4.4 交通行业主要应用 014
1.4.5 教育行业主要应用 014
1.5 存在问题 015
1.5.1 数据存储 015
1.5.2 信息安全 015
1.5.3 数据共享 017
1.6 发展趋势 018
1.6.1 大数据技术发展趋势 018
1.6.2 大数据应用发展趋势 019
1.7 小结 021
1.8 习题 022
第2章 大数据分析核心架构 023
2.1 引言 023
2.2 数据分析架构认知基础 023
2.2.1 软件架构 023
2.2.2 数据库及管理系统 026
2.2.3 并行计算 028
2.2.4 分布式计算 029
2.2.5 云计算 032
2.3 分析架构Hadoop 034
2.3.1 Hadoop基础知识 034
2.3.2 Hadoop系统架构 035
2.3.3 Hadoop典型案例 040
2.3.4 Hadoop编程接口 042
2.4 分布式文件系统HDFS 046
2.4.1 HDFS基础知识 046
2.4.2 HDFS系统架构 047
2.4.3 HDFS主要特征 049
2.4.4 HDFS编程接口 051
2.5 分析架构Spark 055
2.5.1 Spark基础知识 055
2.5.2 Spark系统架构 056
2.5.3 Spark主要特征 059
2.5.4 Spark典型案例 061
2.5.5 Spark编程接口 063
2.6 分布式数据库Hbase 066
2.6.1 Hbase基础知识 066
2.6.2 Hbase系统架构 067
2.6.3 Hbase主要特征 069
2.6.4 Hbase编程接口 071
2.7 数据仓库Hive 073
2.7.1 Hive基础知识 073
2.7.2 Hive系统架构 074
2.7.3 Hive主要特征 076
2.7.4 Hive编程接口 077
2.8 小结 079
2.9 习题 080
第3章 大数据分析计算模式 081
3.1 引言 081
3.2 数据分析挖掘认知基础 081
3.2.1 模式识别认知基础 081
3.2.2 数据挖掘认知基础 084
3.3 静态批处理MapReduce 087
3.3.1 基础知识 087
3.3.2 编程模型 088
3.3.3 体系结构 090
3.3.4 工作流程 092
3.3.5 容错机制 095
3.3.6 编程实例 095
3.3.7 典型案例 099
3.4 实时流计算Storm 100
3.4.1 基础知识 100
3.4.2 编程模型 101
3.4.3 体系结构 104
3.4.4 工作流程 104
3.4.5 容错机制 105
3.4.6 编程实例 106
3.4.7 典型案例 107
3.5 图计算Pregel 108
3.5.1 基础知识 108
3.5.2 编程模型 109
3.5.3 体系结构 111
3.5.4 工作流程 112
3.5.5 容错机制 113
3.5.6 编程实例 114
3.5.7 典型案例 116
3.6 数据可视化 118
3.6.1 可视化简介 118
3.6.2 可视化方法 119
3.6.3 可视化技术 122
3.6.4 可视化工具 124
3.6.5 可视化案例 125
3.6.6 可视化发展趋势 126
3.7 小结 127
3.8 习题 127
第4章 大数据与网络空间安全 129
4.1 引言 129
4.2 网络空间安全认知基础 129
4.2.1 信息网络知识基础 130
4.2.2 信息安全对抗的基本概念 132
4.2.3 信息安全对抗基础理论概述 134
4.3 网络空间安全大数据基础资源 137
4.3.1 用户数据 137
4.3.2 行业数据 137
4.3.3 流量日志数据 139
4.3.4 网络舆情数据 139
4.3.5 应用数据集 139
4.4 网络空间大数据安全分析 141
4.4.1 安全事件关联分析 141
4.4.2 网络异常检测分析 143
4.4.3 数据内容安全分析 146
4.4.4 安全态势感知分析 148
4.4.5 安全分析应用案例 152
4.5 网络空间大数据安全防护 156
4.5.1 大数据的威胁与攻击 156
4.5.2 大数据安全防护技术 160
4.5.3 大数据安全建设案例 166
4.6 小结 171
4.7 习题 171
第5章 大数据与自然语言处理 173
5.1 引言 173
5.2 自然语言处理认知基础 174
5.2.1 研究简史 174
5.2.2 基本概念 175
5.2.3 基本方法 175
5.2.4 面临困难 176
5.3 自然语言处理大数据基础资源 176
5.3.1 基础语料库 176
5.3.2 语言知识库 180
5.3.3 知识图谱 182
5.4 自然语言处理大数据分析技术 184
5.4.1 实体关系抽取 185
5.4.2 命名实体识别 190
5.4.3 情感分类 194
5.4.4 文本摘要 198
5.4.5 机器翻译 204
5.4.6 自动问答 206
5.5 自然语言处理大数据分析应用案例 210
5.5.1 IBM沃森大型问答系统 210
5.5.2 百度机器翻译系统 214
5.5.3 微软机器人小冰 216
5.5.4 BFS舆情分析系统 219
5.6 小结 227
5.7 习题 227
第6章 大数据与医学信息处理 229
6.1 引言 229
6.2 医学信息处理基础认知 229
6.2.1 基本概念 229
6.2.2 研究简史 230
6.2.3 基本方法 232
6.2.4 面临困难 233
6.3 医学信息处理大数据基础资源 234
6.3.1 基因数据资源 235
6.3.2 医学图像资源 236
6.3.3 电子健康记录 238
6.3.4 医学语音记录 240
6.4 医学信息处理大数据分析技术 241
6.4.1 基因序列分析 241
6.4.2 医学图像处理 245
6.4.3 电子病历分析 249
6.4.4 医学语音处理 252
6.5 医学信息处理大数据分析应用案例 254
6.5.1 精准医疗 255
6.5.2 糖尿病健康促进系统 259
6.5.3 老年健康综合评估系统 267
6.5.4 远程医疗 271
6.6 小结 273
6.7 习题 274
参考文献 275
|
內容試閱:
|
针对规模巨大的数据,大数据分析可以从数据资源中揭示内在规律、挖掘有用信息和帮助人们科学决策,其战略意义不仅在于数据资源的累积,更在于对其进行分析处理。大数据分析已经成数据科学的新常态,具有明显的多学科交叉特征,目前无论是高校、研究所还是企业,均要对其进行深入研究和应用。大数据分析成为计算机科学与技术、网络空间安全、信息与通信工程、软件工程、人工智能、数据科学等学科专业的必修内容,几乎所有的重点院校均有这些学科专业。
本书系统讨论了大数据理论与技术的体系框架及其核心知识图谱,融入著者的研究成果,主要内容包括大数据分析基础认知、大数据分析核心架构、大数据分析计算模式、大数据与信息安全对抗、大数据与自然语言处理、大数据与生物信息处理等。本书编写的目的是全面培养学生的大数据理论技术能力,加强其对数据科学基础理论和应用的理解,使其争取成为有竞争力的数据科学家。通过学习本书,可以增强学生的如下能力:综合运用计算机和数学知识分析处理大规模数据集的能力、从复杂数据中快速得到信息和发现关系的能力、现实世界具体问题的建模能力等。
体系结构方面,强调知识的系统性、层次性,突出重点既见树木又见森林,内容全面但不厚重。纵向上分为理论技术与工程实践,横向上强调网络空间安全、自然语言处理、生命信息处理等多学科应用。在抓住其精要的同时知识点尽量全面,涵盖多门单项技术的同时保持知识结构的系统性,有利于核心知识的快速理解与掌握。
内容范围方面,注重内容的深入性、先进性、时效性,强调交叉学科理论与实践的有机结合。适应大数据理论技术的动态发展,保证其理论技术核心知识的基础性和长时有效性;引入新理论、新技术、新方法、新案例,融入作者研究成果,保证其理论技术的先进性和前瞻性。
灵活使用方面,基于研究型教学思想注重读者的兴趣和学习的灵活性,支持学习的可持续发展,关注学习的间接效果,可满足各类高校多样化人才长期培养的需求。同时,融入人文素养的培养,讨论大数据分析中的非技术和工程类问题,涉及算法的可用性、隐私和社会影响等。
本书由罗森林、潘丽敏共同撰写,其中第4、5、6章由潘丽敏负责撰写,其余部分由罗森林负责撰写,罗森林负责全书的章节设计、内容规划和统稿。
本书的编写得到了北京理工大学教务部肖煊、刘畅、朱元捷等同志以及信息安全与对抗技术研究所刘晓双、郝靖伟、李新帅、闫晗、李玉、张寒青等同学多方面的帮助,在此一并表示衷心的感谢。同时,衷心感谢北京理工大学出版社王晓莉老师对本书详细、认真的修改和热情帮助,衷心感谢北京理工大学出版社多方面的支持和帮助。
由于时间和能力所限,书中难免会有不足和疏漏之处,敬请广大读者批评指正,以便再版时更加完善。
|
|