新書推薦:
《
宋初三先生集(中国思想史资料丛刊)
》
售價:NT$
990.0
《
简帛时代与早期中国思想世界(上下册)(王中江著作系列)
》
售價:NT$
1400.0
《
天生坏种:罪犯与犯罪心理分析
》
售價:NT$
445.0
《
新能源材料
》
售價:NT$
290.0
《
传统文化有意思:古代发明了不起
》
售價:NT$
199.0
《
亚述:世界历史上第一个帝国的兴衰
》
售價:NT$
490.0
《
人工智能与大数据:采煤机智能制造
》
售價:NT$
440.0
《
新民说·逝去的盛景:宋朝商业文明的兴盛与落幕(上下册)
》
售價:NT$
790.0
|
編輯推薦: |
覆盖数据全生命周期,从理念、理论、实操和应用的不同视角,全面讲解数据思维,并培养受众的数据思维模式,使其成为数据行业专业人员,提高其战略思维和技术能力,同时推动数据行业理论发展、创新应用与理念传播。
|
內容簡介: |
大学生所接受的数据类先导或通识教育较为分散,不够深入,且理论多实操少,不能有效提升其数据素养和核心竞争力。数据行业从业人员面对工作压力和自我提升的需要,急需一门随时随地可学的专业通识课程。该课是市场需求的产物,将得到大学生和数据行业从业人员的热切欢迎。 主要特色体现为:使学生全面理解数据思维的新科学范式,覆盖数据全生命周期,从理念、理论、实操和应用不同视角,全面讲解并培养受众的数据思维模式,使其成为数据行业专业人员,提高其战略思维和技术能力,同时推动数据行业理论发展、创新应用与理念传播。
|
關於作者: |
胡广伟,男,管理学博士,南京大学信息管理学院教授、博导,政务数据资源研究所所长,教育部新世纪优秀人才、江苏省六大人才高峰等称号。从事政府大数据、电力大数据、机器学习、自然语言处理(NLP)等方向的研究工作。主持包括国家自然科学基金等15项。发表SSCI、SCI等一流期刊学术论文60余篇,出版专著2部,获省部级奖励4项。
|
目錄:
|
第1章 数据思维导论
1.1 数、数据与大数据
1.1.1 数
1.1.2 数据
1.1.3 大数据
1.2 数据科学
1.2.1 数据科学的内涵及兴起
1.2.2 数据科学的学科定位
1.2.3 数据科学的研究内容
1.2.4 数据科学的工作流程
1.3 相关的思维范式
1.3.1 思维
1.3.2 科学思维
1.3.3 统计思维
1.3.4 数据思维
小结
讨论与实践
参考文献
第2章 数据思维基础
2.1 数据思维的产生
2.1.1 思维原料的变化
2.1.2 思维主体的变化
2.1.3 思维工具的变化
2.1.4 思维形式的变化
2.2 数据思维的范式
2.2.1 科学方法论
2.2.2 科学认识论
2.2.3 科学行动范式
2.3 数据思维的特点
2.3.1 整体性
2.3.2 量化性
2.3.3 互联性
2.3.4 价值性
2.3.5 动态性
2.4 数据思维的局限
2.4.1 全数据模式的幻像
2.4.2 量化思维的焦虑
2.4.3 相关性的过度崇拜
2.5 数据思维的应用
2.5.1 数据思维的应用价值
2.5.2 数据思维的应用流程
2.5.3 数据思维的应用方法
2.6 数据行为
2.6.1 数据行为的概念
2.6.2 数据行为的分类
2.6.3 数据行为的基本原则
小结
讨论与实践
参考文献
第3章 数据思维原理: 信息学视角
3.1 最大熵原理
3.1.1 熵及信息熵的概念
3.1.2 最大熵原理的内涵
3.1.3 最大熵原理的应用
3.2 最小努力原理
3.2.1 最小努力原理的内涵
3.2.2 最小努力原理的应用
3.3 对数透视现象
3.3.1 对数透视现象的内涵
3.3.2 网络环境下的对数透视现象
3.4 信息生命周期理论
3.4.1 信息生命周期的内涵
3.4.2 信息生命周期运动的认识
3.4.3 信息生命周期理论
3.4.4 大数据与信息生命周期理论
3.5 小世界现象
3.5.1 小世界现象的由来
3.5.2 小世界现象的研究类型
3.5.3 小世界网络现象的应用
小结
讨论与实践
参考文献
第4章 数据思维模式
4.1 全数据思维
4.1.1 抽样数据: 以小见大
4.1.2 全数据: 以大见小
4.1.3 大数据: 还原事物间的联系
4.2 容错性思维
4.2.1 允许出现错误
4.2.2 混杂的大数据也可能更精确
4.2.3 接受混杂是趋势
4.3 实时性思维
4.3.1 成批处理方式
4.3.2 实时处理方式
4.3.3 两种处理方式对比
4.4 相关性思维
4.4.1 相关关系
4.4.2 相关性思维的应用
4.4.3 如何处理两种关系
小结
讨论与实践
参考文献
第5章 数据生产
5.1 数据生产的概念
5.2 数据生产的特点
5.3 数据生产的目标
5.3.1 采集全量数据
5.3.2 发现数据的新价值
5.3.3 考虑外部用户的需求
5.4 数据生产的阶段
5.5 数据的生产源
5.5.1 互联网数据
5.5.2 移动网络数据
5.5.3 物联网数据
小结
讨论与实践
参考文献
第6章 数据采集
6.1 数据采集的概念
6.2 数据来源
6.3 数据选择
6.4 数据采集的方法及工具
6.4.1 系统日志采集方法
6.4.2 传感器采集方法
6.4.3 网络爬虫采集方法
6.4.4 其他数据采集方法
小结
讨论与实践
参考文献
第7章 数据存储
7.1 传统数据存储
7.1.1 存储设备
7.1.2 存储系统网络架构
7.2 大数据时代的数据存储
7.2.1 大数据存储系统的特点
7.2.2 分布式存储
7.2.3 云存储
7.3 数据库技术
7.3.1 数据库技术的发展
7.3.2 关系数据库
7.3.3 NoSQL
小结
讨论与实践
参考文献
第8章 数据预处理
8.1 数据预处理的必要性
8.2 数据清洗
8.2.1 缺失数据处理
8.2.2 冗余数据处理
8.2.3 噪声数据处理
8.3 数据变换
8.3.1 大小变换
8.3.2 类型变换
8.4 数据集成
8.4.1 内容集成
8.4.2 结构集成
8.5 其他预处理方法
8.5.1 数据脱敏
8.5.2 数据归约
8.5.3 数据标注
小结
讨论与实践
参考文献
第9章 数据分析
9.1 业务理解
9.2 数据理解
9.3 数据分析分类
9.3.1 结构化数据分析
9.3.2 文本分析
9.3.3 Web数据分析
9.3.4 多媒体数据分析
9.3.5 社交网络数据分析
9.3.6 移动数据分析
9.4 数据分析方法的选择
9.4.1 分类算法
9.4.2 聚类算法
9.4.3 关联分析
9.4.4 回归分析
9.4.5 深度学习
9.4.6 统计方法
9.5 数据分析常见陷阱
小结
讨论与实践
参考文献
第10章 数据可视化
10.1 数据可视化概述
10.2 Microsoft Excel
10.2.1 创建图表
10.2.2 选择正确的图表
10.3 Tableau
10.3.1 Tableau Desktop
10.3.2 Tableau Online
10.3.3 Tableau Mobile
10.4 ECharts
10.4.1 丰富的可视化类型
10.4.2 获取ECharts
10.4.3 ECharts简单案例
10.5 Rggplot2
10.6 D3.j s
10.7 Processing
10.8 BDP
小结
讨论与实践
参考文献
第11章 数据之殇
11.1 数据安全
11.1.1 数据安全的概念
11.1.2 数据安全的价值
11.1.3 数据安全的威胁
11.1.4 数据安全技术
11.2 数据治理
11.2.1 数据治理的概念
11.2.2 数据治理的意义
11.2.3 数据治理内容
11.3 数据伦理
11.3.1 数据中立性
11.3.2 数据独裁
11.3.3 道德判断
小结
讨论与实践
参考文献
第12章 数据思维的应用
12.1 城市治理中的数据思维
12.1.1 大数据与城市治理
12.1.2 大都市在行动
12.2 数字金融中的数据思维
12.2.1 银行
12.2.2 数字化资产管理
12.3 智慧物流中的数据思维
12.3.1 菜鸟驿站
12.3.2 货车帮
12.3.3 运满满
12.4 智慧医疗中的数据思维
12.4.1 BAT布局互联网医疗
12.4.2 医疗职业的改变
12.4.3 移动医疗新模式
12.5 人工智能中的数据思维
12.5.1 AlphaGo,仅仅是开始
12.5.2 自动驾驶汽车的困境
12.5.3 感知识别技术的大爆发
12.6 智能制造中的数据思维
12.6.1 北科亿力科技
12.6.2 江苏沙钢集团
12.6.3 上海仪电显示
12.7 现代农业中的数据思维
12.7.1 北京佳格天地
12.7.2 北京农信互联
小结
讨论与实践
参考文献
|
內容試閱:
|
如今,从语音助手、人脸识别、以图搜车、无人驾驶、城市大脑,到普适计算、雾计算、单粒度治理、量子思维等技术、方法、应用已成为社会发展的新动能。数据自古有之,然而移动互联网、云计算、物联网的普及为我们累积了多维度、细粒度,以及来自不同视角的数据。数据资源被广泛应用于人类社会生产、生活、科研、治理等的方方面面,成为并列于资本、劳动和自然资源的新的生产资料,对世界的政治、经济、文化、科技产生了深刻的影响。这是大数据这个崭新时代为人类社会呈上的新礼物,也是人类文明进化道路上开出的鲜艳花朵。
阿里巴巴、腾讯、脸书Facebook、今日头条、亚马逊Amazon、百度、谷歌Google等世界领先的公司正在应用这些数据改造我们的生活与工作模式,商汤、小米、寒武纪、波士顿动力Boston Dynamic、亿嘉和、科沃斯、谷歌语音助手Duplex等智能代理与智能对象正改变着我们社会的结构,人智物的融合正在加速。乃至未来战场、货币形态、大国争端,都随着大数据的深入应用在发生巨变。2015年,党和国家正式提出国家大数据战略,先后出台《促进大数据发展行动纲要》《大数据产业发展规划20162020》等纲领性文件; 2017年国务院印发《新一代人工智能发展规划》,人工智能正式上升为国家战略。
新兴技术赋能、赋权、赋值(价值)的同时,也冲击着我们现成的思维方式,正引发新观念的产生、新模式的出现、新思维的塑造、新治理的构建。正如涂子沛先生所言,数据带来了一种新文明的兴起。因为,数据让人类历史上一些精细的、微妙的、隐形的,甚至曾经难以捕捉表述的关系和知识,在今天都变为显性的关系和知识,清清楚楚地为我们所用。数据为国家治理提供了新的工具和手段,越来越多的个人行为被记录,每一辆车或者每一个物体都可以被追踪,我们的社会呈现出越来越清晰的纹理。大量的事实得以还原再现,我们的侥幸心理得到了抑制,人性的幽暗之处得以光明,我们正迈向一个更加文明、安全的时代。
数据的价值得到了空前的关注,然而在实践中还存在很多误区,也屡屡出现奇葩的故事,例如大数据杀熟非人所愿、谷歌无人驾驶汽车事故、AlphaGo输棋、Facebook风波、IBM Watson项目的失败等。这些故事的背后都反映出我们在思维层面的某种偏误,以为大数据就是全数据,以为智能可战胜智慧,以为数据强就合乎伦理,以为科技可以代替人类等,也对数据的开发利用提出了反思。
时代的召唤,作为身在时代洪流中的我们,如何从看戏到入戏?为此,本书由浅入深地讲述了数据思维的产生、原理与模式,并介绍了数据思维指导下的现代数据管理流程以及数据思维应用实例,尝试帮助读者理解数据的本质,逐步培养用数据去观察事物、思考问题、分析问题、解决问题的行为模式。例如,针对企业、组织有数据而无大数据的问题提出革新统计指标体系的思路,从而革新组织的数据采集工具; 针对没有大数据的困惑,本书提出数据生产的思维; 针对组织数字化转型的困境,建议从数字孪生着手技术创新; 针对日益增多的大数据之殇,建议研究数据行为,如此等等,帮助读者从思维层面展开训练,改变思考问题的模式与方式。
本书共有12章,可分为理论部分第1~4章、方法实训部分第5~11章与应用实践部分第12章。本书的编著得到了杨金龙、赵思雨、魏畅、刘露、杨巳煜、韩磊、路伯言、司文峰、刘建霞等多位博士与硕士研究生的参与,得到了南京大学双一流百层次教育改革基金、南京大学信息管理学院精品课程建设项目,以及国家双创示范基地项目的支持。本书的撰写还得到了领域内多位专家学者的指点、斧正,在此一并致谢!
胡广伟2020年3月
|
|