新書推薦:
《
万千心理·我的精神分析之道:复杂的俄狄浦斯及其他议题
》
售價:NT$
475.0
《
荷马:伊利亚特(英文)-西方人文经典影印21
》
售價:NT$
490.0
《
我的心理医生是只猫
》
售價:NT$
225.0
《
股权控制战略:如何实现公司控制和有效激励(第2版)
》
售價:NT$
449.0
《
汉译名著·哲学经典十种
》
售價:NT$
3460.0
《
成吉思汗传:看历代帝王将相谋略 修炼安身成事之根本
》
售價:NT$
280.0
《
爱丁堡古罗马史-罗马城的起源和共和国的崛起
》
售價:NT$
349.0
《
人生解忧:佛学入门四十讲
》
售價:NT$
490.0
|
內容簡介: |
本书是将Python和计算传播学相结合的典型教材,全面介绍了使用Python进行计算传播学实战的相关知识,由浅入深地介绍了Python中与计算传播学相关的库,并通过项目案例对所学知识加以巩固与加深。本书主要内容包括Python与计算传播学、Python编程基础、数据处理与分析基础、数据可视化基础,以及Python计算传播学实践项目案例。本书体系完整、内容丰富,尤为注重实战教学。
本书既可作为普通高等院校计算传播学的基础教材,也可作为职业培训教育机构及相关技术人员的参考用书。
|
目錄:
|
第1章 Python与计算传播学 1
1.1 Python与计算传播学简介 1
1.1.1 计算传播学介绍 1
1.1.2 Python介绍 2
1.1.3 Python常用计算传播学库 3
1.1.4 安装Anaconda发行版Python 7
1.2 Jupyter Notebook编程工具 10
1.2.1 启动Jupyter Notebook 10
1.2.2 新建一个Notebook 11
1.2.3 Jupyter Notebook的界面及其构成 12
1.2.4 Markdown 13
本章小结 17
第2章 Python编程基础 18
2.1 Python固定语法 18
2.1.1 声明与注释 18
2.1.2 保留字符与赋值 20
2.1.3 缩进 22
2.2 数据类型 23
2.2.1 数值 23
2.2.2 字符串 25
2.2.3 列表 28
2.2.4 字典 31
2.3 常用运算符 34
2.3.1 算术运算符 34
2.3.2 赋值运算符 35
2.3.3 比较运算符 36
2.3.4 逻辑运算符 37
2.3.5 成员运算符 37
2.3.6 运算符优先级 38
2.4 控制语句 39
2.4.1 if-elif-else语句 39
2.4.2 for语句 41
2.4.3 while语句 43
2.4.4 跳出循环 45
2.5 自定义函数 48
2.5.1 基本语法 48
2.5.2 参数 50
2.5.3 作用域 51
2.6 Python库 53
2.6.1 pip安装库 53
2.6.2 库调用方式 57
本章小结 58
第3章 数据处理与分析基础 59
3.1 NumPy基础 59
3.1.1 ndarray的创建与索引 60
3.1.2 ufunc 65
3.2 pandas数据读写 69
3.2.1 CSV 69
3.2.2 Excel 71
3.2.3 数据库 73
3.3 pandas基础类 76
3.3.1 序列 77
3.3.2 数据框 82
3.3.3 时间戳 86
3.4 pandas基础操作 90
3.4.1 索引 90
3.4.2 排序 97
3.4.3 合并 100
3.5 pandas与统计分析 106
3.5.1 描述性统计 106
3.5.2 分组运算 113
3.6 pandas与数据清洗 118
3.6.1 缺失值处理 118
3.6.2 重复数据处理 123
本章小结 124
第4章 数据可视化基础 125
4.1 Matplotlib基础图像绘制 125
4.1.1 绘图基础 125
4.1.2 rc参数与中文显示 130
4.1.3 散点图 131
4.1.4 折线图 134
4.1.5 饼图 137
4.1.6 条形图 138
4.2 Seaborn进阶绘图 140
4.2.1 Seaborn基础 140
4.2.2 关系图 142
4.2.3 热力图 155
4.2.4 网格图 157
本章小结 163
第5章 新闻关键词提取 164
5.1 背景与目标 164
5.1.1 数据说明 165
5.1.2 目标与流程 165
5.2 探索分析 166
5.2.1 数据加载 166
5.2.2 时间信息提取 167
5.2.3 绘制分布直方图并与百度指数比对 168
5.3 文本预处理 171
5.3.1 去除缺失数据和重复数据 171
5.3.2 分词 172
5.3.3 去停用词 175
5.4 模型构建与应用 176
5.4.1 主题分析概述 176
5.4.2 关键词提取算法 177
5.4.3 结果分析 184
本章小结 185
第6章 评论情感分析 186
6.1 背景与目标 186
6.1.1 数据说明 187
6.1.2 目标与流程 187
6.2 探索分析 188
6.2.1 数据加载 188
6.2.2 时间信息提取 188
6.2.3 绘制分布直方图 189
6.3 文本预处理 191
6.3.1 清洗冗余数据 191
6.3.2 机械压缩去词 192
6.3.3 分词与去停用词 195
6.4 模型构建与应用 195
6.4.1 情感分析概述 195
6.4.2 基于百度Senta和PaddleHub的文本情感分析 198
6.4.3 LDA主题模型 200
6.4.4 结果分析 203
本章小结 204
第7章 社会网络分析 205
7.1 背景与目标 205
7.1.1 数据说明 206
7.1.2 目标与流程 207
7.2 探索分析 208
7.2.1 数据加载 208
7.2.2 分析用户的关注与被关注情况 209
7.2.3 分析用户关注、被关注、赞同数、感谢数之间的相关关系 210
7.2.4 分析用户的主题关注情况 211
7.2.5 分析用户的问题回答情况 212
7.3 数据预处理 213
7.4 网络分析 214
7.4.1 知乎社交网络概述 214
7.4.2 构建社交网络 216
7.4.3 社交网络分析 218
本章小结 224
参考文献 225
|
內容試閱:
|
随着数字化进程的推进,数据不仅改变了人们的生活方式和信息传播行为,也改变了人们观察和认识世界的方式。人工智能与大数据驱动的计算范式延伸至社会科学领域。受传统传播学定量研究范式、数据科学和网络科学的影响和启发,计算传播学方兴未艾,已经成为计算社会科学的重要分支学科之一。
计算传播学可以看作数据科学在传播学领域的延伸,而Python是当前数据科学的主流语言,通过Python可以实现数据清洗、数据分析、数据挖掘、文本挖掘、数据可视化等一系列与数据科学相关的内容。
本书是《计算传播学与网络爬虫》的姊妹篇,承接上一本书的步骤,从网络爬虫过渡到具体的计算传播学的Python实现。本书围绕Python展开,采用深入浅出的叙述方式,简明扼要地阐述了与计算传播学相关的Python库,而后阐述了学习计算传播学的Python编程、数据处理与分析、数据可视化等知识。本书的目的是让广大读者掌握Python与计算传播学相关的知识,从而让Python更好地服务于计算传播学的研究。
在编写原则上,本书既保持了Python计算传播学技术的系统性和理论性,又用大量篇幅讲解了与计算传播学相关的Python项目案例,让读者在使用本书进行学习的过程中,不仅能够收获理论知识,还能够动手实操,从而真正掌握Python在计算传播学中的应用。
本书的出版得到了中央引导地方科技发展资金项目(桂科AD20238065)、广西自然科学基金项目(2018GXNSFDA050014)、广西高等教育本科教学改革工程项目(2019JGA227)、广西壮族自治区信息中心、广西壮族自治区大数据研究院、广西“八桂学者”建设工程专项经费、广西高等学校高水平创新团队及卓越学者计划、南宁师范大学教材建设基金资助。
本书由隆广庆担任主编,由周飞、黄在堂、彭新永、谈超洪、郑廷和担任副主编,梁颖涛、郭琳、胡中全、邓科、陈喜凤、林秀梅、陈羽峰、周飞伶和陈鸣参与编写。具体编写分工如下:第1章由黄在堂和梁颖涛编写;第2章由彭新永和郭琳编写;第3章由谈超洪和周飞编写;第4章由郑廷和和胡中全编写;第5章由邓科和陈喜凤编写;第6章由林秀梅和陈羽峰编写;第7章由隆广庆、周飞伶和陈鸣编写。
南师智能科技有限公司对本书的内容从产业的角度给予指导性建议,并为本书项目案例的结构确定提供了部分项目素材,以及与Python相关的技术环境支持。
由于编者水平有限,加之时间仓促,书中难免存在疏漏和不足,恳请广大读者批评斧正。
编 者
|
|