新書推薦:

《
隐逸之间:陶渊明精神世界中的自然、历史与社会
》
售價:NT$
352.0

《
独一无二的战争
》
售價:NT$
500.0

《
天京之围(谭伯牛代表作,看晚清大变局下湘军崛起的政治智慧)
》
售價:NT$
500.0

《
王朝的崩溃(揭秘17个朝代的毁灭时刻,一本书读懂五千年中华史的奥秘)
》
售價:NT$
398.0

《
劳动力市场中反垄断的缺席
》
售價:NT$
281.0

《
财富与周期:宏观经济第一课
》
售價:NT$
454.0

《
托举的力量:给孩子应对未来的底气
》
售價:NT$
305.0

《
万有引力书系 长辈的故事 一部映照20世纪华夏大地栉风沐雨的家族记忆史 两大家族的命运沉浮 一个民族的百年变局 留下长辈的故事 比留下他们
》
售價:NT$
449.0
|
內容簡介: |
本书全面而系统地介绍了从数据收集、预处理到深入分析的全流程,结合现代技术和实用工具,特别强调了R语言在数据处理和分析中的应用。读者将从本书中学习到交通数据的基本概念、类型、特征,以及它与概率论的关系。同时,本书还涵盖了数据描述、抽样分布、统计推断、方差分析、线性回归与Logit回归等核心分析技巧,并结合实际案例,展示了如何使用R语言进行实践操作。无论是理论知识还是实践技能,本书都为读者提供了一套较完整的学习体系。本书面向普通高等学校智慧交通、交通运输、交通工程、城市规划、物流工程、数据科学专业的本科生,也可供相关工程技术人员参考。
|
關於作者: |
胡郁葱,华南理工大学土木与交通学院副教授,硕士研究生导师。先后毕业于武汉理工大学和华南理工大学,分别获得硕士和博士学位。主要研究方向包括交通运输系统规划与设计、交通行为分析、交通网络建模与优化、运输经济与政策研究、交通大数据分析与运用、智慧物流系统规划与设计等。先后承担或参与国家自然科学基金4项,社科基金1项,国家重点研发项目1项,以第一作者/通讯作者身份发表SCI/SSCI/EI期刊论文40余篇,第一发明人授权专利9项,出版教材1部,译著1部。长期从事“应用数理统计学”、“交通数据分析基础”以及“交通运输预测与决策”等本科课程以及“交通运输系统规划”等研究生课程教学,教学经验丰富,多次获得教学优秀奖,承担多项教学教改项目均顺利结题。
|
目錄:
|
目录 第1章 绪论1 1.1 交通数据的类型和特征1 1.1.1 交通数据的类型1 1.1.2 交通数据的特征5 1.2 数据分析与概率论的关系6 1.2.1 什么是概率6 1.2.2 数据分析的特殊性7 1.3 数据的有偏性7 1.3.1 有偏数据7 1.3.2 因果关系与相关关系8 1.3.3 数据的任意解释9 1.4 R语言初阶9 1.4.1 R语言和RStudio的 介绍9 1.4.2 R软件和RStudio的 安装10 1.4.3 包的安装及使用10 1.4.4 如何使用帮助功能11 1.5 R语言的使用入门12 1.5.1 向量12 1.5.2 矩阵15 1.5.3 因子18 1.5.4 数据框19 1.5.5 列表20 1.5.6 图形初阶21 本章习题24 第2章 交通数据的获取、导入及数据预处理25 2.1 交通数据的形式和获取方式25 2.1.1 抽样数据25 2.1.2 大数据26 2.2 外部数据的导入27 2.2.1 文本文件的导入27 2.2.2 Excel文件的导入28 2.2.3 数据库文件的导入28 2.2.4 统计软件输出文件的 导入29 2.2.5 其他数据格式的导入29 2.2.6 注意事项30 2.3 数据预处理30 2.3.1 查看数据框基本信息31 2.3.2 数据转换32 2.3.3 分组处理信息40 2.3.4 缺失值、重复值、异常值的 处理42 2.3.5 数据框的合并45 本章习题47 第3章 交通数据的描述48 3.1 数据分类48 3.1.1 数值型数据48 3.1.2 类别型数据49 3.1.3 数值型数据与类别型数据的 结合应用49 3.2 数据的统计描述50 3.2.1 数值型数据的 统计描述50 3.2.2 类别型数据的 统计描述53 3.3 数据的可视化描述54 3.3.1 可视化的内涵54 3.3.2 ggplot2包的介绍55 3.3.3 条形图56 3.3.4 直方图60 3.3.5 密度曲线图61 3.3.6 箱线图63 3.3.7 散点图65 本章习题68 第4章 抽样分布69 4.1 离散分布69 4.1.1 伯努利分布69 4.1.2 二项分布69 4.1.3 负二项分布71 4.1.4 泊松分布71 4.1.5 超几何分布73 4.2 连续分布73 4.2.1 正态分布73 4.2.2 对数正态分布75 4.2.3 χ2分布75 4.2.4 t分布76 4.2.5 F分布77 4.2.6 指数分布 (或负指数分布)78 4.2.7 移位负指数分布78 4.2.8 Gamma分布78 4.2.9 Beta分布79 4.2.10 韦布尔分布80 4.2.11 Logistic分布81 4.3 抽样分布的R语言实现82 本章习题83 第5章 交通数据的统计推断84 5.1 参数估计84 5.1.1 点估计84 5.1.2 区间估计90 5.2 假设检验97 5.2.1 假设检验的基本思想和 概念97 5.2.2 正态总体参数的假设 检验100 5.3 正态性检验105 5.3.1 Q-Q图106 5.3.2 单样本Kolmogorov-Smirnov 检验108 5.3.3 Shapiro-Wilk检验109 5.4 非参数检验110 5.4.1 Wilcoxon秩和检验110 5.4.2 Friedman检验111 5.4.3 Wald-Wolfowitz游程 检验113 本章习题115 第6章 方差分析117 6.1 单因素方差分析117 6.1.1 问题描述117 6.1.2 方差分析的基本思想119 6.1.3 案例120 6.1.4 t检验与方差分析的 差异121 6.2 双因素方差分析123 6.2.1 基本原理123 6.2.2 案例126 本章习题127 第7章 线性回归129 7.1 一元线性回归129 7.1.1 总体回归模型及其样本 模型129 7.1.2 模型假定130 7.1.3 参数估计133 7.1.4 参数性质135 7.1.5 模型的统计检验137 7.1.6 一元线性回归模型的R语言 实现138 7.2 多元线性回归140 7.2.1 总体回归模型140 7.2.2 模型假定141 7.2.3 参数估计143 7.2.4 参数性质143 7.2.5 模型的统计检验144 7.2.6 多元线性回归模型的R语言 实现145 7.3 交互项147 7.4 虚拟变量148 7.5 异方差性151 本章习题152 第8章 Logit回归153 8.1 线性回归模型的问题153 8.2 随机效用模型154 8.3 Logit模型155 8.3.1 基本假设155 8.3.2 公式推导156 8.3.3 特例—— 二元Logit模型157 8.4 Logit模型的性质158 8.4.1 边际效应158 8.4.2 无关备选方案的 独立性159 8.5 Logit模型的参数估计159 8.6 不涉及与选项相关的变量的Logit模型的R语言实现160 8.6.1 二元Logit回归160 8.6.2 多元Logit回归163 8.7 涉及与选项相关的变量的Logit模型的R语言实现164 8.7.1 数据格式转换164 8.7.2 Logit回归的 R语言实现167 本章习题169 附录A170 DW检验临界值表170 附录B173 t检验临界值表(双侧检验用)173 附录C173 F检验临界值173 附录D179 标准正态分布表179 附录E181 χ2分布表181
|
|