登入帳戶  | 訂單查詢  | 購物車/收銀台(0) | 在線留言板  | 付款方式  | 聯絡我們  | 運費計算  | 幫助中心 |  加入書簽
會員登入   新用戶註冊
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2023年度TOP分類閱讀雜誌 香港/國際用戶
最新/最熱/最齊全的簡體書網 品種:超過100萬種書,正品正价,放心網購,悭钱省心 送貨:速遞 / 物流,時效:出貨後2-4日

2024年11月出版新書

2024年10月出版新書

2024年09月出版新書

2024年08月出版新書

2024年07月出版新書

2024年06月出版新書

2024年05月出版新書

2024年04月出版新書

2024年03月出版新書

2024年02月出版新書

2024年01月出版新書

2023年12月出版新書

2023年11月出版新書

2023年10月出版新書

『簡體書』数据科学工程实践

書城自編碼: 4043331
分類: 簡體書→大陸圖書→教材研究生/本科/专科教材
作者: 郭继东 等
國際書號(ISBN): 9787121488481
出版社: 电子工业出版社
出版日期: 2024-09-01

頁數/字數: /
釘裝: 平塑

售價:NT$ 408

我要買

share:

** 我創建的書架 **
未登入.



新書推薦:
(棱镜精装人文译丛)蔑视大众:现代社会文化斗争的实验
《 (棱镜精装人文译丛)蔑视大众:现代社会文化斗争的实验 》

售價:NT$ 275.0
皇家宫廷中的保健秘方 中小学课外阅读
《 皇家宫廷中的保健秘方 中小学课外阅读 》

售價:NT$ 290.0
《诗经》十五讲 十五堂《诗经》历史文化与文学课  丹曾人文通识丛书
《 《诗经》十五讲 十五堂《诗经》历史文化与文学课 丹曾人文通识丛书 》

售價:NT$ 395.0
述异记汇笺及情节单元分类研究(上下册)
《 述异记汇笺及情节单元分类研究(上下册) 》

售價:NT$ 475.0
环境、社会、治理(ESG)信息披露操作手册
《 环境、社会、治理(ESG)信息披露操作手册 》

售價:NT$ 1190.0
桑德拉销售原则   伍杰 [美]大卫·马特森
《 桑德拉销售原则 伍杰 [美]大卫·马特森 》

售價:NT$ 440.0
理论的意义
《 理论的意义 》

售價:NT$ 340.0
悬壶杂记:医林旧事
《 悬壶杂记:医林旧事 》

售價:NT$ 240.0

內容簡介:
本书是高等学校开设数据科学导论或工程实践等课程的配套用书。本书不仅介绍了数据科学的基础知识,还特别引入了探索性数据分析流程的相关内容,主要包括实践平台配置、数据预处理、数据存储与管理、探索性数据分析、单模型学习算法、集成学习算法和数据可视化等;精心设计其中的函数应用实践和综合应用实践,前者聚焦具体函数的解释和应用,后者致力于实际问题解决思路的探讨。读者可以由浅入深地了解相关理论,逐步完成相关实验内容,增强理论和实践的连贯性认知,培养数据思维和动手实践能力。 本书可作为高等学校各相关专业的数据科学导论或实践等课程的配套教材,也可供对数据科学感兴趣的读者阅读。
關於作者:
郭继东,山东财经大学副教授,郭继东博士在计算机视觉、人工智能、最优化方法、数据分析与挖掘算法和矩阵分析方面有着比较深入的研究,并取得了一些创新性的研究成果。主要研究方向为人工智能、计算机视觉、最优化方法、软件架构设计、数据挖掘技术、三维重建、图像处理等。在国内外重要学术刊物及会议上发表重要学术论文20余篇,其中有多篇被SCI或EI收录。
目錄
目录

第1章 数据科学概述1
1.1 数据科学简介1
1.1.1 基本概念及发展历史1
1.1.2 特点及应用领域2
1.1.3 数据科学的过程3
1.2 Python的安装5
1.3 常用工具包概述7
1.4 Anaconda3的安装9
1.5 Jupyter Notebook的使用10
1.5.1 Jupyter Notebook简介10
1.5.2 Jupyter Notebook
的启动10
1.5.3 新手如何快速上手Jupyter Notebook10
1.6 本章小结12
课后习题12
第2章 数据预处理13
2.1 NumPy数据处理及运算13
2.1.1 NumPy的安装13
2.1.2 创建N维数组14
2.1.3 NumPy切片和索引19
2.1.4 NumPy数组操作20
2.1.5 数学函数32
2.1.6 统计函数40
2.1.7 排序函数46
2.1.8 直方图函数47
2.2 Pandas基础49
2.2.1 数据快捷加载49
2.2.2 Pandas的数据结构53
2.3 非数值数据转换61
2.3.1 map()函数61
2.3.2 One-Hot编码62
2.4 数据清洗63
2.4.1 缺失值处理63
2.4.2 错误数据替换65
2.4.3 数据去重65
2.4.4 数据合并连接66
2.4.5 数据分组及聚合70
2.5 本章小结72
课后习题72
第3章 数据存储与管理74
3.1 概述74
3.1.1 数据存储的概念74
3.1.2 数据管理技术的概念74
3.1.3 数据库的概念74
3.1.4 新型数据管理系统75
3.2 关系数据库75
3.2.1 关系数据模型75
3.2.2 应用举例76
3.3 分布式文件系统78
3.3.1 HDFS的概念及特点78
3.3.2 HDFS数据文件存储78
3.3.3 HDFS的结构及组件78
3.3.4 HDFS的读/写操作79
3.3.5 Python访问HDFS81
3.4 分布式数据库82
3.4.1 HBase的特点82
3.4.2 HBase相关概念82
3.4.3 HBase架构82
3.4.4 Python操作HBase84
3.5 流数据87
3.5.1 流数据概述87
3.5.2 流数据模型87
3.5.3 流数据处理系统88
3.6 本章小结90
课后习题90
第4章 探索性数据分析92
4.1 EDA简介92
4.2 特征创建98
4.3 维度约简101
4.3.1 为什么要降维101
4.3.2 基于特征转换的降维102
4.3.3 基于特征选择的降维122
4.3.4 基于特征组合的降维135
4.4 异常值检测及处理141
4.4.1 单变量异常检测141
4.4.2 OneClassSVM143
4.4.3 EllipticEnvelope145
4.5 评价函数149
4.5.1 多标签分类149
4.5.2 二分类151
4.5.3 回归155
4.6 测试和验证156
4.7 交叉验证159
4.7.1 建立自定义评分函数160
4.7.2 使用交叉验证迭代器162
4.8 超参数调优167
4.8.1 超参数调优概述167
4.8.2 超参数调优实践174
4.9 小结190
课后习题190
第5章 单模型学习算法191
5.1 概述191
5.1.1 分类模型和回归模型192
5.1.2 机器学习的步骤和
要素193
5.2 线性回归和逻辑回归194
5.2.1 从线性回归到逻辑
回归195
5.2.2 线性回归实践197
5.2.3 Sigmoid函数199
5.2.4 推广至多元场景200
5.2.5 逻辑回归实践201
5.2.6 算法小结203
进阶A 交叉熵损失函数和平方差
损失函数203
5.3 朴素贝叶斯分类207
5.3.1 朴素贝叶斯分类算法207
5.3.2 朴素贝叶斯实践210
5.3.3 算法小结212
5.4 最近邻算法212
5.4.1 k近邻算法的概念及
原理212
5.4.2 k值的选取及特征归一化的重要性213
5.4.3 最近邻算法实践215
5.4.4 算法小结228
进阶B kd树228
B.1 kd树的构建228
B.2 kd树的搜索230
B.3 kd树的不足232
5.5 支持向量机233
5.5.1 支持向量机基础234
5.5.2 软间隔236
5.5.3 核函数236
5.5.4 支持向量机实践238
5.5.5 算法小结256
进阶C 对偶问题257
C.1 拉格朗日乘子法257
C.2 支持向量机优化259
进阶D 软间隔情况下的最优化问题
及其求解260
5.6 决策树261
5.6.1 信息论知识261
5.6.2 决策树基础264
5.6.3 决策树实践268
5.6.4 算法小结285
5.7 聚类286
5.7.1 K均值聚类286
5.7.2 小批量KMeans296
5.7.3 Affinity Propagation聚类
算法299
5.7.4 层次聚类301
5.7.5 DBSCAN307
5.7.6 算法小结310
5.8 本章小结311
课后习题311
第6章 集成学习算法312
6.1 集成学习能带来什么312
6.1.1 集成学习的基本步骤313
6.1.2 集成学习中的偏差与
方差314
6.2 Bagging元学习器320
6.3 随机森林326
6.3.1 随机森林算法327
6.3.2 极度随机化树327
6.3.3 随机森林实践328
6.3.4 算法小结332
6.4 Boosting算法332
6.5 AdaBoost算法333
6.5.1 AdaBoost实践334
6.5.2 算法小结341
进阶E AdaBoost算法伪代码342
6.6 GBDT算法342
6.6.1 分类和回归347
6.6.2 GBDT实践349
6.7 基于直方图的梯度提升351
6.7.1 用法351
6.7.2 直方图梯度提升模型
实践353
6.8 堆叠泛化356
6.9 概率校准358
6.9.1 校准曲线359
6.9.2 校准分类器362
6.10 本章小结373
课后习题373
第7章 数据可视化374
7.1 可视化的定义及作用374
7.2 可视化的原则375
7.3 常用的可视化分析技术与
工具375
7.4 Matplotlib绘图378
7.4.1 绘制曲线378
7.4.2 绘制散点图384
7.4.3 绘制直方图385
7.4.4 绘制柱状图387
7.4.5 绘制箱线图392
7.4.6 绘制图像394
7.4.7 绘制矩阵396
7.5 Pandas绘图398
7.6 Scikit-learn绘图401
7.6.1 学习曲线401
7.6.2 验证曲线405
7.6.3 ROC曲线407
7.6.4 混淆矩阵408
7.6.5 精确率-召回率曲线410
7.6.6 部分依赖关系图412
7.7 本章小结414
课后习题414

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 台灣用户 | 香港/海外用户
megBook.com.tw
Copyright (C) 2013 - 2024 (香港)大書城有限公司 All Rights Reserved.