登入帳戶  | 訂單查詢  | 購物車/收銀台(0) | 在線留言板  | 付款方式  | 聯絡我們  | 運費計算  | 幫助中心 |  加入書簽
會員登入   新用戶註冊
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2023年度TOP分類閱讀雜誌 香港/國際用戶
最新/最熱/最齊全的簡體書網 品種:超過100萬種書,正品正价,放心網購,悭钱省心 送貨:速遞 / 物流,時效:出貨後2-4日

2024年10月出版新書

2024年09月出版新書

2024年08月出版新書

2024年07月出版新書

2024年06月出版新書

2024年05月出版新書

2024年04月出版新書

2024年03月出版新書

2024年02月出版新書

2024年01月出版新書

2023年12月出版新書

2023年11月出版新書

2023年10月出版新書

2023年09月出版新書

『簡體書』数据科学:基本概念、技术及应用

書城自編碼: 3901813
分類: 簡體書→大陸圖書→計算機/網絡數據庫
作者: [美]希拉格·沙阿[Chirag Shah]
國際書號(ISBN): 9787111730453
出版社: 机械工业出版社
出版日期: 2023-08-01

頁數/字數: /
書度/開本: 16开 釘裝: 平装

售價:NT$ 658

我要買

share:

** 我創建的書架 **
未登入.



新書推薦:
孤独传:一种现代情感的历史
《 孤独传:一种现代情感的历史 》

售價:NT$ 390.0
家、金钱和孩子
《 家、金钱和孩子 》

售價:NT$ 295.0
量价关系——透视股票涨跌脉络
《 量价关系——透视股票涨跌脉络 》

售價:NT$ 340.0
二十四节气生活美学
《 二十四节气生活美学 》

售價:NT$ 340.0
西班牙内战:秩序崩溃与激荡的世界格局:1936-1939
《 西班牙内战:秩序崩溃与激荡的世界格局:1936-1939 》

售價:NT$ 990.0
基于鲲鹏的分布式图分析算法实战
《 基于鲲鹏的分布式图分析算法实战 》

售價:NT$ 495.0
夺回大脑 如何靠自己走出强迫
《 夺回大脑 如何靠自己走出强迫 》

售價:NT$ 299.0
图解机械工程入门
《 图解机械工程入门 》

售價:NT$ 440.0

編輯推薦:
华盛顿大学数据科学教材,原书网站配备数据集、PPT、习题等各类教辅资源;零基础入门,以实践为导向,适合不同学科的读者
內容簡介:
本书以实用和可接受的方式详细介绍了数据科学领域,强调动手实践。独立于技术介绍数据科学的基本思想和相关技术,允许学生在没有强大的技术背景的情况下轻松地发展对该主题的坚定理解,并提供即使在工具和技术发生变化后仍然具有持续相关性的材料。使用流行的数据科学工具,如Python和R,这本书提供了许多实际应用的例子,实践范围从小数据到大数据。为教师和学生提供的一套在线材料,包括数据集、PPT、解决方案和课程建议等。
目錄
目  录
前言
致谢
作者简介
第一部分 概念介绍
第1章 简介2
1.1 什么是数据科学2
1.2 数据科学在哪里4
1.2.1 金融4
1.2.2 公共政策5
1.2.3 政治6
1.2.4 医疗保健6
1.2.5 城市规划7
1.2.6 教育8
1.2.7 图书馆8
1.3 数据科学与其他领域如何关联9
1.3.1 数据科学与统计9
1.3.2 数据科学与计算机科学9
1.3.3 数据科学与工程10
1.3.4 数据科学与商业分析10
1.3.5 数据科学、社会科学与
   计算社会科学11
1.4 数据科学和信息科学之间的关系11
1.4.1 信息与数据12
1.4.2 信息科学用户12
1.4.3 iSchool中的数据科学12
1.5 计算思维13
1.6 数据科学技能15
1.7 数据科学工具20
1.8 数据科学中的伦理、偏见和
   隐私问题22
总结23
关键术语23
概念性问题24
实践问题24
注释26
第2章 数据28
2.1 引言28
2.2 数据类型28
2.2.1 结构化数据29
2.2.2 非结构化数据29
2.2.3 非结构化数据的挑战30
2.3 数据收集30
2.3.1 开放数据30
2.3.2 社交媒体数据31
2.3.3 多类型数据31
2.3.4 数据存储和呈现32
2.4 数据预处理36
2.4.1 数据清洗37
2.4.2 数据集成38
2.4.3 数据转换39
2.4.4 数据缩减39
2.4.5 数据离散化40
总结47
关键术语47
概念性问题48
实践问题48
延伸阅读及资源51
注释52
第3章 技术53
3.1 引言53
3.2 质性数据分析和量化数据分析54
3.3 描述性分析54
3.3.1 变量55
3.3.2 频率分布56
3.3.3 中心性度量61
3.3.4 离散分布62
3.4 诊断性分析65
3.5 预测性分析66
3.6 规范性分析67
3.7 探索性分析68
3.8 机理性分析68
总结70
关键术语71
概念性问题72
实践问题72
延伸阅读及资源74
注释74
第二部分 数据科学工具
第4章 UNIX78
4.1 引言78
4.2 UNIX安装79
4.3 连接UNIX服务器81
4.3.1 SSH81
4.3.2  FTP/SCPS/FTP83
4.4 基本命令84
4.4.1 文件和目录操作命令84
4.4.2 进程相关的命令85
4.4.3 其他有用命令86
4.4.4 快捷键87
4.5 在UNIX上编辑87
4.5.1  vi编辑器87
4.5.2  Emacs编辑器88
4.6 重定向和管道89
4.7 用UNIX解决小问题90
总结96
关键术语97
概念性问题97
实践问题97
延伸阅读及资源98
注释98
第5章 Python100
5.1 引言100
5.2 Python安装100
5.2.1 下载和安装Python101
5.2.2 通过控制台运行Python101
5.2.3 通过集成开发环境
    使用Python101
5.3 基本示例103
5.4 控制结构106
5.5 统计概要107
5.5.1 导入数据110
5.5.2 数据绘制110
5.5.3 相关性111
5.5.4 线性回归111
5.5.5 多元线性回归113
5.6 机器学习简介117
5.6.1 什么是机器学习117
5.6.2 分类118
5.6.3 聚类120
5.6.4 密度估计122
总结124
关键术语125
概念性问题125
实践问题125
延伸阅读及资源127
注释128
第6章 R129
6.1 引言129
6.2 R安装129
6.3 R入门131
6.3.1 基础131
6.3.2 控制结构132
6.3.3 函数134
6.3.4 导入数据134
6.4 图形和数据可视化135
6.4.1 安装ggplot2135
6.4.2 加载数据136
6.4.3 数据绘制136
6.5 统计和机器学习139
6.5.1 基本统计139
6.5.2 回归140
6.5.3 分类142
6.5.4 聚类144
总结146
关键术语147
概念性问题147
实践问题147
延伸阅读及资源148
注释148
第7章 MySQL150
7.1 引言150
7.2  MySQL入门151
7.2.1 获得MySQL151
7.2.2 登录MySQL151
7.3 创建和插入记录153
7.3.1 导入数据153
7.3.2 创建表154
7.3.3 插入记录154
7.4 检索记录154
7.4.1 阅读表详细信息155
7.4.2 从表中检索信息155
7.5  MySQL搜索156
7.5.1 字段值搜索156
7.5.2 带索引的全文检索157
7.6 使用Python访问MySQL158
7.7 使用R访问MySQL159
7.8 其他流行数据库介绍161
7.8.1  NoSQL161
7.8.2  MongoDB161
7.8.3 谷歌BigQuery161
总结162
关键术语162
概念性问题163
实践问题163
延伸阅读及资源164
注释164
第三部分 数据科学中的机器学习
第8章 机器学习和回归166
8.1 引言166
8.2 什么是机器学习167
8.3 回归171
內容試閱
前  言
数据科学是大学教育中发展最快的学科之一。我们看到越来越多的职位要求有数据科学方面的背景,该领域的学术任命和课程(不管是在线的还是传统的)也越来越多。有人可能会说,数据科学并不新奇,只不过是不同视角的统计学而已。然而,我们生活在这样一个时代,从医疗保健到教育,从金融到决策,各行各业那些能用数据解决的问题正在掀起巨大的创新浪潮。更重要的是,数据和数据分析在我们的日常生活中发挥着越来越大的作用。因此,每个人都需要掌握数据和数据分析的基础知识,即使他们不是为了获得计算机科学、统计学或数据科学的学位。认识到这一点,许多教育机构已经开始在这一领域进行开发,向那些即使不会成为数据科学家但仍然可以从数据专业技能中受益的学生提供学位和专业课程,以及辅修课程和证书,就像培养每个学生的基本阅读、写作和理解技能一样。
本书不仅适用于数据科学专业的学生,也适用于那些想要发展自己的数据素养的人。它让读者能够以简单的方式入门数据科学,并能够轻松地获取和处理数据以获得重要的见解。除了数据和数据处理的基础知识,本书还提供标准工具和技术。另外,它还研究了数据的使用在隐私、道德和公平等领域的影响。最后,本书还提供这些主题的实践介绍。书中几乎所有的内容都附有示例和练习,读者可以自己动手或使用本书所提供的工具进行尝试。我自己在讲授这些主题时,发现动手实践是一个非常有效的方法。
接下来的部分会解释本书是如何组织的、如何使用它来满足各种教学需求,以及学生需要满足什么具体要求,以使本书最大限度地发挥价值。
本书的结构
本书由四部分组成。第一部分包括第1~3章,介绍数据科学的基础知识。第1章将介绍数据科学领域及多种应用,并指出其与计算机科学、统计学和信息科学等相关领域的重要异同。第2章将描述数据的性质和结构,向学生介绍数据类型、收集和预处理。第3章将介绍数据科学的几项重要技术,这些技术主要源自统计学,包括相关分析、回归,还会介绍一些数据分析入门知识。
第二部分包括第4~7章,主要介绍各种工具和平台,如UNIX(第4章)、Python(第5章)、R(第6章)、MySQL(第7章)。请记住,因为这不是一本编程或数据库书籍,所以我们的目标不是系统掌握这些工具的各个部分,而是将重点放在学习这些工具的基础知识和相关方面,以便能够解决各种数据问题。因此,这些章节是围绕解决各种数据驱动的问题组织的。在涉及Python和R的章节中,我们还将介绍基础的机器学习内容。
机器学习是数据科学中一个至关重要的主题,不能等闲视之,这也是本书第三部分专门讨论的原因。具体来说,第8章将更正式地介绍机器学习,同时也包括一些基本和广泛适用的技术。第9章将深度描述监督学习方法。第10章将介绍非监督学习。应该注意的是,由于本书的重点是数据科学,而不是核心计算机科学或数学,因此,在讨论和应用机器学习技术时跳过了许多数学和形式结构的基础知识。但在第三部分中,为了详细讨论机器学习方法和技术背后的理论和直观判断,我们运用了大量的数学知识。
最后,本书第四部分采用第一部分中介绍的技术,以及第二部分和第三部分中介绍的工具,开始将它们应用到现实生活中有意义的问题中。在第11章中,我们会将各种数据科学技术应用于现实生活中的问题,这些问题涉及社交媒体等方面。最后,第12章将额外介绍数据收集、实验和评估的内容。
本书有丰富的附加资料,它们要么可以为现有的数据科学理论和实践增加更多的价值和知识,要么可以为一些主题提供更广泛和更深入的观点。书中有一些放在框中的参考资料,它们可以在不影响正文流畅度的前提下提供一些重要和相关的信息,使学生能够意识到隐私、道德和公平等问题。附录A~D提供了与微分学和概率有关的各种公式的快速参考,以及安装和配置书中使用的各种工具的有用的指示和说明。附录E提供了获取从小到大的数据集的各种资源列表,通过它们可以进行更多的练习,甚至参加数据竞赛以获得奖项和认可。对于那些对使用基于云的平台和工具感兴趣的读者,附录F展示了如何注册、配置和使用它们。附录G提供了不同领域与数据科学工作相关的有用信息,以及与之对应的技能。最后,附录H和I分别介绍了数据伦理的理念,以及数据科学如何促进社会公益,激励你成为一个负责任和具有社会意识的数据公民。
本书英文版还有一个在线附录(OA),可以通过www.cambridge.org/shah访问,通过该网站还可以获取相关数据和其他资源的更新。在线附录的主要目的是为你提供最新的数据集或数据集链接,你可以下载它们并在许多示例、练习和问题中使用。在相关练习的描述中,你会看到相关内容在在线附录中的编号(例如OA 3.2),它会告诉你数据的位置。
如何在教学中使用本书
本书围绕向计算机科学专业低年级学生或非计算机科学专业中高年级学生讲授数据科学而精心组织内容。全书内容是模块化的,能让学生和老师更容易覆盖主题到所需的深度。基于此,本书非常适合用作数据科学课程的主要参考书或教科书。以下是使用本书时推荐的课程安排,共包含五

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 台灣用户 | 香港/海外用户
megBook.com.tw
Copyright (C) 2013 - 2024 (香港)大書城有限公司 All Rights Reserved.