登入帳戶  | 訂單查詢  | 購物車/收銀台( 0 ) | 在線留言板  | 付款方式  | 聯絡我們  | 運費計算  | 幫助中心 |  加入書簽
會員登入 新註冊 | 新用戶登記
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2023年度TOP分類閱讀雜誌 香港/國際用戶
最新/最熱/最齊全的簡體書網 品種:超過100萬種書,正品正价,放心網購,悭钱省心 送貨:速遞 / EMS,時效:出貨後2-3日

2024年08月出版新書

2024年07月出版新書

2024年06月出版新書

2024年05月出版新書

2024年04月出版新書

2024年03月出版新書

2024年02月出版新書

2024年01月出版新書

2023年12月出版新書

2023年11月出版新書

2023年10月出版新書

2023年09月出版新書

2023年08月出版新書

2023年07月出版新書

『簡體書』数据挖掘实用案例分析(第2版)

書城自編碼: 3975745
分類: 簡體書→大陸圖書→教材研究生/本科/专科教材
作者: 赵卫东、董亮
國際書號(ISBN): 9787302658092
出版社: 清华大学出版社
出版日期: 2024-03-01

頁數/字數: /
書度/開本: 16开 釘裝: 平装

售價:NT$ 481

我要買

share:

** 我創建的書架 **
未登入.



新書推薦:
家风三书——《家风十章》《齐家》《治家》三册函套装
《 家风三书——《家风十章》《齐家》《治家》三册函套装 》

售價:NT$ 731.0
少年解码侦探团(全6册)旗语密码、字母数字密码、加密暗号密码、多重密码、语言密码!每册解锁一种!沉浸式解码,提升专注力、逻辑思维能力!
《 少年解码侦探团(全6册)旗语密码、字母数字密码、加密暗号密码、多重密码、语言密码!每册解锁一种!沉浸式解码,提升专注力、逻辑思维能力! 》

售價:NT$ 930.0
宝鸡出土商周青铜器铭文研究
《 宝鸡出土商周青铜器铭文研究 》

售價:NT$ 1394.0
地方戏曲文献汇编.河北卷.中(全三册)
《 地方戏曲文献汇编.河北卷.中(全三册) 》

售價:NT$ 5190.0
心可以知道:先秦儒家“情”论
《 心可以知道:先秦儒家“情”论 》

售價:NT$ 406.0
黄埔军校史 1924-1927
《 黄埔军校史 1924-1927 》

售價:NT$ 718.0
复杂心智:在变动时代重启人类天赋能力
《 复杂心智:在变动时代重启人类天赋能力 》

售價:NT$ 270.0
图像工程(第5版)
《 图像工程(第5版) 》

售價:NT$ 2070.0

建議一齊購買:

+

NT$ 514
《 宏观经济学二十五讲:中国视角(21世纪经济学系列教材) 》
+

NT$ 314
《 医药数理统计(第6版) 》
+

NT$ 437
《 政治学研究方法 》
+

NT$ 649
《 投资学精要(第11版)(经济科学译丛) 》
+

NT$ 282
《 数学分析(第五版)(上册) 》
+

NT$ 447
《 陈阅增普通生物学(第5版) 》
編輯推薦:
本书评为国家级实验教学示范中心联席会计算机学科组“十四五”规划教材,全书内容深入浅出,案例生动形象,原创性强,可以作为高校相关专业数据挖掘、机器学习等课程的实验和实训教材,也可以供学习数据分析的社会人士参考。
內容簡介:
数据挖掘已经广泛应用于各行各业,并推动了商务数据分析的兴起。本书结合项目实践,首先对数据挖掘的核心问题进行总结,讨论数据挖掘过程的主要步骤。在此基础上,使用Python语言详细地分析 数据 可视化、随机森林、GBDT、XGBoost、AdaCostBoost、逻辑回归等 在医疗保险稽核、淡水质量预测、弹幕 情感分析、机器学习书籍市场分析、慢性肾脏病状态预测、 行车记录仪销量分析、商务酒店竞争分析等典型领域的应用。 全书内容深入浅出,案例生动形象,应用性强,可以作为高等学校相关专业“数据挖掘”“商务数据分析”等课程的实验和实训教材,也适合对数据分析感兴趣的广大读者使用。
目錄
第1章数据分析基础
1.1业务理解
1.2数据理解
1.3数据质量问题与预处理
1.4数据分析常见陷阱
1.5数据分析方法的选择
1.5.1分类算法
1.5.2聚类算法
1.5.3关联分析
1.5.4回归分析
1.5.5深度学习
1.5.6统计方法
1.6数据分析结果的评价
1.6.1分类算法的评价
1.6.2聚类结果的评价
1.6.3关联分析的评价
1.6.4回归分析结果的评价
1.7数据分析团队的组建
1.7.1项目经理
1.7.2业务专家
1.7.3数据工程师
1.7.4数据建模人员
1.7.5可视化人员
1.7.6评估人员
1.8数据分析人才培养的难题
1.8.1数理要求高
1.8.2跨学科综合能力欠缺
1.8.3国内技术资料少
1.8.4实践机会少
思考题
第2章Anaconda的安装与使用
2.1Anaconda的下载与安装
2.2配置Python库
2.3创建自定义新环境
2.4集成开发环境的使用
2.5搭建GPU环境
思考题
第3章医疗保险稽核
3.1数据预处理
3.1.1特征选择
3.1.2数据清洗
3.1.3数据离散化
3.1.4特征值处理
3.1.5数据平衡
3.1.6样本权重系数设置
3.1.7数据转换
3.2医疗保险稽核建模和评估
3.3结果分析
思考题
第4章机器学习书籍市场分析
4.1数据获取
4.2数据预处理
4.3市场总体分析
4.4书籍畅销因素分析
4.4.1随机森林模型
4.4.2商品评论词频分析
4.4.3商品评论主题分析
4.4.4其他值得关注的问题
4.5Apriori关联分析
4.6机器学习书聚类分析
4.7给电商平台上架图书的建议
思考题
第5章预测淡水质量
5.1数据清洗处理
5.1.1缺失值的处理
5.1.2特征数值分布
5.1.3异常值检测
5.1.4相关性检验
5.1.5数据离散化
5.1.6标签编码
5.1.7采样平衡
5.2模型的训练
5.2.1模型训练与预测
5.2.2模型的优化
5.3模型评估
思考题
第6章弹幕情感分析
6.1数据收集
6.2数据预处理
6.2.1去除无效内容
6.2.2分词和词性标注
6.2.3去除停用词
6.2.4主题词提取
6.2.5去除低频词
6.2.6编码
6.2.7标注
6.2.8获取词向量
6.3情感分析
6.3.1基于SnowNLP库的情感分析方法
6.3.2基于机器学习的情感分析方法
思考题
第7章海底捞运营分析
7.1业务背景分析
7.2数据抓取
7.3数据预处理
7.4店铺经营分析
7.4.1影响海底捞运营的关键因素分析
7.4.2店铺选址分析
7.4.3菜品关联分析
7.4.4用户评论与评分分析
7.4.5顾客情感分析
思考题
第8章慢性肾脏病状态预测
8.1业务背景分析
8.2数据收集
8.3数据探索
8.3.1CKD_rate和CKD_stage分布
8.3.2医院
8.3.3性别
8.3.4相关遗传病史
8.3.5血指标
8.3.6eGFR
8.4数据预处理
8.4.1数据清洗
8.4.2数据编码
8.4.3数据离散化
8.4.4数据平衡
8.4.5特征重要性分析
8.5慢性肾脏病状态预测分析
8.5.1逻辑回归
8.5.2决策树
8.5.3随机森林
8.5.4XGBoost
8.5.5支持向量机
8.5.6神经网络
8.6参数调节
8.7模型评估
8.8慢性肾脏病聚类分析
8.9慢性肾脏病关联分析
8.10慢性肾脏病回归分析
思考题
第9章行车记录仪销量分析
9.1业务背景分析
9.2数据说明
9.3数据预处理
9.3.1数据清洗
9.3.2离散数据编码
9.3.3数据离散化
9.3.4特征重要性评估
9.3.5数据平衡
9.4行车记录仪销量分析
9.5行车记录仪聚类分析
9.6行车记录仪关联分析
9.7行车记录仪回归分析
思考题
第10章商务酒店竞争分析
10.1业务背景分析
10.2数据提取
10.3数据预处理
10.3.1数据初步筛选
10.3.2分词
10.3.3关键词提取
10.4数据分析
10.4.1客户情感分析
10.4.2结果分析
10.5不同酒店的竞争分析
10.5.1酒店评分比较
10.5.2客户吸引力对比
10.5.3不同酒店客户情感对比
思考题
第11章常见机器学习算法加速
11.1使用Intel OneAPI加速
11.1.1数据预处理
11.1.2数据集划分与建模预测
11.1.3模型评估
11.2不使用Intel OneAPI的方案
11.2.1数据集划分与建模预测
11.2.2模型评估
11.3加速与否的对比分析
思考题
第12章综合实训: 银行信用卡欺诈与拖欠行为分析
12.1用户信用等级影响因素
12.1.1客户信用卡申请数据预处理
12.1.2信用卡申请成功影响因素
12.1.3信用卡用户信用等级影响因素
12.2基于消费的信用等级影响因素
12.3信用卡欺诈判断模型
12.3.1基于Apriori算法的欺诈模型
12.3.2基于判别的欺诈模型
12.3.3基于分类算法的欺诈模型
12.4欺诈人口属性分析
12.4.1欺诈人口属性统计分析
12.4.2基于逻辑回归的欺诈人口属性分析
12.4.3逾期还款的客户特征
12.4.4基于决策树分析逾期客户特征
12.4.5基于回归分析逾期客户特征
12.4.6根据消费历史分析客户特征
12.4.7基于聚类分析客户特征
12.4.8基于客户细分的聚类分析
附录习题
內容試閱
目前,市场上单纯地介绍数据挖掘理论的教材比较多,这类教材在国内存在着以下明显问题: 一是数据挖掘的应用案例比较粗略,问题也比较简单,分析过程不具体,难以支撑数据挖掘的实验和实训教学,而实践教学却是培养数据分析应用人才非常重要、不可或缺的环节; 二是数据量比较小,分析的问题只是实际问题的模拟,数据分析的深度、算法的复杂度还达不到数据挖掘教学的要求; 三是难度适中、适合教学、能满足实战性要求的教材不多。本书是作者针对目前数据挖掘对学生实践能力要求高的特点,通过分析目前高等学校“数据挖掘”课程教学的痛点,即与实际应用结合不紧密等问题而编写的实验、实训教材。
作者深耕数据挖掘多年,与企业合作成功实施了多项数据分析的项目,熟悉数据挖掘的基本原理,并对Python编程比较熟悉,积累了一些详细的案例,这为本书的写作奠定了基础。

Python语言在高等学校已经被各类专业的大学生选修,数据分析也成为一种基本的技能。为适应高等学校“数据挖掘”课程的教学,本书使用Python语言对原有的部分案例进行重新改写,并且增加了几个综合性的案例。

本书是在第1版的基础上进行的修订、改版。书中使用Tableau、Python等数据分析工具和语言,通过精心选择应用场景、设计面向实际问题的解决思路,突出数据分析过程中常遇到的问题。学生参考这些案例,不仅能消化理解Python主流机器学习库的基本用法,还能针对实际问题进行一定深度的分析,具有较强的实用性。此外,学生可以模仿实验,举一反三,针对新问题提出合理的解决思路。

本书还引进了Intel公司的机器学习开源加速器OneAPI的相关内容,可以针对数据量比较大的情况,提升决策树、随机森林、回归分析、逻辑回归、神经网络、聚类等常用的数据挖掘算法的训练速度。这在实际工程中是非常必要的。
为了便于学生自学,本书配套相应的课件、实验数据、Python代码和思考题。学生可以根据书中的思路进行实验,思考其中的数据预处理和数据建模方法,并在此基础上解决新的问题。
在本书的编写过程中,研究生周一航、李欣迪、吴乾奕、陈思玲、纪振宇、张洁莹等同学在资料收集等方面做了很多工作,在此一并表示感谢。由于作者水平有限,书中难免存在不足之处,敬请读者批评指正。

赵卫东2024年1月于复旦大学

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 香港用户  | 台灣用户 | 海外用户
megBook.com.tw
Copyright (C) 2013 - 2024 (香港)大書城有限公司 All Rights Reserved.