登入帳戶  | 訂單查詢  | 購物車/收銀台( 0 ) | 在線留言板  | 付款方式  | 聯絡我們  | 運費計算  | 幫助中心 |  加入書簽
會員登入 新註冊 | 新用戶登記
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2023年度TOP分類閱讀雜誌 香港/國際用戶
最新/最熱/最齊全的簡體書網 品種:超過100萬種書,正品正价,放心網購,悭钱省心 送貨:速遞 / EMS,時效:出貨後2-3日

2024年08月出版新書

2024年07月出版新書

2024年06月出版新書

2024年05月出版新書

2024年04月出版新書

2024年03月出版新書

2024年02月出版新書

2024年01月出版新書

2023年12月出版新書

2023年11月出版新書

2023年10月出版新書

2023年09月出版新書

2023年08月出版新書

2023年07月出版新書

『簡體書』工业数据分析工程:基于CRISP-DM的形式化方法 田春华 解光耀 裴忠一 等

書城自編碼: 4017176
分類: 簡體書→大陸圖書→工業技術一般工业技术
作者: 田春华 解光耀 裴忠一 等
國際書號(ISBN): 9787111759799
出版社: 机械工业出版社
出版日期: 2024-08-01

頁數/字數: /
書度/開本: 16开 釘裝: 平装

售價:NT$ 515

我要買

share:

** 我創建的書架 **
未登入.



新書推薦:
近代早期海洋文化史
《 近代早期海洋文化史 》

售價:NT$ 510.0
怪诞行为学2:非理性的积极力量
《 怪诞行为学2:非理性的积极力量 》

售價:NT$ 354.0
锦衣玉令
《 锦衣玉令 》

售價:NT$ 510.0
米沃什与布罗茨基:诗人的友谊
《 米沃什与布罗茨基:诗人的友谊 》

售價:NT$ 406.0
法国小史
《 法国小史 》

售價:NT$ 499.0
五凉王国的七张面孔
《 五凉王国的七张面孔 》

售價:NT$ 359.0
掌控生活,从掌控时间开始
《 掌控生活,从掌控时间开始 》

售價:NT$ 250.0
物理光学漫步——衍射计算理论及应用研究故事
《 物理光学漫步——衍射计算理论及应用研究故事 》

售價:NT$ 874.0

編輯推薦:
《工业数据分析工程:基于CRISP-DM的形式化方法》是一本专为希望利用数据科学推动工业进步的专业人士撰写的指南。本书深入浅出地介绍了如何运用跨行业标准流程(CRISP-DM)来解决工业领域中复杂的数据分析问题。通过系统性地介绍CRISP-DM的六个阶段——业务理解、数据理解、数据准备、建模、评估和部署,本书不仅提供了理论框架,还辅以丰富的实际案例研究,帮助读者将理论知识转化为实践能力。
作者精心挑选了丰富的实例,展示了如何在这些行业中有效地实施数据分析项目。无论是初学者还是经验丰富的工程师,都能从中学到如何更好地处理数据、构建模型,并将结果应用于决策制定过程。
如果您是寻求提高工厂效率、优化供应链管理或改进产品质量的数据科学家、工程师或是企业领导者,《工业数据分析工程:基于CRISP-DM的形式化方法》无疑是您的bi备参考书。它将引导您掌握一套全面而实用的方法论,帮助您在工业4.0时代取得竞争优势。
內容簡介:
在“数据资产化”“工业互联网”“工业大数据”的推进中,工业大数据分析仍缺乏统一的指导方法,造成工业大数据分析项目质量波动大落地成功率低。CRISP-DM方法是机器学习领域的行业事实标准,但CRISP-DM 仅仅是过程方法,对于每个阶段或关键活动,没有给出具体的行动指导。本书在 CRISP-DM 基础上,细化了工业数据分析中的具体活动,针对关键活动提出了明确的形式化方法(例如,用系统动力学模型刻画工业物理系统的运行机理,用领域模型描述物理系统间的概念关系,用数据处理流图描述分析模型间的数据处理和依赖关系),并用具体的行业案例进行阐述,尝试为工业大数据分析构建一套实操性的工程方法体系。
《工业数据分析工程:基于CRISP-DM的形式化方法》分为 10 章:第1章概要介绍工业数据分析方法体系;第2~7章讨论了分析场景定义、业务理解、数据理解、数据准备、模型建立、模型评估和模型部署7个阶段的关键活动、关键角色和成功标准,给出实操形式化方法,并用具体工业案例进行展示;第8~10章用3个不同类型行业案例,端到端展示了工业数据分析方法的应用过程。本书是实操性方法的系统总结,用实际案例将读者代人,更好地理解问题的挑战和解决过程在此基础上,进行系统化总结,方便方法的传承。
《工业数据分析工程:基于CRISP-DM的形式化方法》适合工业大数据从业者,包括工业大数据/工业互联网企业的研发人员、工业企业T部门及数字化转型部门的工程技术人员阅读,也适合高等或职业院校的大数据或工业互联网相关专业的教师和学生阅读。
關於作者:
田春华
博士,北京工业大数据创新中心首席数据科学家,清华大学工业大数据研究中心,首席数据科学家;曾任IBM中国研究院研究经理,IEEE、INFORMS、ACM等学术组织及国际学术会议分会主席、执行委员、国际学术期刊审稿人。长期负责数据挖掘算法研究和产品工作,在高端装备制造、石油石化、新能源、航空与港口等行业,帮助几十家国内外领先企业成功实施资产管理、运营优化、营销洞察等数据分析项目。参与了多个工业大数据相关标准的制定工作、白皮书的编写工作、竞赛支持工作。发表论文近百篇,拥有40余项国际国内发明专利授权。
目錄
目 录
1.工业数据分析方法概述
1.1.方法论内涵与作用
1.2.工业大数据项目落地的载体
1.2.1.大数据分析的3种载体形式:数据服务、模型服务、智能应用
1.2.2.工业大数据项目的价值落地
1.2.3.智能化项目管理
1.3.工业数据分析过程方法
1.4.如何用好工业数据分析方法
1.4.1.大数据分析方法的应用范畴
1.4.2.大数据分析方法与项目管理
1.4.3.大数据分析项目阶段划分
参考文献
2.分析场景定义
2.1.什么是分析场景
2.2.分析场景识别
2.2.1.自顶向下的结构化分解法
2.2.2.自下向上的归纳剖析法
2.2.3.数据驱动的业务能力匹配法
2.2.4.分析场景识别中的常见问题
2.3.分析场景筛选
2.3.1.基于基线思维的场景筛选法
2.3.2.基于要素-认知矩阵的场景筛选法
2.3.3.分析场景筛选中的常见问题
2.4.分析场景定义示例
2.4.1.智能运维:自顶向下的结构化分解法
2.4.2.汽车制造:自下向上的归纳剖析法
2.4.3.电动矿卡智能管理:数据驱动的业务能力匹配法
参考文献
3.业务理解
3.1.业务理解的目标
3.1.1.形成分析课题描述
3.1.2.提出数据需求清单
3.2.业务理解的主要内容
3.2.1.决策逻辑
3.2.2.决策场景
3.2.3.领域概念
3.3.业务理解的形式化模型
3.3.1.层次分解模型-列表
3.3.2.层次分解模型-树状结构
3.3.3.系统动力学模型
3.3.4.专家规则
3.3.5.运筹学模型
3.4.系统动力学的建模方法
3.4.1.系统动力学图的建模过程
3.4.2.系统动力学建模背后的支撑技术
3.4.3.系统动力学模型的概念辨析
3.5.专家规则的建模方法
3.5.1.基于规则流的规则描述方法
3.5.2.基于逻辑表达式的规则检验方法
3.6.领域模型的建模方法
3.6.1.数据驱动的领域建模
3.6.2.业务驱动的领域建模
3.7.业务理解的执行策略
3.7.1.了解性访谈
3.7.2.基于样例数据的业务理解
3.7.3.确认性访谈
3.8.思考:业务理解中形式化模型的必要性
3.8.1.水箱水位预测的例子
3.8.2.发电机冷却水温度区间估计的例子
参考文献
4.数据理解
4.1.数据收集
4.1.1.明确数据源系统和访问方式
4.1.2.明确数据更新与存储周期
4.2.数据描述-数据集层面的理解
4.2.1.样本数据的人工阅读
4.2.2.数据概览
4.2.3.领域模型与数据模型交互理解
4.3.数据探索-数据字段层面的理解
4.3.1.统计分布
4.3.2.数据可视化
4.4.数据探索-业务层面的理解
4.4.1.业务维度组合的探索(基于领域模型)
4.4.2.业务过程理解(基于系统动力学模型)
4.4.3.专家知识的复现
4.5.数据质量审查
4.5.1.示例案例
4.5.2.基于领域模型的质量审查方法
4.5.3.分析项目中数据质量突出的原因
4.5.4.数据质量评价与影响分析
4.6.数据理解阶段的执行策略
4.6.1.执行路径
4.6.2.软件工具
4.6.3.典型的数据处理技巧
参考文献
5.数据准备
5.1.数据流设计
5.1.1.数据仓库建模
5.1.2.领域模型驱动的工业数据组织方法
5.1.3.工业数据分析的数据流图
5.1.4.分析数据流图示例
5.2.数据选择与清洗
5.3.数据融合
5.4.特征提取与选择
5.4.1.特征的来源
5.4.2.特征提取的推进思路
5.5.数据资源化:数据分析师的视角
参考文献
6.模型建立
6.1.常用的算法
6.2.目标变量的相关问题
6.2.1.目标变量的构建
6.2.2.目标变量变换
6.2.3.不均衡问题
6.3.预测变量的相关问题
6.3.1.工况切分
6.3.2.变量的离散化
6.3.3.移除没有业务意义的高相关特征量
6.3.4.特征变量组合
6.3.5.类别变量的完备度
6.4.工业分析建模问题
6.4.1.基准模型
6.4.2.大量测点的稳定过程建模
6.4.3.基于朴素道理的深度网络结构参数优化
6.4.4.时序分类问题
6.4.5.非监督学习问题
6.4.6.优化问题
6.4.7.评价型问题
6.4.8.浅机理、高维度的诊断型问题
6.5.机理模型与统计模型的结合方法
6.5.1.机理模型的范畴:定性与定量机理
6.5.2.统计模型与数学模型的4种融合范式
6.5.3.统计模型与仿真模型的2种融合模式
6.5.4.统计模型与经验性机理模型的融合
参考文献
7.模型评价与部署
7.1.模型评价的内容
7.2.技术评价
7.3.业务评价
7.4.下一步工作规划
7.5.模型部署的内容
7.6.部署包的设计
7.6.1.分析任务的逻辑审查
7.6.2.数据异常的影响分析与应对措施
7.6.3.分析模型打包
7.7.模型运维机制设计
7.8.分析课题总结
参考文献
8. 机器学习融合的设计模式
8.1 机器学习融合设计模式的来源和分类
8.2 业务逻辑与机器学习融合
8.2.1 业务状态机模式
8.2.2 关联规则发现模式
8.3 机理知识与机器学习融合
8.3.1 机理矫正模式
8.3.2 机理正则化约束模式
8.4 运筹优化与机器学习融合
8.4.1 启发策略增强模式
8.4.2 代理模型辅助优化模式
参考文献
9.风功率曲线分析
9.1.业务理解
9.1.1.环境要素
9.1.2.风况要素
9.1.3.控制系统的要素
9.1.4.设计与安装要素
9.2.风功率曲线拟合-数据理解
9.2.1.功率曲线预览
9.2.2.多变量关系
9.3.风功率曲线拟合-数据准备
9.3.1.对风速做分仓
9.3.2.对有功功率做分仓
9.3.3.改进方向
9.4.风功率曲线拟合-回归模型
9.5.风功率曲线异常点识别-数据理解
9.5.1.数据说明
9.5.2.单台风机
內容試閱
前言
作为归纳法的典型代表,机器学习(包括深度学习)已构建起一套完善的理论框架与技术生态系统。近年来,大型预训练模型采用知识嵌入、自注意力等机制,用优异交互体验与表现颠覆了人们对机器学习应用边界的认知。然而,机器学习的整体行业应用成功率不到20%。这不禁让人思考背后原因和解决方法。
在实际工业数据分析项目中,经常面临着数据基础差、场景覆盖不全、技术经济性不够等挑战,也存在机器学习模型与既有知识体系、组织流程和社会体系(伦理与安全风险)融合困难等问题。更本质的原因数据是物理过程的不完整、不完美刻画,为此,数据驱动方式必须巧妙的应用到合适的环节,机器学习模型需要与机理模型、专家规则集成,企业数字化需要DT(Date Technology)、IT (Information Technology)、OT (Operation Technology)的3T融合。以上观点逐步变成了工业大数据分析应用的共识。但在实际中如何推进,目前仍缺乏有效指导方法。这正是本书尝试探讨的工业数据分析方法论。
对于方法论,可以从不同层面去认知和论述。“道法自然”等思想智慧可以指导企业数字化转型和团队建设。笛卡尔方法论四原则(普遍怀疑原则、分解分析原则、逐步综合原则、清晰性原则)等逻辑哲学可以作为数据工程的指导方法。在分析建模中,也有“奥卡姆剃刀原理”、“All models are wrong, but some are useful.”等指导思想。但这些一般性思维往往较为抽象和宽泛,缺乏具体的实施步骤,难以直接应用。相比来说,过程方法通过将大任务拆分,降低了认知负荷,容易将认识转化为行动,为实践者提供了一条清晰和相对一致的路径。因此,本书定位在行业数据分析微观执行层面的过程方法。
针对行业数据分析,业界提出了CRISP-DM (Cross-Industry Standard Process for Data Mining)、ML-Ops (Machine Learning Operations)等方法。CRISP-DM是一种被广泛认可的数据挖掘标准流程方法,将数据挖掘项目划分为业务理解、数据理解、数据准备、模型建立、模型评估、模型部署等六个相互关联且迭代进行的阶段。ML-Ops是一种集成了机器学习(ML)、软件开发(Dev)和运维(Ops)最佳实践的方法论,旨在实现机器学习系统的高效开发、测试、部署、监控、更新和维护,促进数据科学团队与IT运营团队之间的协作,确保模型在整个生命周期内的高质量交付和持续优化。本书内容主要针对模型研发环节,是对CRISP-DM在行业应用的细化,在CRISP-DM的6个步骤之前,增加了一个“分析场景定义”步骤,因为在行业数据分析中,分析问题通常不是给定的,而是需要识别或重新定义的。
全书包含10个章节。第1章概要讨论了方法论的作用,以及工业数据分析过程方法的内容。第2章介绍了分析场景的识别与筛选方法,将分析场景与业务流程、决策逻辑协调起来。第3章将业务理解分解为决策逻辑、决策场景、领域概念三个方面,并针对性提出了对应的形式化模型,以提高DT、IT、OT的跨领域协同。第4章将数据理解分解为数据收集、数据描述、数据探索、数据质量审查等关键步骤,并提出了系统动力学模型、领域模型驱动的数据理解方法;第5章讨论了数据准备工作,特别是数据流设计方法,在设计阶段把生产过程的数据处理流程梳理清楚,提高分析算法的协同开发,也为MLOps奠定基础。第6章讨论了常见的分析建模技巧,以应对工业分析中的标记样本不足、长期稳定、强耦合等挑战。第7章讨论了模型评价与部署这两个步骤,特别是检查增量逻辑的脆弱性和潜在缺陷的方法。第8章总结了机器学习算法的常见组合模式。第9、10章用风电机组风功率曲线分析、冷轧机设备健康分析阐述了上述方法在行业应用的应用。
本书的第1~7章和第9章主要由田春华编写,第1~3章部分得益于与王岩鹏的深入讨论与交流,也感谢关林涛在方法体系的讨论与建议。第8章由裴忠一、韩洁编写,节选自国家重点研发计划项目(2021YFB1715200)的研究成果。第10章由解光耀、王伟主持编写,感谢于志强、秦世峰等全体项目组同事的贡献。最后,非常感谢机械工业出版社各位编辑和审阅老师的富有成效工作,让这本书能以更高的质量呈现在读者面前。
在实际工作中,需要辩证地看待过程方法论。过程方法论固然提供了规范化、结构化的指导框架,但它并不能替代对领域知识、问题本质的深刻理解以及对每个步骤具体内容的精细考量。古人有云,“知之真切笃实处即是行,行之明觉精察处即是知。”真正的知识必然伴随着行动,而有意义的行动也必须基于对事物本质的深刻理解。
作为对行业数据分析方法的探讨,本书内容还有很多可以扩展与深入的地方。特别是随着大模型等人工智能技术的发展,人机交互界面重新划分也必将扩展到数据分析领域。针对本书的局限性或错误,还请广大读者不吝赐教,共同探讨,持续推进数据分析技术在行业中的应用。
田春华

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 香港用户  | 台灣用户 | 海外用户
megBook.com.tw
Copyright (C) 2013 - 2024 (香港)大書城有限公司 All Rights Reserved.