新書推薦:
《
启微·狂骉年代:西洋赛马在中国
》
售價:NT$
357.0
《
有趣的中国古建筑
》
售價:NT$
305.0
《
十一年夏至
》
售價:NT$
347.0
《
如何打造成功的商业赛事
》
售價:NT$
407.0
《
万千教育学前·透视学前儿童的发展:解析幼儿教师常问的那些问题
》
售價:NT$
265.0
《
慈悲与玫瑰
》
售價:NT$
398.0
《
启蒙的辩证:哲学的片简(法兰克福学派哲学经典,批判理论重要文本)
》
售價:NT$
347.0
《
心跳重置
》
售價:NT$
269.0
|
編輯推薦: |
大话经典系列新品重拳出击!
掌握数据爆炸时代先人一步的新思维
EMBA班教学实景展现
解析电力、交通、税务、故障诊断、互联网等行业的真实案例
谈笑间深入理解数据挖掘的来龙去脉,入门必读!
|
內容簡介: |
本书以EMBA班的“数据挖掘技术及其应用”教学为场景,带领读者步入数据挖掘的神秘殿堂,领略数据挖掘的神奇魅力。全书分为9章:第1章从三个真实故事开始数据挖掘之旅;第2章以某企业生产中遇到的质量控制难题的解决过程为线索,展现数据挖掘的实施过程;第3章到第9章以典型案例的形式分别介绍了数据挖掘技术在电力行业、交通航空领域、冶金行业、税务与金融行业、电信行业、故障诊断以及互联网行业的应用。
数据挖掘是一种专业性极强的技术,本书避开大量晦涩的概念和令人生畏的数学公式,以师生互动讨论的形式让读者走进数据挖掘殿堂,进而深入浅出、循序渐进地感知数据挖掘。随着阅读,读者会自然而然地身临课堂,“让数据说话,从数据中发现规律,科学决策”等新的理念会使读者对实际工作中面临的复杂问题浮想联翩、另辟新径。
本书适合企事业部门的领导、管理人员、生产一线的技术人员,另外,学生或者行业工作者,可以通过本书的阅读,为以后的学习奠定好基础。
|
關於作者: |
西安交大美林数据挖掘研究中心
中心集西安美林电子有限公司十五年信息化建设经验和西安交通大学二十多年数据挖掘基础与应用研究精华,致力于将先进的数据挖掘与分析处理技术与中国信息化建设紧密融合,帮助中国企业在物联网、电子商务、智慧制造、智能交通等领域创造价值。
中心数据挖掘研发团队处于国内第一梯队,拥有世界领先的视觉聚类和基于L12
正则化的稀疏分类、回归算法及国内多行业数据挖掘实践经验。西安交大美林数据挖掘研究中心努力以数据挖掘技术推动中国企业实现“中国创造”!
|
目錄:
|
第1章 揭开数据挖掘的面纱
1.1 历史的使命
1.2 数据挖掘的故事
1.2.1 震撼业界的发现
1.2.2 降低成本的绝活
1.2.3 出奇制胜的小纸条
1.3 什么是数据挖掘?
1.4 历史的必然
1.5 数据挖掘能干什么?
1.5.1 关联(ASSOCIATION)规则挖掘
1.5.2 聚类
1.5.3 预测
1.5.4 序列和时间序列
1.6 数据挖掘工具
第2章 数据挖掘流程
2.1 李部长其人
2.2 老革命遇见了新问题
2.3 钓鱼钓来了数据挖掘思路
2.4 数据挖掘项目立项
2.5 数据挖掘项目实施
2.5.1 业务理解阶段(BUSINESS UNDERSTANDING)
2.5.2 数据理解阶段(DATA UNDERSTANDING)
2.5.3 数据准备阶段(DATA PREPARATION)
2.5.4 建模阶段(MODELING)
2.5.5 模型评估阶段(EVALUATION)
2.5.6 部署阶段(DEPLOYMENT)
2.6 李部长的展望
第3章 数据挖掘在电力行业的应用
3.1 应用前景
3.2 电力设备状态检修
3.3 电力系统暂态稳定性评估
3.4 负荷预测
3.5 盗电检测
3.6 电力数据挖掘系统的构建
第4章 数据挖掘在交通航空领域的应用
4.1 铁路票价制定
4.2 高铁轨道检修
4.3 交通流量预测
第5章 数据挖掘在冶金行业的应用
5.1 流程工业这点儿事
5.2 产品质量控制
5.3 高炉炉温预测
5.4 磨矿粒度预测
5.5 炼焦配煤优化
第6章 数据挖掘在税务、金融行业的应用
6.1 税务稽查
6.2 反洗钱
6.3 股票指数追踪
第7章 数据挖掘在故障诊断中的应用
7.1 火箭发动机故障诊断
7.2 机械设备故障诊断
7.3 核动力设备故障诊断
7.4 船舶动力故障诊断
第8章 数据挖掘在电信业中的应用
8.1 市场细分
8.1 市场细分
8.2 精确营销
8.3 业务响应
8.4 客户流失分析
第9章 Web数据挖掘
9.1 Web数据挖掘概述
9.1 Web数据挖掘概述
9.2 垂直搜索引擎中的数据挖掘
9.3 面向电子商务的数据挖掘
9.4 社交网络中的数据挖掘
参考文献
|
內容試閱:
|
第1章 揭开数据挖掘的面纱
徐教授是某985院校的著名教授,国内数据挖掘专家、智能信息处理研究方向学术带头人,主持了20多项国家项目和国际合作项目,具有丰富的数据挖掘项目实施经验,获得过多项国家级大奖。数十年来,他潜心科研,除了给自己学院的本科生和研究生上课外,一直谢绝其他授课邀请。这次他破例了,欣然接受了本校管理学院第5届EMBA班的“数据挖掘及其应用”课程……
1.1 历史的使命
今天是第一节课,徐教授一跨进教室,迎接他的是学员们一阵热烈的掌声。他习惯性地扫视了一下学生,果然正像管理学院张院长介绍的那样,在座的学员不同寻常,年龄在35~50岁之间,个个西装革履,精神焕发,眼睛里放射出对新知识无比渴望的光芒。
徐教授走上讲台,先在黑板上写下了自己的名字和联系方式,然后微笑着说:“同学们,今天我能站在这儿给大家上课,不是因为你们管院张院长有面子,也不是因为你们这些学员地位有多高,说实在的,是党中央、国务院让我来的。”学员们个个目瞪口呆。
有人嘀咕道:“难道中央还关心我们这个EMBA班?。”
“关心,而且非常关心。”徐教授铿锵有力地回答。
大家更加疑惑了。
徐教授提高了嗓门:“2006年1月9日,在全国科技大会上,党中央、国务院作出了建设创新型国家的重大决策。大家都知道,创新型国家是指以技术创新为经济社会发展核心驱动力的国家。技术创新需要科学家和科技工作者的努力,更离不开政府和企业高层领导和管理人员的推动。张院长在邀请我来给你们上课时介绍说,在座各位都在政府部门或者企业地位显赫,所以我欣然地、破天荒地答应了你们院长的邀请。不过,别以为是你们的乌纱帽吸引了我,而是你们每一个人身上肩负的''建设创新型国家''的历史使命召唤着我。”
徐教授越说越激动,喝了口水继续说:“我为科学事业奋斗了一辈子,深知''象牙塔''里的发明、创造,需要与经济建设结合才更能体现出其价值,才更能为建设创新型国家做出贡献。理论创新的成果要真正转化为生产力,迫切需要一种推动力、催化剂。而能起到这种作用的主体非你们这些人莫属,诚如是,你们就是建设创新型国家的排头兵。你们说,党中央能不关心你们吗?”
徐教授的话音刚落,教室里立刻响起长时间的掌声。
他双手从上向下慢慢挥动,示意大家停下,接着说:“近十年来数据挖掘技术飞速发展,在国外,数据挖掘正在变成整个信息技术的核心之一。尤其是世界500强企业均设立了数据挖掘研发与应用部门,数据挖掘技术已成为其业务成功的关键因素。2007年5月,《纽约时报》以''数据挖掘正在进入主流''为题,介绍了数据挖掘技术,并指出这种新技术正在变成人们工作和生活中不可或缺的一个部分。”
徐教授停顿了一下,向大家问道:“在国内,数据挖掘应用的状况怎样?”
T钢铁公司的李部长抢先答道:“在我国,数据挖掘在互联网、金融、电信和商业等领域已经有一些成功的应用,而在其他行业如制造、航空、医药、反恐和刑侦等只有少量的尝试。”
“李部长的评价比较客观,但大家想过没有,为什么我们与发达国家的差距就这么大呢?”徐教授反问道。
教室里一阵沉默。
于是,徐教授坦率地表达了自己的看法:“其实我也一直在考虑这个问题,当然这里面的原因很多。直到你们管院张院长请我给你们上数据挖掘课时,我又发现了一个不可忽视的因素--政府和企业高层对数据挖掘不甚了解而导致他们对此不够重视或不能站在一定的高度提出有价值的需求。”
徐教授的一席话引起了李部长的共鸣,激动地说:“是的,徐教授讲得太对了。就拿我们钢铁公司来说吧,这几年,我们整天喊''挺进世界500强'',忙于引进国外先进设备扩大生产规模,但却忽视与外界的技术交流而成为井底之蛙,就连数据挖掘这样在世界500强企业如雷贯耳的新技术我们却闻所未闻。由于自己不具备这方面的知识,生产管理中遇到了不能解决的问题,自然不会用数据挖掘的思想思考,甚至基层部门提出使用这样的方法,领导层却因对此不甚了解而不给力支持。”
李部长的话说到了其他学员的心坎上,他们个个首肯。
徐教授走下讲台,语重心长地说:“所以,我给你们上数据挖掘课来了,我期望从领导普及数据挖掘知识开始,唤起人们对数据的新认识,使你们告别基于简单统计分析的''报表''决策时期,跨入使用数据挖掘技术的''知识''决策时代。你们这些社会各界的精英们肩负的历史责任太大了,不管是政府部门的领导还是企业的老总,你们每天都在做各种各样的决策,稍有不慎就可能给国家和企业带来重大损失。我相信各位想为国家贡献自己的力量,但陷入''心有余而力不足''的境地,正所谓''我们沉浸在数据的海洋,渴望知识的淡水''!”
听完徐教授一席话,下面的各位老总感慨颇多,台下一片沉思。
徐教授鼓励大家道:“数据挖掘的最高境界就是''从数据中获取知识,辅助科学决策''。希望通过我们的数据挖掘课程的学习,使你们了解到什么是数据挖掘?它能够干什么?有哪些数据挖掘技术?怎么应用?大家要认识到,数据挖掘不同于一般的管理软件,编好了拿来用就是了,数据挖掘在行业的成功应用也是一种创新。其实在数据挖掘算法方面,国内(也包括我)的研究团队也有一系列的国际水平的研究成果,但愿我们一起共同努力,推动数据挖掘技术在各行各业的应用,为建设创新型国家做出最大的贡献!”
教室里,又是一阵激动人心的掌声。
徐教授摆了摆手,接着说:“不过,给你们上这门课可让我费了不少脑筋,你们这些学员走向工作岗位都在10年以上了,大学所学的数学知识大都还给了老师,针对研究生的讲法对你们不适用了。不过,我想出一种专门针对你们的案例教学法,通过典型的应用实例深入浅出地介绍数据挖掘的概念、功能、流程和算法。”
“太好了,徐老师。我曾经翻过几本数据挖掘的书籍,但理论性太强,满篇数学公式,真让人望而却步,而且应用实例甚少,让人难以理解。”李部长感慨地说。
徐教授接着说:“OK,言归正传,让我们开始数据挖掘之旅吧。我先给大家讲三个真实的故事,让你们感受一下数据挖掘到底是神马还是浮云?”
1.2 数据挖掘的故事
1.2.1 震撼业界的发现
“有一个人叫萨姆·沃尔顿的人,大家认识吧?”徐教授问道。
教室里鸦雀无声。
“那沃尔玛,谁没听说过?”徐教授接着问。
“连三岁小孩都知道。”一学员小声说。
“哈哈,萨姆·沃尔顿是沃尔玛公司的创始人呀!”徐教授笑着说。
“对了,想起来了,萨姆·沃尔顿,是他将一个百货商店奇迹般地经营为全球最大的连锁零售企业,早在1985年10月就被《福布斯》杂志列为全美富豪排行榜的首位,连美国前总统布什都赞扬他是地道的美国人,展现了创业精神,是美国梦的缩影……”某超市的万总补充说。
“是的,勤奋、创新是这位智慧商人成功的法宝。他的''日落原则''、''十英尺态度''和''三米微笑''等服务理念以及营销策略''女裤理论''和''啤酒与尿布''至今在商业界令人津津乐道。更令人难忘的是,本世纪初''啤酒与尿布''简直就成了''数据挖掘''的代名词。”徐教授继续说。
“啤酒与尿布,这两个风马牛不相及的东西怎么与数据挖掘扯上了关系?徐老师,快给我们讲讲吧!”移动公司的梁总有点着急了。
“1983年,当一般零售商还在进行信息化建设的时候,沃尔玛已经开始与休斯公司合作,花费2400万美元发射了一颗人造卫星,此后先后投入6亿多美元建起了电脑与卫星系统,还发明了条形码、无线扫描枪、计算机跟踪存货等新技术。借助于整套的高科技信息网络,沃尔玛的各部门沟通、各业务流程可迅速、准确地运行,数据库系统很快积累了海量的经营数据,包括大量的顾客消费行为记录。一年一度的圣诞节快要到了,沃尔玛人按照惯例又一次筹划节日的营销策略。这一次他们使用了一种新的''购物篮分析''软件,对海量的顾客消费行为进行分析,一个意外地发现让他们瞠目结舌,''跟尿布一起购买最多的商品竟然是啤酒!''”
“这怎么可能呢?”有学员也感到疑惑不解。
“经过反复计算、核实,结论没有错。”徐教授答道。
“不过,这个故事告诉我们什么?”又有人问道。
“告诉我们数据挖掘可以发掘埋藏在海量数据中有价值的信息。”徐教授答道。
突然,后排有人大声说:“也告诉大家如果想喝啤酒,老婆不让买,就说去买尿布吧!”惹得大家哄堂大笑。
接着,徐教授问:“这是数据挖掘技术对历史数据进行分析得出的知识,这个结果符合现实情况吗?是否有利用价值?”
“还利用价值,真是六月里穿皮袄--反常!”有学员不以为然。
“紧接着,沃尔玛派出市场调查人员和分析师对这一结果进行了深入研究,证实它揭示了一条隐藏在''尿布与啤酒''背后的美国人的一种行为模式:一些年龄在25~35岁的年轻父亲下班后经常要到超市去给婴儿买尿布,而他们中有30%~40%的人会顺手为自己买几瓶啤酒。”
刚才那位学员想通了,小声说:“对了,这是在美国,老外的行为模式与中国人就是不一样!证实了这样的发现是符合实际的,沃尔玛会怎么办呢?”
徐教授挥动了一下电子教鞭,大声说:“沃尔玛立即采取了行动,将卖场内原来相隔很远的妇婴用品区与酒类饮料区的空间距离拉近,使顾客更加方便。然后对本地区新生育家庭的消费能力进行了调查,对这两个产品的价格也做了调整,并向一次购买达到一定金额的顾客赠送婴儿奶嘴及其他小礼品,结果是尿布与啤酒的销售量双双大增。”
某超市的万总激动地站了起来,情不自禁地说:“不愧为全球零售业巨头啊,高招,值得借鉴!”
徐教授一边示意她坐下,一边说:“是的,不仅在零售业值得借鉴,这种''购物篮分析''后来演变为''关联规则分析'',并在其他行业发挥重大应用,我们EMBA班的学员有很多来自于工业界,下面再给你们讲一个工业生产中利用数据挖掘技术节约成本的故事。”
1.2.2 降低成本的绝活
徐教授:“工业界的学员都知道,派克汉尼汾公司是一家世界一流的工业企业,总部位于美国,于1918年由Arthur
L.Parker先生创立。早在上世纪70年代已发展为全球控制领域最广、产品种类最完备的公司,年销售额超过100亿美元。大家估计下派克公司的年维修费用是多少?”
“200万美元?”
“500万美元?”
……
“该公司产品出售后保修一年,年维修费用超过了一亿美元。” 徐老师说。
“我们鼓风机厂的年产值也比不上人家的年维修费。”一学员喃喃自语。
“那怎样降低维修费用呢?”徐教授问道。
“增加研发费用,提高产品质量!”李部长抢先道。
“不错!但是如果我们假设在目前的技术条件下,产品质量已经达到了较高标准。还有没有其他办法?”
“这个……难道是数据挖掘?”有一学员自语道,其他学员则低头沉思。
徐教授肯定地说:“是的,派克公司采用了数据挖掘方法。以一款干燥器为例,该机器1200多种零件中,常坏的贵重零件约20种。应用数据挖掘的关联规则分析发现这些价格昂贵的零件的寿命竟然大多数与少数几种便宜零件的磨损有关。”
李部长激动了:“妙,妙极了。采用常更换便宜部件,达到延长贵重部件的使用寿命,就可以大大地降低维修成本。我们怎么就想不到呢!”
徐教授看着李部长,说道:“对了,派克公司采用了这样的策略后,仅在这干燥器这种产品上,每年节省维修费高达上千万美元。”
李部长坐不住了,大声说:“我们公司的不锈钢生产线也有同样的问题。徐老师,您指导我们也挖掘挖掘吧!”
徐教授:“别着急,李部长。有很多数据挖掘方法能够解决你们公司生产管理、新产品设计、产品质量控制、能源分析、原料搭配、成本分析等许多问题,以后我们再进一步讨论。”
大家越来越坚信数据挖掘的巨大威力,精神也更加集中了。
……
|
|