新書推薦:
《
虚弱的反攻:开禧北伐
》
售價:NT$
429.0
《
泰山:一种中国信仰专论(法国汉学经典译丛)
》
售價:NT$
380.0
《
花外集斠箋
》
售價:NT$
704.0
《
有兽焉.8
》
售價:NT$
305.0
《
大学问·明清经济史讲稿
》
售價:NT$
330.0
《
中国国际法年刊(2023)
》
售價:NT$
539.0
《
早点知道会幸福的那些事
》
售價:NT$
295.0
《
迈尔斯普通心理学
》
售價:NT$
760.0
|
內容簡介: |
本书是一本机器学习入门的必备图书,书中没有让人头晕眼花的公式推导,而是通过一些易于理解的类比、案例以及图片,以通俗易懂的方式讲解了机器学习中的一些名词和常见算法,使初学者能够很容易地掌握机器学习的相关概念工具、数据处理、回归与分析、建模与优化等内容。书中还介绍了使用代码构建一个机器学习模型,将读者带入实践环节。
本书非常适合没有任何基础的人工智能爱好者学习使用;对于对机器学习领域还不是很了解的读者来说,本书也是一本非常好的入门书籍。
|
目錄:
|
译者序
前言
第1章什么是机器学习
第2章机器学习种类
21监督学习
22非监督学习
23强化学习
第3章机器学习工具箱
31数据
32基础设施
33算法
34可视化
35高级工具箱
36大数据
37高级基础设施
38高级算法
第4章数据清洗
41特征选择
42行压缩
43Onehot编码
44分箱
45缺失值
第5章设置数据
51交叉验证
52需要多少数据
第6章回归分析
61计算示例
62逻辑回归
63支持向量机
第7章聚类
71k近邻
72k均值聚类
73设置k值
第8章偏差和方差
第9章人工神经网络
91概述
92构建神经网络
第10章决策树
101构建决策树
102随机森林
103Boosting
第11章集成建模
第12章开发环境
121导库
122导入数据集并预览
123查找行
124打印列名
第13章使用Python构建模型
131导库
132导入数据集
133清洗数据集
134清洗过程
135分割数据
136选择算法并配置超参数
137评估结果
第14章模型优化
141模型优化代码
142网格搜索模型代码
第15章模型测试
第16章其他资源
161机器学习
162人工智能的未来
163编程
164推荐系统
165深度学习
166未来生涯
第17章数据集下载
171世界幸福报告数据集
172酒店评论数据集
173精酿啤酒数据集
参考文献
|
內容試閱:
|
自工业革命以来,机器已经走过了漫长的道路。在工厂、车间中,它们的身影越来越多,然而发展到现在,机器的作用已经不再局限于产品制造,而是扩展到了认知任务,这一曾经只有人类能够完成的领域。如今机器能够完成许多复杂的任务,比如评判歌曲比赛、自动驾驶、与专业棋手对弈。
但这些机器非凡的成就引发了一些观察家的恐惧。这种恐惧的一部分源自生存主义者的不安全感,并在这些人之间引发了一些忧虑:如果智能机器在适者生存的斗争中向我们发动进攻呢?如果智能机器产生的后代具有人类从未传授的能力呢?如果《奇点传说》是真的呢?另一个值得担忧的是智能机器对就业的威胁,如果你是出租车驾驶员或会计,那么你有充分的理由为此担忧。根据英国广播公司(BBC)的在线互动资源《机器人会取代我吗》显示,预计在2035年,77%的酒吧工作人员,90%的服务员,95%的特许会计,96%的接待员,以及57%的出租车驾驶员等职业,很可能实现自动化。[1]
但是对工作自动化的研究,和对机器、人工智能(AI)未来发展的顾虑,还应该持保留态度。人工智能技术发展迅猛,但要将其广泛应用,还充满了各种已知的和无法预见的挑战。在探索过程中,出现延误和其他障碍是不可避免的。
机器学习也没有简单到你按下一个开关就为你预测超级橄榄球比赛的结果,或者为你送上一杯美酒。机器学习远远不是你想象的那样能开箱即用。
机器学习是建立在统计算法基础上的,这些算法由数据科学家和机器学习工程师进行管理。机器学习岗位的市场需求注定会增长,但目前而言,机器学习的岗位的需求缺口仍然很大。
然而令业内专家感到遗憾的是,阻碍人工智能发展的最重要障碍之一是缺乏具备必要专业知识和培训的专业人员。
根据Belatrix软件公司思想领导部主管Charles Green的说法:寻找数据科学家,具有机器学习经验的人员,或具有分析和使用数据技能的人员,以及能够创建机器学习所需算法的人员,这是一个巨大的挑战。 其次,虽然技术仍在不断涌现,并且机器学习方面有很多发展。但很明显,AI距离我们的想象还有很长的路要走。[2]
也许你成为机器学习领域专家的道路就从这里开始,或者对机器学习的一些基本理解能够满足你的好奇心。不管怎么样,我们先假设你想有朝一日成为数据科学家或机器学习工程师。
要搭建并编写一个智能机器,必须首先掌握经典统计学。源自经典统计学的算法构成了机器学习中维持动力的血液和氧气。逐层线性回归、k近邻和随机森林涌入机器学习领域,并成为机器认知能力的驱动力。经典统计学是机器学习的核心,其中许多算法都源自你高中时学过的数学公式。
机器学习的另一个不可或缺的部分是代码。搭建网站可不会像WordPress或Wix这样通过简单的单击和拖动就能完成的。编码技能对于管理数据和设计统计模型至关重要。
一些机器学习专业的学生虽然有很多年的编程经验,但可能高中毕业后就再没有接触过基础统计学;还有些人,在高中的时候也从未接触过统计学。即便如此也不用担心,本书中讨论的许多机器学习算法在编程语言中都已经实现,因此不需要求解方程。读者完全可以使用代码来进行实际的数字运算。
如果你以前没有学过编程,并且想在这个领域取得进一步的进展,那么学习编程是很有必要的。但是为了快速入门,本书的内容可以在没有任何编程背景的情况下完成。阅读本书,最好对高级基础知识以及机器学习的数学和统计基础有一定了解。
对于想了解机器学习编程方面的读者,可以查阅第13章、第14章和第16章,相应内容会指导读者使用Python编程语言建立机器学习模型并做出准确预测。第12章还会指导读者如何搭建Python开发环境。
在本书的末尾有关于数据集下载和其他推荐阅读的资源。
|
|