登入帳戶  | 訂單查詢  | 購物車/收銀台(0) | 在線留言板  | 付款方式  | 聯絡我們  | 運費計算  | 幫助中心 |  加入書簽
會員登入   新用戶註冊
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2023年度TOP分類閱讀雜誌 香港/國際用戶
最新/最熱/最齊全的簡體書網 品種:超過100萬種書,正品正价,放心網購,悭钱省心 送貨:速遞 / 物流,時效:出貨後2-4日

2024年10月出版新書

2024年09月出版新書

2024年08月出版新書

2024年07月出版新書

2024年06月出版新書

2024年05月出版新書

2024年04月出版新書

2024年03月出版新書

2024年02月出版新書

2024年01月出版新書

2023年12月出版新書

2023年11月出版新書

2023年10月出版新書

2023年09月出版新書

『簡體書』深入浅出数据分析

書城自編碼: 3873858
分類: 簡體書→大陸圖書→計算機/網絡數據庫
作者: [美]Michael Milton[迈克尔.米尔顿]
國際書號(ISBN): 9787121451683
出版社: 电子工业出版社
出版日期: 2023-06-01

頁數/字數: /
書度/開本: 16开 釘裝: 平装

售價:NT$ 714

我要買

share:

** 我創建的書架 **
未登入.



新書推薦:
汉末晋初之际政治研究
《 汉末晋初之际政治研究 》

售價:NT$ 602.0
强者破局:资治通鉴成事之道
《 强者破局:资治通鉴成事之道 》

售價:NT$ 367.0
鸣沙丛书·鼎革:南北议和与清帝退位
《 鸣沙丛书·鼎革:南北议和与清帝退位 》

售價:NT$ 551.0
从康德到黑格尔的发展:兼论宗教哲学(英国观念论名著译丛)
《 从康德到黑格尔的发展:兼论宗教哲学(英国观念论名著译丛) 》

售價:NT$ 275.0
突破不可能:用特工思维提升领导力
《 突破不可能:用特工思维提升领导力 》

售價:NT$ 352.0
王阳明大传:知行合一的心学智慧(精装典藏版)
《 王阳明大传:知行合一的心学智慧(精装典藏版) 》

售價:NT$ 1010.0
失衡与重塑——百年变局下的中国与世界经济
《 失衡与重塑——百年变局下的中国与世界经济 》

售價:NT$ 602.0
不被定义的年龄:积极年龄观让我们更快乐、健康、长寿
《 不被定义的年龄:积极年龄观让我们更快乐、健康、长寿 》

售價:NT$ 352.0

建議一齊購買:

+

NT$ 611
《 SQL实践教程(第10版) 》
+

NT$ 403
《 Spark入门与大数据分析实战 》
+

NT$ 862
《 Pandas数据分析 》
編輯推薦:
《深入浅出数据分析》颠覆了传统的写作手法,根据“元认知”的基本理论,将关键的知识点拆解成一个个生动具体的实践场景,并用精心设计的提问,让读者不由自主地代入角色中,换位思考,以此调动读者自身的思考能力,使他们能真正将知识内化于心,培养数据思维,并在实践中举一反三、解决各类问题。
人人都能成为数据分析师——这本书做到了。
內容簡介:
《深入浅出数据分析》以类似“章回小说”的活泼形式,生动地向读者展现优秀的数据分析人员应知应会的技术:数据分析基本步骤、实验方法、化方法、假设检验方法、贝叶斯统计方法、主观概率法、启发法、直方图法、回归法、误差处理、关系数据库、数据整理技巧;正文之后,意犹未尽地以三篇附录介绍数据分析十大要诀、R工具及ToolPak工具,在充分展现目标知识以外,为读者搭建了走向深入研究的桥梁。
本书通过精心设计的实践场景,让读者不由自主地代入角色当中,真正在体验中学习、思考,将数据分析的要点融化于心,自如地应用在工作和生活中。
關於作者:
Michael Milton,将自己的大半职业生涯献给了非盈利机构,帮助这些机构解析和处理,从赞助人那里收集来的数据,提高融资能力。Michael Milton拥有新佛罗里达学院哲学学位及耶鲁大学宗教伦理学学位。多年来,他博览群书,这些书籍虽字字珠玑,却枯燥乏味;蓦然抬首,深入浅出(HeadFirst)系列图书让他眼前一亮,他欣然抓住机会,写出了这本同样字字珠玑,兼振奋人心的书。走出图书馆和书店,人们会看到他在跑步、摄影,以及亲手酿制啤酒。
目錄
深入浅出数据分析

总目录
序言 XXVIII
1 数据分析引言:分解数据 1
2 实验:检验你的理论 37
3 化:寻找值 75
4 数据图形化:图形让你更精明 111
5 假设检验:假设并非如此 139
6 贝叶斯统计:穿越关 169
7 主观概率:信念数字化 191
8 启发法:凭人类的天性做分析 225
9 直方图:数字的形状 251
10 回归:预测 279
11 误差:合理误差 315
12 关系数据库:你能关联吗? 359
13 整理数据:井然有序 385
附录A 尾声:正文未及的十大要诀 417
附录B 安装R:启动R! 427
附录C 安装Excel分析工具:ToolPak 431

细分目录及各章引子
0 序言
大脑对待数据分析的态度。一边是你努力想学会一些知识,一边是你的大脑忙着开小差。你的大脑在想:“好把位置留给更重要的事, 像该离哪些野生动物远点啊,像光着身子滑雪是不是个坏点子啊。”既然如此,你该如何引诱你的大脑意识到,懂得数据分析是你安身立命的根本?
谁适合阅读本书? XXIX
我们了解你在想什么 XXX
我们了解你的大脑在想什么 XXX
元认知:对思考的思考 XXXII
我们的做法 XXXIII
自述 XXXV
技术顾问组 XXXVII
致谢 XXXVIII
1 数据分析引言
分解数据
数据无处不在。如今,不管是不是自称数据分析师,人人都得处理堆积 如山的数据。熟谙一切数据分析技术方法的分析者会比其他人技高一筹: 他们知道如何处理所有的数据材料,如何将原始数据转变成推进现实工 作的妙策,如何分解和构建复杂的问题和数据集,进而牢牢把握工作中 的各种问题的要害。
Acme化妆品公司需要你出力 2
首席执行官希望数据分析师帮他提高销量 3
数据分析就是仔细推敲证据 4
确定问题 5
客户将帮助你确定问题 6
Acme公司首席执行官给了你一些反馈 8
把问题和数据分解为更小的组块 9
现在再来看看了解到的情况 10
评估组块 13
分析从你介入的那一刻开始 14
提出建议 15
报告写好了 16
首席执行官欣赏你的工作 17
一则新闻 18
首席执行官确信的观点让你误入歧途 20
你对外界的假设和你确信的观点就是你的心智模型 21
统计模型取决于心智模型 22
心智模型应当包括你不了解的因素 25
首席执行官承认自己有所不知 26
Acme给你发来了一长串原始数据 28
深入挖掘数据 31
泛美批发公司确认了你的印象 32
回顾你的工作 35
你的分析让客户作出了英明的决策 36
2 实验
检验你的理论
你能向别人揭示自己坚信的信念吗?正在进行实证检验?做个好实验吧,再 没有什么办法能像一个好实验那样,既能解决问题又能揭示事物的真正运行 规律。一个好实验往往能让你摆脱对观察数据的无限依赖,能帮助你理清因 果联系;可靠的实证数据将让你的分析判断更有说服力。
咖啡业的寒冬到了! 38
星巴仕董事会将在三个月内召开 39
星巴仕调查表 41
务必使用比较法 42
比较是破解观察数据的法宝 43
价值感是导致销售收入下滑的原因吗? 44
一位典型客户的想法 46
观察分析法充满混杂因素 47
店址可能对分析结果有哪些影响 48
拆分数据块,管理混杂因素 50
情况比预料的更糟! 53
你需要做一个实验,指出哪种策略有效 54
星巴仕首席执行官已经急不可待 55
星巴仕降价了 56
一个月后…… 57
以控制组为基准 58
避免解雇123 61
认真
让我们重新做一次实验 62
一个月后…… 63
实验照样会毁于混杂因素 64
精心选择分组,避免混杂因素 65
随机选择相似组 67
随机访谈 68
准备就绪,开始实验 71
结果在此 72
星巴仕找到了与经验吻合的销售策略 73
3 化
寻找值
有些东西人人都想多多益善。为此我们上下求索。要是能用数字表示我 们不断追求的东西——利润、钱、效率、速度等,实现更高目标的机会 就在眼前。有一种数据分析工具能够帮助我们调整决策变量,找出解决 方案和优化点,使我们限度地达到目标。本章将使用这样一种工具, 并通过强大的电子表格软件包Solver来实现这个工具。
现在是浴盆玩具游戏时间 76
你能控制的变量受到约束条件的限制 79
决策变量是你能控制的因素 79
你碰到了一个化问题 80
借助目标函数发现目标 81
你的目标函数 82
列出有其他约束条件的产品组合 83
在同一张图形里绘制多种约束条件 84
合理的选择都出现在可行区域里 85
新约束条件改变了可行区域 87
用电子表格实现化 90
Solver一气呵成解决化问题 94
利润跌穿地板 97
你的模型只是描述了你规定的情况 98
按照分析目标校正假设 99
提防负相关变量 103
新方案立竿见影 108
你的假设立足于不断变化的实际情况 109

4 数据图形化
图形让你更精明
数据表远非你所需。你的数据庞杂晦涩,各种变量让你目不暇接,应付堆积 如山的电子表格不只令人厌倦不堪,而且确实浪费时间。相反,与仅仅使用 电子表格不同,一幅用纸不多、栩栩如生的清晰图像,却能让你摆脱“一叶 障目,不见泰山”的烦恼。
New Army需要优化网站 112
结果面世,信息设计师出局 113
前一位信息设计师提交的三份信息图 114
这些图形隐含哪些数据? 115
体现数据! 116
这是前一位设计师主动提供的意见 117
数据太多绝不会成为你的问题 118
让数据变美观也不是你要解决的问题 119
数据图形化的根本在于正确比较 120
你的图形已经比被打入冷宫的图形更有用 123
使用散点图探索原因 124
秀的图形都是多元图形 125
同时展示多张图形,体现更多变量 126
图形很棒,但网站掌门人仍不满意 130
优秀的图形设计有助于思考的原因 131
实验设计师出声了 132
实验设计师们有自己的假设 135
客户欣赏你的工作 136
订单从四面八方滚滚而来! 137

5 假设检验
假设并非如此
世事纷纭,真假难辨。人们需要用庞杂多变的数据预测未来,然而免不了 剪不断,理还乱。正因如此,分析师不会简单听信浮于表面的解释,也不 会想当然地认可这些解释的真实性:通过数据分析的仔细推理,分析师能 够异常细致地评估大量备选答案,然后将手头的一切信息整合到各种模 型中。接下来要学的证伪法即是一种切实有效的非直觉方法。
给我来块“皮肤”…… 140
我们何时开始生产新手机皮肤? 141
PodPhone不希望别人看透他们的下一步行动 142
我们得知的全部信息 143
电肤的分析与数据相符吗? 144
电肤得到了机密《战略备忘录》 145
变量之间可以正相关,也可以负相关 146
现实世界中的各种原因呈网络关系,而非线性关系 149
假设几个PodPhone备选方案 150
用手头的资料进行假设检验 151
假设检验的核心是证伪 152
借助诊断性找出否定性小的假设 160
无法一一剔除所有假设,但可以判定哪个假设强 163
你刚刚收到一条图片短信…… 164
即将上市! 167

6 贝叶斯统计
穿越关
数据收集工作永不停息。必须确保每一个分析过程都充分利用所搜集到的与 问题有关的数据。虽说你已学会了证伪法,处理异质数据源不在话下,可要 是碰到直接概率问题该怎么办?这就要讲到一个极其方便的分析工具,叫做 贝叶斯规则,这个规则能帮助你利用基础概率和波动数据做到明察秋毫。
医生带来恼人的消息 170
让我们逐条细读正确性分析 173
蜥蜴流感到底有多普遍? 174
你计算的是假阳性 175
这些术语说的都是条件概率 176
你需要算算 177
1%的人患蜥蜴流感 178
你患蜥蜴流感的几率仍然非常低 181
用简单的整数思考复杂的概率 182
搜集到新数据后,用贝叶斯规则处理基础概率 182
贝叶斯规则可以反复使用 183
第二次试验结果:阴性 184
新试验的正确性统计值有变化 185
新信息会改变你的基础概率 186
放心多了! 189
7主观概率
信念数字化
虚拟数据未尝不可。真的。不过,这些数字必须描述你的心智状态,表明你的信念。主观概率就是这样一种将严谨融入直觉的简便办法,具体做法马上介绍。随着讲解的进行,你将学会如何利用标准偏差评估数据分布,前面学过的一个更强大的分析工具也会再次登台亮相。
背水投资公司需要你效力 192
分析师们相互叫阵 193
主观概率体现专家信念 198
主观概率可能表明:根本不存在真正的分歧 199
分析师们答复的主观概率 201
首席执行官不明白你在忙些什么 202
首席执行官欣赏你的工作 207
标准偏差量度分析点与平均值的偏差 208
这条新闻让你措手不及 213
贝叶斯规则是修正主观概率的好办法 217
首席执行官完全知道该怎么处理这条新信息了 223
俄罗斯股民欢欣鼓舞! 224
8 启发法
凭人类的天性做分析
现实世界的风云变幻让分析师难以料事如神。总有一些数据可望不可及,即 使有所能及,化方法也往往艰深耗时。所幸,生活中的大部分实际思维 活动并非以理性的方式展开,而是利用既不齐全也不确定的信息,凭经验 进行处理,迅速做出决策。奇就奇在这些经验确实能够奏效,因此也是进行 数据分析的重要而必要的工具。
邋遢集向市议会提交了报告 226
邋遢集确实把镇上打扫得干干净净 227
邋遢集已经计量了自己的工作效果 228
他们的任务是减少散乱垃圾量 229
计量垃圾量不可行 230
问题刁钻,回答简单 231
数据邦市的散乱垃圾结构复杂 232
无法建立和运用统一的散乱垃圾计量模型 233
启发法是从直觉走向化的桥梁 236
使用快省树 239
是否有更简单的方法评估邋遢集的成就? 240
固定模式都具有启发性 244
分析完毕,准备提交 246
看来你的分析打动了市议会的议员们 249
9 直方图
数字的形状
直方图能说明什么?数据的图形表示方法不计其数,直方图是其中出类 拔萃的一种。直方图与柱状图有些相似,能迅速而有效地汇总数据。接 下来你将用这种小巧而实用的图形量度数据的分布、差异、集中趋势等。 无论数据集多么庞大,只要画一张直方图,就能“看出”数据中的奥妙。 让我们在本章中用一个新颖、免费、无所不能的软件工具绘制直方图。
员工年度考评即将到来 252
伸手要钱形式多样 254
这是历年加薪记录 255
直方图体现每组数据的发生频数 262
直方图不同区间之间的缺口即数据点之间的缺口 263
安装并运行R 264
将数据加载到R程序 265
R创建了美观的直方图 266
用数据的子集绘制直方图 271
加薪谈判有回报 276
谈判要求加薪对你意味着什么? 277
10 回归
预测
洞悉一切,未卜先知。回归分析法力无边,只要使用得法,就能帮助你预测 某些结果值。若与控制实验同时使用,回归分析还能预测未来。商家狂热地 运用回归分析帮助自己建立模型,预测客户行为。本章即将让你看到,明智 地使用回归分析,确实能够带来巨大效益。
你打算怎么花这些钱? 280
以获取大幅度加薪为目的进行分析 283
稍等片刻……加薪计算器! 284
这个算法的玄机在于预测加薪幅度 286
用散点图比较两种变量 292
直线能为客户指明目标 294
使用平均值图形预测每个区间内的数值 297
回归线预测出人们的实际加薪幅度 298
回归线对于具有线性相关特点的数据很有用 300
你需要用一个等式进行精确预测 304
让R创建一个回归对象 306
回归方程与散点图密切相关 309
加薪计算器的算法正是回归方程 310
你的加薪计算器没有照计划行事…… 313
11 误差
合理误差
世界错综复杂。预测有失精准并不稀奇。不过,如果在进行预测的时候 指出误差范围,你和你的客户就不仅能知道平均预测值,还能知道该误 差造成的典型偏差,指出误差可以让预测和信念更全面。通过本章讲授 的工具,你还会懂得如何控制误差及如何尽量降低误差,从而提高预测 可信度。
客户大为恼火 316
你的加薪预测算法做了什么? 317
客户组成 318
要求加薪25%的家伙不在模型范围内 321
如何对待想对数据范围以外的情况进行预测的客户 322
由于使用外插法而惨遭解雇的家伙冷静下来了 327
你只解决了部分问题 328
扭曲的加薪结果数据看起来是什么样子? 329
机会误差=实际结果与模型预测结果之间的偏差 330
误差对你和客户都有好处 334
机会误差访谈 335
定量地指定误差 336
用均方根误差定量表示残差分布 337
R模型知道存在均方根误差 338
R的线性模型汇总展示了均方根误差 340
分割的根本目的是管理误差 346
优秀的回归分析兼具解释功能和预测功能 350
相比原来的模型,分区模型能更好地处理误差 352
你的客户纷纷回头 357

12 关系数据库
你能关联吗?
如何组织变化多端的多变量数据?一张电子数据表只有两维数据:行和列。如果你的数据包括许多方面,则很快就会过时。在本章,你会看出电子表格很难管理多变量数据,还能看到关系数据库管理系统让多变量数据的存储和检索变得极其简单。
《数据邦新闻》希望分析销量 360
这是他们保存的运营跟踪数据 361
你需要知道数据表之间的相互关系 362
数据库就是一系列相互有特定关系的数据 365
找到一条贯穿各种关系的路线,以便进行必要的比较 366
创建一份穿过这条路径的电子表格 366
通过汇总将文章数目和销量关联起来 371
看来你的散点图确实画得很好 374
复制并粘贴所有这些数据是件痛苦的事 375
用关系数据库管理关系 376
《数据邦新闻》利用你的关系图建立了一个RDBMS 377
《数据邦新闻》用SQL提取数据 379
RDBMS数据可以进行无穷无尽的比较 382
你上了封面 383

13 整理数据
井然有序
乱糟糟的数据毫无用处。许多数据搜集者需要花大量时间整理数据。不 整齐的数据无法进行分割、无法套用公式,甚至无法阅读,被人们视而 不见也是常事,对不对?其实,你可以做得更好。只要眼前清楚地浮现 出希望看到的数据外观,再用上一些文本处理工具,就能抽丝剥茧地整 理数据,化腐朽为神奇。
刚从停业的竞争对手那儿搞到一份客户名单 386
数据分析不可告人的秘密 387
Head First猎头公司想为自己的销售团队搞到这份名单 388
清理混乱数据的根本在于准备 392
一旦组织好数据,就能修复数据 393
将#号作为分隔符 394
Excel通过分隔符将数据分成多个列 395
用SUBSTITUTE替换“^”字符 399
所有的“姓”都整理好了 400
用SUBSTITUTE替换名字模式太麻烦了 402
用嵌套文本公式处理复杂的模式 403
R能用正则表达式处理复杂的数据模式 404
用sub指令整理“名” 406
现在可以向客户交货了 407
可能尚未大功告成…… 408
为数据排序,让重复数值集中出现 409
这些数据有可能来源于某个关系数据库 412
删除重复名字 413
你创建了美观、整洁、具有性的记录 414
Head First猎头公司正在一网打尽各种人才! 415
再见…… 416
附录A 尾声
正文未及的十大要诀
你已颇有收获。但数据分析这门技术不断变迁,学之不尽。由于本书篇幅有 限,尚有一些密切相关的知识未予介绍,我们将在本附录中浏览十大知识点。
其一:统计知识大全 418
其二:Excel技巧 419
其三:耶鲁大学教授Edward Tufte(爱德华·塔夫特)的图形原则 420
其四:数据透视表 421
其五:R社区 422
其六:非线性与多元回归 423
其七:原假设-备择假设检验 424
其八:随机性 424
其九:Google Docs 425
其十:你的专业技能 426
附录B 安装R
启动R!
强大的数据分析功能靠的是复杂的内部机制。好在只需几分钟就能安装 和启动R,本附录将介绍如何不费吹灰之力安装R。
R起步 428
附录C 安装Excel分析工具
ToolPak
Excel有一些好的功能在默认情况下并不安装。为了执行第3章的优化和第 9章的直方图,需要激活Solver和Analysis ToolPak,Excel在默认情况下安 装了这两种扩展插件,但若非用户主动操作,这些插件不会被激活。
在Excel中安装数据分析工具 432
內容試閱
序言:如何使用本书
谁适合阅读本书?
请先回答几个问题:
1、你觉得,数据中隐含了无穷的智慧,只要有合适的工具,就能利用这些智慧,对吗?
2、你想学习、理解和记忆如何创建靓丽的图形、试验假设条件、进行回归分析或整理混乱的数据,对吗?
3、你喜欢笑语喧哗的晚宴甚于枯燥、无聊的学术演讲,对吗?
如果以上问题全部回答“对!”——这本书适合你。

谁该和本书说拜拜?
请先回答几个问题:
1、你是一个经验老到的数据分析师,正在调查数据分析领域前沿的课题,对吗?
2、你从未用过Microsoft Excel或OpenOffice calc,对吗?
3、你惧怕尝试新事物,宁可上山打虎也不愿标新立异,对吗?你认为要是用拟人的手法叙述控制组和目标函数, 技术书籍就难免有失严肃,对吗?
只要有一个问题回答“对!”——你与本书无缘。
我们了解你在想什么——
“这怎么能是一本严肃的数据分析图书呢?”“这些图都是用来干嘛的?”“我真能这样学数据分析吗?”
我们了解你的大脑在想什么——
你的大脑渴望新事物。大脑总是不停地搜索、探查、等待不同寻常的 物,它天生如此,这正是你活力的来源。
那么,大脑怎么对待你所碰到的常规、普通、一般的事情呢?
它会竭尽全力阻止这些事情,以免干扰自己真正的工作——记录重要事项。大脑不会费力保存这些琐事;这些琐事从来不会成功地闯过“明显不重要事项”的关卡。
你的大脑如何知道哪件事重要?假想有一天你出门旅行,迎面扑来一只吊睛白额大虎,你的头脑和身体会有什么反应?
神经元发动……情绪激动……化学物质激增。 于是,你的大脑知道——
这事重要!记住!
但,想象你是呆在家里,或者是呆在图书馆里,也就是说,是在一个安全、温暖、没有老虎的地方。
你正在复习迎考,要不然就是在努力弄明白一些艰深的技术,你的老板认为花个把星期就能搞定,顶多十天。
的问题是:你的大脑想好好帮你一把,它试图保证不让这种“明显不重要”的内容去破坏珍稀的资源,这些珍稀的资源好用来保存真正“重大”的事情,像老虎啊,像火灾险情啊 像你绝不该在大学生网站Facebook的网页上贴上那些聚会照片啊。没有什么便当的办法可以告诉大脑:“喂,大脑,我对你感激之至,可惜啊,不管这本书多无聊,也不管我的情感地动仪如何纹丝不动,我真的希望你把这些材料都记住。”
行啊。 才不过490页而已,这些枯燥、无聊、烦人的内容。
元认知:对思考的思考
如果真想学东西,而且想学得更快更深入,就要关注自己如何集中注意力。要思考自己的思考方式;研究自己的研究方式。
大多数人在成长过程中都不曾学习元认知和学习理论方面的知识。人们期望我们学知识,但极少有人教我们如何学。 但想象得到,捧着本书的你,的确想学习数据分析知识,同时可能不想花费太多时间。要想利用在本书中读到的知识,就得记住读过的知识,为此必须理解这些知识。为了淋漓尽致地发挥本书或任何书本或学习经验的作用,请管好你的大脑,请管好大脑对待本书的态度。
诀窍在于让大脑把正在学习的新资料当作“正经大事”——对幸福至关重要的大事,像老虎一样重要的大事。若非如此,你就会陷入一场持久战:你竭力要记住新知识,大脑却竭力要把这些新知识踢出去。
既然如此,如何让大脑像对待吃人的老虎一样对待数据分析知识呢?
有两种办法,一种缓慢而乏味,一种迅速而有效。慢办法是简单记忆。你显然明白,只要不停地把同样的东西往大脑里灌,即使是乏味的知识,也能学会、记牢。只要重复灌的次数足够多,大脑就会想:“这些东西给他的感觉并不重要,但他不停地看这些相同的东西,一遍,一遍,再一遍。因此我猜这些东西肯定很重要。”
快办法是做一切增进大脑活动的事,尤其是不同类型的大脑活动。上一页讲了很多这样的活动,事实证明,这些活动全都能促使大脑以有利于己的方式工作。例如,研究表明,将文字放在文字所描述的图片当中(相反的做法是将文字放在页面中的其他位置,如注释位置或正文位置),会促使大脑努力搞清楚文字和图片之间的关系, 进而发动更多神经元。更多神经元发动 = 更有机会让大脑明白某件事值得注意,可能还值得记住。
对话式的写作风格对此很有帮助。人们在与人对话时注意力会更集中,原因是别人期待他们有所表现。令人惊讶的是,大脑不一定会在意“对话”是在人和书之间进行! 反之,要是写作风格了无新意,乏味枯燥,大脑的感觉就和在挤满消极听众的屋子里听演讲没什么两样:没必要保持清醒。
不过,图形和对话式风格只是起步……
怎样才能让我的大记住这些资料呢?
我们的做法
我们使用丰富的图片,这是因为,大脑追逐图像,而非文字。在大脑的活动中,一张图片胜过千言万语。当同时使用图片和文字进行说明时,我们将文字填写在图片当中,当文字出现在它所描述的事物当中时,大脑的工作更有效率;相反,若将说明性文字放在注释或其他正文当中,则无此效果。
我们使用反复论述法,即以不同的方式、通过不同的媒介对同一主题进行反复描述, 给读者营造丰富的感受,目的是让这些主题有更多机会印在大脑的多个区域。
我们以出人意料的方式叙述概念和使用图片,因为,大脑追逐新鲜事物;我们在图片和创意中或多或少加入了一些情感性的内容,因为,大脑关注情感的生物化学反应。让人有所感触的东西更可能让人记住,即使这点感触不过是一丝幽默、一丝惊讶或一丝兴趣。
我们使用个性化的对话式写作风格,因为,当大脑认为你是在进行对话而不是在消极地听报告时,就会调整到注意力更集中的状态。即使在读书时,大脑也是这个习惯。
我们安排了80多个活动,因为,相比读书,在做事时,大脑经过调整,能学会和记住更多东西。我们安排的练习有难度,但不会让人束手无策,这正是大多数人愿意做的练习。
我们使用多种教学风格,因为,有的人可能喜欢一步一步按顺序来,有的人可能喜欢先看懂大图,还有一些人可能只想看看例子。我们将以多种方式反复讲述相同的主题,不管读者的个人爱好如何,他们都将因此受益匪浅。

我们安排了让左右脑半球分别负责的内容,因为,大脑开动部位越多,就学得越多,记得越多,注意力更持久。由于一侧大脑工作往往意味着另一侧大脑得到休息,左右半脑的分工合作使得长时间学习的学习效率得到提高。
我们还安排了一些场景和练习,在场景中展现不同的观点,因为,当大脑被迫进行评估和判断时,会调整到深入学习状态。
我们在练习中安排了一些难点,即提出一些无法简单回答的问题。因为,你的大脑在不得不处理某件事情时,会调整到学习和记忆状态。开动脑筋吧,“光看别人做运动无法让自己体态健美”。别担心,我们尽力保证,你努力学习的都是该学的,你不会为了对付 一个费解的例子或为了分析一段用词过于晦涩或行文过于简练的段落而多用一个脑细胞。
我们以人物为例,把人物安排在场景、实例、图片等内容中。至于原因嘛,因为你是人群中的一员啊,你的大脑对人比对事更关注。
你的任务:征服大脑
我们的工作到此为止,剩下的就看你的了。从下面这些提示出发,顺从大脑的判断,看看哪些对你有用,哪些 对你没用,尝试一下新事物吧。

1、慢慢读。理解的内容越多,要记忆的内容越少。 忌死读。停一停,想一想,碰到书中的提问时,别直接翻看答案;想象真的有人在问你这个问题。强迫自己的大脑想得越深,学会、记住的概率就越大。
2、自己做练习,自己记笔记。我们安排了练习和笔记,但是,要是我们替你完成,就像让别人替你锻炼身体一样;只动眼不动手也不可取,要动动笔。大量证据证明,学习时的身体动 作能提高学习效率。
3、阅读“世上没有傻问题”部分。 世上没有傻问题。这些问题并非可看可不看,这是核心内容的组成部分!请勿忽略。
4、请将下面这段话作为后一段床头阅读文字,或起码作为后一段高深的床头阅读文字。
有一部分学习过程(尤其是短暂记忆转变为长期记 忆的过程)发生在放下书本之后,大脑需要有自己的时间进行更多处理。如果在这段处理时间内学新东西,将会丢失一些刚学会的东西。
5、开口大声讨论。 说话会刺激大脑的其他部分。如果你正在努力理解 一些知识,或者正在努力增加以后记住这些知识的 概率,请大声说出这些知识。还有一种更好的做法, 试着向别人大声解释这些知识。你会学得更快,可 能还会发现一些阅读时不曾发现的名堂。
6、大量喝水。 充沛的体液会让大脑处于工作状态,脱水(早在感到口渴前就会发生)则会让认知功能下降。
7、聆听大脑的声音。 留意你的大脑是否超负荷工作。若你发现自己开始心不在焉,或者刚刚读过的东西转眼忘记,就该休息。一旦过了某个学习点,哪怕拼命塞,也无法提高学习效率,反而有可能影响学习。
8、找到感觉。大脑需要知道事情是否重要。让自己融入各种场景,为照片设想旁注,就连抱怨一个并不好笑的玩笑,也比什么感觉都没有强。
9、 请将下面这段话作为后一段床头阅读文字,或起码作为后一段高深的床头阅读文字。
有一部分学习过程(尤其是短暂记忆转变为长期记 忆的过程)发生在放下书本之后,大脑需要有自己的时间进行更多处理。如果在这段处理时间内学新 东西,将会丢失一些刚学会的东西。
10、开口大声讨论。说话会刺激大脑的其他部分。如果你正在努力理解一些知识,或者正在努力增加以后记住这些知识的概率,请大声说出这些知识。还有一种更好的做法,试着向别人大声解释这些知识。你会学得更快,可能还会发现一些阅读时不曾发现的名堂。
11、勤加练习!学会数据分析的办法就是勤加练习,这正是本书的要求。数据分析是一门技术,精于此道的 办法就是大量实践。本书将给你带来大量实践机会:每一章中都有一个等待你解决的问题,千万别跳过这些问题不看——大量学习都发生在解决问题的过程中。我们为每一个问题提供了答案,要是卡了壳(有些细微之处很容易给人带来麻烦),别不敢看!不过,请尽量先解决问题再看答案,务必让你的办法行之有效,然后才继续看书中的下一部分内容。

自述
本书是经验之谈,并非参考书籍,我们故意抽掉了会妨碍讲述书中相关知识的东西。本书对你已经见识过和学习过的知识作了一些假设,因此次通读本书的时候, 需要从头读起。
本书并非软件工具指导书
许多以“数据分析”为题的图书都是顺着Excel函数表把认为和数据分析有关的部分一路讲下去,然后针对每个函数给几个实例。但《深入浅出数据分析》讲的是如何成为数据分析师,尽管你在本书中会学到相当多的软件工具,但它们不过是手段而已,目的是学习如何进行出色的数据分析。
我们希望你懂得如何使用基本的电子表格公式。
用过电子表格的SUM求和公式吗?要是没用过,你可能先要突击一下才能开始学习本书。尽管许多章节根本不要求使用电子表格,但其他有此要求的章节却假定你会使用各种公式。要是熟悉SUM工具,那么你基础不错。
本书超越统计学
本书充满统计知识,作为数据分析师,你应该尽量多掌握一些统计知识,读完《深入浅出数据分析》之后,好再读一读《深入浅出统计学》(Head First Statistics)。不过,数据分析不仅涵盖统计学,还牵涉许多其他领域,本书中选用的非统计题材主要用于讲解来源于现实生活的具体、实用的数据分析经验。
活动并非可做可不做
练习和活动不是点缀,而是本书的核心组成部分。这些练习和活动有的是为了帮助记忆,有的是为了帮助加深理解,还有的是为了帮助应用所学知识,切勿忽略。
反复论述是刻意而重要的安排
深入浅出系列图书有一个明显特色:我们希望你真正掌握学到的知识,我们希望你在看完本书的同时就记住学到的知识。大多数参考书都不把记忆和回忆当作一个目标,但本书的目标是学会,所以,常常会看到同一概念多次出现。
本书意犹未尽。
我们乐于看到你在书籍合作网站上找到更多实用而有趣的资料,链接0-1可为你提供这些资料。
“动动脑”练习没有答案
有一些“动动脑”练习没有标准答案;另有一些练习可以参考“动动脑”活动的 学习经验部分判断自己的答案是否正确,以及在什么情况下会正确。部分“动动脑” 练习给出了提示,为你指明正确方向。

译者序
《深入浅出数据分析》自2010年面世以来,已畅销十三年。近日,编辑刘皎老师与我
联系,建议进一步推敲几处译文,又嘱我再作序言,这意味着,此书将继续在市场上为
者传递知识,这真是令人激动而欣慰。
十三年不算短,足以改变一个人,也足以考验一本书。一个人,可以在十三年里从年
富力强的中年步入双鬓染霜的暮年;一本书,尤其是知识密集型的书,若不与时代共舞,
则很容易从流行走向寂寞。《深入浅出数据分析》中文版首印量只有700册,此后年年加印,总计恐怕已超过100个700册,从每年的销量来看,它可算数据分析图书领域的“长青树”,应该说,它是时代潮流考验下的佼佼者。
这本书为什么有这么大的魅力?我想这和所有为这本书撒下过汗水的人是分不开的。
首先,原著作者及出版团队出类拔萃,书中的序言和致谢等部分足以体现这一点;其次,
中文版编辑团队功不可没——我本来不知道一本书的出版需要这么多位编辑,因为这本书
才长了见识。我还记得,当初与我签订翻译合同的是徐定翔编辑,我在版序言中对他
表示了诚挚的感谢,现在再次感谢他对我的信任和指点;管理这本书时间长的是刘皎编
辑,差不多有十年了吧!十年来,她总是那么热情爽朗,随时在QQ和微信上回应我的讯
息,使我倍感亲切;还有美编、发行,没有他们的努力,哪里会有什么“长青树”。感谢
读者的提醒和指正,使得此书在重印时更正了早期的几处瑕疵,成为精雕细琢的佳品。我
以一名不成熟的译者的身份,多年来享受着一本好书的荣光,心中对上述所有关心此书者
的感激之情,难以一一言表,在此一并谢过。
正如O’Reilly出版社Head First系列的其他图书那样,本书在语言组织、排版设计方面非常有特色,用“周到”二字形容十分妥当,用“新颖”二字形容也毫不为过。其构思
跌宕起伏,行文妙趣横生,无论读者是职场老手、还是业界新人,无论是字斟句酌、还是
信手翻阅,都能跟随文字在职场中畅游,体味数据分析领域的乐趣与挑战。一本技术图书,
在传道授业之余,还兼具了章回小说的趣味与精彩。这些设计巧妙的“章回”向读者生动
地展现了数据分析基本步骤、实验方法、化方法、假设检验方法、贝叶斯统计方法、
主观概率法、启发法、直方图法、回归法、误差处理、相关数据库、数据整理技巧。此后
意犹未尽,又以三篇 附录介绍数据分析的十大要务、R工具及ToolPak工具。不仅尽情展现了目标知识,还为读者搭建了走向深入研究的桥梁……字里行间,流露出作者传道授业的
热忱。
本书竭尽全力地做到了以下两点。,克服术语的障碍。对于这一点,英文读者恐
怕比中文读者体会更深,层出不穷的英文术语甚至让以英语为母语的读者都感到头痛,作
者深知这一点,于是尽量用浅显的语言表述,解除英文读者的心头之患;至于中文,感谢
汉语的优秀特性(倘若作为译者的我没有帮倒忙的话),术语方面的问题甚至可以忽略不
计了(为方便读者审评,部分术语翻译对照表可扫封底二维码获取)。第二,设法实现理
论与实践的转化。理论如何向实践转化?这一向是学习者的难题,然而本书精心构思的“
章回”体裁,让理论知识与实际操作水乳交融,更贴近职场实践。除了谈分析,作者也谈
经济、谈局势、谈心理、谈做人,涉猎广泛,面面俱到。
十三年来,我经常关注读者对本书的评价,初有一两个评价是关于翻译质量的,后
来译者渐渐被遗忘(这是好事),绝大部分评价都针对书籍内容、价格、包装、快递……
纷纷扰扰,实属热闹,既是“热”书,本该如此。有的读者爱它,因为简单;有的读者恨
它,也因为简单。爱的恨的,都可以理解,不仅可以理解,而且令人钦佩——都是一些勤
奋上进的人儿呀!
本书初次面市时,微博刚刚进入人们的生活,豆瓣还是当时为数不多的读者交流平台
之一,我初看到的评论,就来自这些地方。后来,微信横空出世,公众号成了自媒体人
谈天论地的“后花园”,关于本书的书评也更为细腻、深入、广泛、图文并茂。不过,无
论读者平台如何潮涨潮落,都没有淹没《深入浅出数据分析》这艘知识的小舟。相反,它
一直逐波远行,笑看数据分析技术的日新月异。每每思及此处,想到那些凭此书叩开数据
分析领域大门的人,那些熟谙本书介绍的数据分析技巧而在职场中游刃有余的人,总觉得
他们的快乐、满足和积极上进的精神也传递到了我的身上。
作为译者,我是幸福的。
译者 李芳
2023年2月

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 台灣用户 | 香港/海外用户
megBook.com.tw
Copyright (C) 2013 - 2024 (香港)大書城有限公司 All Rights Reserved.