前言
为什么要写这本书
数据分析师要学习和掌握的知识和技能有很多,有工具类、算法类的知识和技能,还有分析方法、可视化方面的知识和技能,具体来说有以下内容。
l 工具类:Excel、Python、SQL 等数据工具的使用。
l 算法类:分类、聚类、回归等算法的原理和应用。
l 分析方法:对比分析、漏斗分析、留存分析、多维度分析的应用。
l 可视化:各种图表、可视化工具的应用。
上述这些知识和技能对数据分析师来说是入行的基本功,是否掌握它们决定了你是否可以胜任数据分析的基础工作。
很多人就算掌握了上述知识和技能,还是会有以下困惑。
l 难道我就是一个取数工具人吗?
l 为什么领导总是对我的分析不满意?
l 面对一个待分析的业务问题,我有很多想法,但没有清晰的思路。
l 我学过各种分析方法,但是不知道在什么时候该用什么方法。
l 我做的分析报告,业务人员总是觉得没用,说报告没有提供有价值的信息。
这些困惑在数据分析初学者中非常常见,为什么会出现这样的情况呢?
这是因为这些知识和技能只是零散的小知识点,我们缺乏一套完整的思路将它们串联起来,组成一个知识体系。
什么是知识体系呢?
我举一个生活中的例子。
假设你在学习做菜,你学会了切菜、翻锅、颠勺等各种烹饪技能,每一项技能你都掌握得非常出色。但是你从来都不知道一道菜是怎么做出来的,即使给了你上好的食材,你也不知道究竟是该油炸还是该清蒸。好一点儿的情况是,你知道某道菜的做法,但只是知其然,不知其所以然,只会按固定流程做,换一道菜就不会了。
空有娴熟的烹饪技能,但不能自由地组合运用它们,就没办法做出一道美味的菜肴。
怎样才能把烹饪的知识点串联起来呢?
以我为例,我原本是一个烹饪“小白”,完全不会做菜,只会按照菜谱一步步操作。
比如,我要做的一道菜是蔬菜肉片汤,也就是将不同的蔬菜和肉片放在一起做汤,如丝瓜肉片汤、黄瓜肉片汤、平菇肉片汤等。我按照菜谱小心翼翼地操作:第几分钟放蔬菜、几分钟后放肉片、再过几分钟放盐等。但就算按照菜谱做菜,我也发现了一个很大的问题:用不同的蔬菜做肉片汤的方法大体是类似的,只是在某些步骤上会有细微的差别。比如,有的蔬菜要比肉片先下锅,有的蔬菜要在将肉片煮30 秒之后再下锅。不同蔬菜的下锅时间是不一样的,这就让人难以记住。如果不是经常做这几道菜,单纯靠死记硬背食材下锅的顺序来做好这些菜几乎是不可能的,下次还得继续看菜谱。
为什么不同蔬菜的下锅时间不一样?差别到底在哪里呢?
有一次趁着休假,我学习了一系列的烹饪课程,其中有一门课程讲解了烹饪的基础原理。这门课程为我打开了新世界的大门,让我的烹饪技能增长不少。那时候我才知道原来蔬菜下锅时间的背后是有逻辑的。
对肉片来说,将其煮熟的时间基本是固定的。肉片如果煮得太久,肉质就会变老,所以在做蔬菜肉片汤这道菜的时候,一定要控制好肉片在锅里煮的时间,肉片不能煮太久,一般煮两分钟就够了。
但是不同的蔬菜在烹饪时间上的差异就很大。有的蔬菜不容易熟,要煮久一点儿,所以要在肉片下锅前先放蔬菜,等蔬菜快熟了再放肉片。有的蔬菜很容易熟,可以在肉片下锅后再放。
所以,到底是先放蔬菜还是先放肉片,关键在于这种蔬菜容不容易煮熟,只要保证肉片在锅里煮的时间为两分钟就行了。
我豁然开朗,我再也不用把每种蔬菜肉片汤的菜谱都背下来了,只要判断一下蔬菜容不容易熟,就可以自己把握烹饪的顺序了。甚至对于一些从没做过的蔬菜肉片汤,我也能做到胸有成竹。相比于之前只能严格按照菜谱做菜的水平,这个知识点瞬间将我的烹饪水平提升了一大截。
原来那个只会按照菜谱做菜的我,很像只懂数据分析方法的数据分析师:在面对熟悉的场景和问题时,知道该如何一步步地操作,但在面对新的问题时,完全不知道该从何下手。
知道了烹饪原理的我,就像那些数据分析高手一样:就算面对的是从没遇见过的场景和问题,也知道该如何组织思路,最终输出分析结果。
新手和高手的差别,就在于高手将零散的知识点串联了起来,拥有了知识体系。
我写这本书的目的也在于此。我希望将数据分析过程中运用的思维整理成一个知识体系,帮助你在思维层面对数据分析有一个更深入的理解。
本书内容概要
本书分为三部分,分别是思维篇、流程篇和实战篇。
思维篇:第1~3章是思维篇,这部分讲解了数据分析师需要掌握的思维能力,具体的章节设计如下。
第1章介绍定义问题的思维。
l 目标思维:让你学会找出问题的目标,避免“无的放矢”。
l 问题思维:让你学会提出一个好问题,为后续的数据分析提供便利。
l 量化思维:让你学会用数据准确地描述问题,体现数据分析的专业性。
第2章介绍分析问题的思维。
l 逻辑思维:让你学会从论据中提炼结论。
l 结构化思维:让你学会对复杂问题进行分析,化繁为简地解决复杂问题。
l 系统性思维:让你学会从动态视角分析问题,解决更复杂的动态问题。
第3章介绍解决问题的思维。
l 商业思维:让你学会解读企业的商业模式,提升经营分析的基本功。
l 业务思维:让你学会拆解业务流程,提升业务分析能力。
l 用户思维:让你学会站在用户视角提出合理假设,提升用户分析的深度。
这几章的内容能够有效帮助你厘清各个知识点之间的关系,提升你的数据分析思维能力。
流程篇:第4 ~ 8 章是流程篇,这部分讲解了一个完整的案例分析流程,以及每个步骤的具体操作方法和注意事项。
l 第4章介绍分析流程:通过一个简单的案例了解分析的全流程。
l 第5章介绍定义和分析问题:让你学会定义问题和分析问题原因的具体方法。
l 第6章介绍提出建议:让你学会提出有价值的建议。
l 第7章介绍结论汇报:让你学会将分析结论组织成报告的方法。
l 第8章介绍其他分析方法:让你了解其他一些常见的分析方法。
实战篇:第9 ~ 12 章是实战篇,这部分通过讲述不同场景的分析案例,帮助你更好地掌握思维和流程的具体应用。
l 第9章介绍用户增长分析案例:让你学会通过细分新老用户,找出各自的增长策略。
l 第10章介绍产品的用户留存分析案例: 让你学会通过细分场景,提高产品的用户留存率。
l 第11章介绍营销转化率分析案例:让你学会通过结合多维度分析和用户行为分析,提升落地页转化率。
l 第12章介绍经营分析案例:让你学会通过指标建设、监控与分析协助经营决策。
相信通过阅读以上内容,你将对数据分析所需要的思维能力、操作流程和具体应用有更深刻的理解。
本书适合谁阅读
l 数据领域从业者:对于已经在数据领域工作的专业人士,无论是数据分析师、数据科学家,还是数据工程师,本书可以帮助他们培养数据分析的思维能力,更好地服务业务部门。
l 业务与管理人员:对销售管理人员、产品经理人员、运营人员、营销策划人员等在日常工作中对数据分析有需求的人来说,本书介绍了数据分析的常规流程,可以帮助他们更好地利用数据驱动业务决策。
l 在校学生:对在校学生,尤其是那些对数据分析感兴趣、希望将来在这个领域发展的学生来说,本书类似于一门从思维层面入门数据分析的课程,这对于他们今后建立数据分析的知识体系有很大的帮助。
本书的局限
在撰写本书时,我意识到本书的内容受到以下几个因素的限制,希望读者在阅读时加以注意。
l 我个人视野的局限性:我在本书中表达的观点和见解主要是基于自己的经验而得出的,某些内容可能带有个人意识或主观色彩。本书旨在提供参考和启示,而非绝对权威的理论指导。
l 案例和示例的局限性:本书中的案例和示例旨在帮助读者更好地理解和应用数据分析的知识。然而,由于篇幅的限制,这些案例和示例无法涵盖所有可能的应用场景。此外,由于涉及业务保密性,本书无法非常详细、具体地给出案例细节。因此,读者在将所学知识应用于实际工作时,需要根据具体情况进行灵活的调整。
l 读者背景与理解程度不同:本书旨在向广大读者介绍数据分析的基本思维和方法,但不同读者的背景和理解程度有所不同。对初学者来说,某些概念可能较为抽象或难以理解;而对已经有一定基础的读者来说,部分内容可能过于简单。因此,读者在阅读时需要根据自己的实际情况,适当调整阅读的速度和深度。