前言
任何一家公司都会面对或多或少的客户,产生千万甚至上亿的数据来洞察客户的行为,支撑自身公司业务的发展。
数据分析是一个从数据中通过分析手段发现业务价值的过程。这个过程的起点可以是确定我们的分析目的,这个过程的终点是发现业务价值,提供数据支撑。
1) 数据分析发展背景
进入到 21 世纪以后,伴随着互联网的迅速发展,大数据应运而生,越来越多的数据被不断的挖掘出来,形成了“数据为王”的时代。就拿我们自己举例子,比如你的购物习惯、你的喜好等等,这些都会组成数据,对你购物习惯的分析会帮助购物平台更精准的推荐商品,这只是数据分析应用的冰山一角,它还可以应用到金融领域、交通领域、畜牧业等等。随着数据规模越来越庞大,单靠人力重复的脑力劳动已经无法跟上行业的发展态势,人类的智慧应该更多应用于决断与选择层次,而让数据分析成为人类的一种辅助工具,可以帮助决策者更明确做出预期判断与预测,这也是促使 Python 语言快速走红的原因。
2) 数据分析的目的
从上面介绍可以看出,数据分析并不是一个新兴的概念,只是伴随着时代的发展,或者更准确的讲是互联网的浪潮的发展,推动它逐渐演化成了一个行业,行业的从业人员称为“数据分析师”,从业者的主要职责就是不断从杂乱无章的的数据挖掘出存在价值的有效信息,再通过所研究它们并找出内在规律,这些信息的最终的目的是辅助人们做出决策,管理科学上有一个专业名词就是“不断寻找最优解”的过程。在实际应用中,数据分析可帮助人们做出判断,以便采取适当行动。数据分析是有组织有目的地收集数据、分析数据,使之成为信息的过程。例如设计人员在开始一个新的设计以前,要通过广泛的设计调查,分析所得数据以判定设计方向。
图2:数据分析
3) 数据分析的定义
综上所述我们给出数据分析的定义:数据分析指用适当的统计、分析方法对收集来的大量数据进行分析,将它们加以汇总和理解并消化,以求最大化地开发数据的功能,发挥数据的作用。数据分析是为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。
2. 数据分析的应用
在上面我们简单的介绍了一下数据分析的应用,下面我们讲一个小案例,你就能体会到数据分析无处不在,以及它的作用。
1) 啤酒与尿布的故事
“啤酒与尿布”的故事产生于 20 世纪 90 年代的美国沃尔玛超市中,沃尔玛的超市管理人员分析销售数据时发现了一个令人难于理解的现象:在某些特定的情况下,“啤酒”与“尿布”两件看上去毫无关系的商品会经常出现在同一个购物篮中,这种独特的销售现象引起了管理人员的注意,经过后续调查发现,这种现象出现在年轻的父亲身上,他们在购买尿布的同时,往往会顺便买啤酒犒劳自己,这就是上述情况出现的原因。
沃尔玛发现了这一独特的现象,开始尝试将啤酒与尿布摆放在相同的区域的促销手段,从而提高了这两件商品销售收入,这就是“啤酒与尿布” 故事的由来。在这个案例中可以发现,通过研究顾客的购物习惯,发现了购物人群对商品的需求性,商家发现后做出相应的调整策略,从而实现了增加利润的目的,两个毫无关联的商品通过数据分析的手段,挖掘出来了潜藏的商机,这是精准营销典型案例。
2) 股票走势预测
一入股市深似海,玩过股票的朋友对此深有体会,股票的走势预测也是通过数据分析的手段完成的,通过预测结果提供给持股人参考意见。这里的预测结果并不是无中生有,亦或是是空穴来风,而是经过准确的数据分析之后得出的结论。现在市面上各种股票分析软件很多,它们就是通过对某支股票之前涨跌数据经过分析后,给出合理的意见,有最近一年的、最近一周的、最近三天的,数据分析的越多得出结论越趋于合理。当然股票行情由于存在的影响因素居多,比如企业并购、管理层更换、国家政策等等,所以股票的数据分析最终只能是一种参考而已,最终的决定权还在持股人手里,但是这种对于股
数据分析步骤
个人理解的数据分析6大步骤:
第一步:明确数据分析的目的,弄清楚需要做什么
第二步:梳理和确定分析逻辑,确定怎么进行分析
第三步:分析所用数据的收集、处理等,确定数据分析的数据
第四步:采用统计、数据挖掘等技术,提取有用信息
第五步:采用文字、表格、可视化图形来展示数据
第六步:得出数据分析的结论,发现业务价值,撰写分析报告
1.数据分解(问题剖析)
案例:化妆品销量提升
关键点(知识点):针对数据分析并不只是简单的数据处理分析,也需要了解真实的业务流程;
目标: 确定问题——销量提升,了解业务并将问题/需求进行分解。
了解业务: 进行询问,确定目标受众,了解客户的目标期望值;估算是否合理以及大致改善方向(以现有历史数据和客户的描述--主要受众是少女人群,近期的营销方式有广告和社会网络推广)
提出建议: 通过进行数据的比对与分析,进行数据解读——降价并不能带来销量的提升;由于中间过程中广告费与社会推广的费用比例调整;因此进行猜测尝试--更改销售方式。
跟踪效果,不断修正: 通过外部得知客户的产品在市场上是占有率很高而且好评如潮,因此对于广告推广已经足够完美,可能提高广告费用来促进产品销量并不能带来可观的效果;因此需要进行对原始数据信息进行重新评估;主要问题心智模式在作祟(你对外界的假设和你确信的观点就是你的心智模式),你在得到客户的信息后并没有进行验证分析,认为客户的认知与心智模式就是正确的市场现状。
由于外部现状发生改变需要针对其进行重新分析,跟踪产品的真实用户;发现潜在用户,进行销售计划的重新制定,并跟踪方案效果。
总结: 对于以后的数据分析过程中,需要调整自己的心智模式,尽量用辩证的态度去看待问题,对于数据与信息,在有条件的情况下需要进行验证。
2.对照试验(用事实说话)
案例: 咖啡业寒冬
关键点:什么样的数据能够成为你说服别人的可靠依据,如何进行合理的对照实验
目标:经济形势不好,找出咖啡销量下降的真正原因
提出建议:研究总体调研数据,发现客户对于咖啡价值评分有降低;而且存在区域因素影响;如何通过对比实现避免混杂因素对于实验结果的影响,需要通过地域划分,去除地域选址对于研究的影响,其次需要控制变量(减价/价值游说)和对照组来说明方案/计划的可行性/效果;
效果追踪: 超出前期的预估,通过时间轴的销量趋势线可以看出:产生销量提升的真实原因并不是减价促销,而是价值游说使得客户重返咖啡店。
总结: 对于方案计划/建议的实施过程中,需要尽可能的剔除混杂因素对于实验结果的影响,通过控制变量的方法,研究实验组与对照组的效果差异进行评判。当然这种情况是可以进行实验,而并非抉择性方案需要直接做出选择,现实生活中还是需要依照现状灵活应用。