数据分析没思路,这些数据分析方法掌握了么?

2023-06-01 0 504

为了更快的认知使用者,洞悉使用者的市场需求,统计数据挖掘就能较好的协助解决那个市场需求。但是在统计数据挖掘时,没有路子该咋办呢?为此,责任编辑从总体思索架构5W2H、叙述难题现况对照预测等八个方面做了预测,希望对你有所协助。

数据分析没思路,这些数据分析方法掌握了么?

对商品副经理来说,商品的每一次插值和升级换代,都需要评估结果效用,以期未来改良。如果实际上是凭借着裸眼检视和直觉体会,下两个“使用者意见反馈较好”、“使用者很喜欢那个新功能”类似于的推论,是很不合时宜的。更多时候,会因为直觉感觉而产生错判,另外,统计数据挖掘还可以协助商品副经理更快地了解使用者,洞悉使用者的市场需求。

而对营运来说,作为与使用者和商品碰触最频密的人,也是策略的决策者和卵蛤属,但商品营运的好与坏,最简单的充分体现就是统计数据,

所以,不论是商品还是营运,在统计数据驱动力业务的大大背景下,统计数据挖掘都是必须要掌控的几项专业技能,责任编辑如是说了7种常见的统计数据挖掘方式,如是说了两个完备的统计数据挖掘过程中可能加进的系列产品方式:

从区分难题→确诊现况→定位难题各个环节→上溯问题原因→判断难题行业发展趋势。

一、总体思索架构:5W2H

著名农学家张伯苓先生曾写过一首歌wlzwyyan:

我有两位好朋友,曾把家家辅导我,

你若要问其联系电话,

英文名字不同都姓何,

之事所踪云云生时Pudukkottai,

好像弟弟和弟弟,

还有两个中西派,

联系电话倒转叫欧几里得,

若向七贤常求教,

即使笨人不会错。

这首wlzwyyan讲的就是5W2H:What(之事) When(何时) Where(何地) Who(云云) Why(所踪) How(Pudukkottai) How much(何几),5W2H是对目标计划进行分解和决策的思维架构,它对要解决的难题进行完备的刻画,以期清晰地区分难题并找到解决方案。

数据分析没思路,这些数据分析方法掌握了么?What:之事?发生了什么?一般用来指的是难题是什么?是否真的发生了?比如DAU真的下降了吗?;When:何时?在什么时候发生的?难题发生的时间,比如DAU下降了,下降的具体时间是什么?是不是节假日等等;Where:何地?在哪里发生的?难题发生的拆解其中两个各个环节, DAU下降了, 是哪两个的地区的下降了,哪个终端的使用者下降了?还是哪两个功能的使用的人下降了等等;Who:云云?比如DAU下降了, 是哪一部分的使用者群体在降, 是什么年龄、 性别、活跃度的使用者等等;Why:所踪?为什么会这样?难题发生的原因猜想, 比如android使用者的DAU降低了, 其他终端的DAU没有降低, 是不是android新发版本存在bug;How:Pudukkottai?明确上面的难题后, 我们要采取什么样的方式和策略去解决DAU下降的难题;How Much:何几?做到什么程度?DAU下降了以后, 我们对应策略的成本是多少, 以及我们要把那个难题解决到什么程度才可以;

5W2H预测方式从难题出发,有一套科学完备的预测路子,对造成难题的原因进行推测,并提出相应的解决方案,最终解决难题,形成闭环。

当然,5W2H只是一种思维方式,在实际应用过程当中可能还会遇到各种各样的业务场景,针对不同的业务场景,总体的路子是一样的, 但预测的维度就需要根据不同的商品形态和业务特性来调整。

二、叙述难题现况:对照预测

通过5W2H已经有了总体的思维架构,形成了大致的预测路子,接下来就要针对难题进行具体预测,首先从难题现况入手。

没有对照,就没有优化提升的方向。在统计数据挖掘中,没有对照,就没有推论。

比如,小虎某次期末考试的成绩不好,数学只得了 40 分。

小虎的妈妈对他说:“你上次考试数学考了 70 分,这次怎么就考得这么差?你看你的同班同学,这次都考 80 分以上。我之前跟你说考90分给你买奥特曼,这下别想了……”

常见的对照思维有以下 5 种:

跟目标对照:本月目标销售额500w,实际完成了300w,目标达成率60%;跟上个月比:上个月销售额200w,环比增长50%;跟去年同比:去年同期销售额400w,同比下降25%;分渠道对照:线上/线下渠道销售分别200w、100w;跟同类竞对照:同水平竞对A、B、C本月销售额分别为600w、500w、100w;

总结一下上面的对照思维,主要是横向和纵向对照:

数据分析没思路,这些数据分析方法掌握了么?

横向对照:同一时期,外部和竞对照,内部各渠道对照

同一时期和外部竞对对照,总体市场表现以及所占市场份额变化;同一时期自己内部各渠道对照,看销售额贡献和贡献占比变化;

纵向对照:自身不同时期对照

和上一期统计数据对照,近期有无提升/后退;和去年同期对照,季节周期性考量下对照,是否有提升/后退;

统计数据挖掘的过程,就是在明确目标之后,通过对照等思维,找到难题的原因,得出预测的推论,提出可行的建议,从而起到协助决策和辅导行动的作用。

三、定位难题各个环节:漏斗预测

已经通过横向、纵向对照大致了解了业务的现况,知道业务是在变好/变坏,以及变好/变坏的程度,如果业务在持续变坏,我们就需要通过漏斗预测来定位难题到底出现在哪个各个环节上。

漏斗模型,本质是分解和量化,这里以电商购物漏斗模型举例。

数据分析没思路,这些数据分析方法掌握了么?

也就是把购物的整个流程拆解成从选购商品到最终转化成购买的一个个子各个环节,用相邻各个环节的转化率/流失率来量化每两个各个环节的表现。所以整个漏斗模型就是先将整个购买流程拆分成两个个步骤,然后用转化率/流失率来衡量每两个步骤的表现,最后通过异常的统计数据指标找出有难题的各个环节,从而解决难题,优化该步骤,最终达到提升总体购买转化率的目的,总体漏斗模型的核心思想其实可以归为分解和量化。

漏斗预测其实是一种业务流程拆解和量化的路子,任何业务流程都可以按照那个路子来拆解,常见的业务漏斗模型还有很多:消费者行为AIDMA漏斗、使用者生命周期的AARRR等。

数据分析没思路,这些数据分析方法掌握了么?数据分析没思路,这些数据分析方法掌握了么?

四、细分预测原因:细分拆解

通过漏斗预测我们大致可以定位到难题出现在哪个各个环节,但是,到底是什么那个各个环节的哪个部分出了难题,我们还需要进一步细分拆解定位难题症结所在。

在统计数据挖掘中,细分是统计数据挖掘的灵魂,没有细分拆解,就没有统计数据挖掘。

小虎期中考试的总成绩不好,细分一看,发现其他科目的成绩都不错,只有数学成绩特别差,只得了 40 分,而且三角函数一题都没有做对。

常见的细分方式有以下 5 种:例如本季度的销售额没有达标,可以按照以下路子进行细分:

按时间细分:哪个时间段的销售额出了难题?按空间细分:哪个区域的销售额出了难题?按过程细分:售前导购、购买体验还是售后服务的哪个过程出了难题?按公式细分:GMV=流量*转化率*客单价,流量、转化率和客单价的哪个部分出了难题?按模型细分:使用者价值分层模型,不同价值的使用者的销售额贡献,是哪类使用者出了难题?

拆解的方式千千万,在运用细分拆解思维的过程中,要做到有的放矢,围绕统计数据挖掘的目标,找到合适的拆解方式,否则只能无头苍蝇一样到处乱撞。

另外,当发现统计数据异常时,尝试从不同的维度进行细分,这样既能锻炼统计数据挖掘思维,又能加深对业务的认知。

数据分析没思路,这些数据分析方法掌握了么?

五、寻找相关因素:相关性预测

如果两个变量改变的时候,另两个变量也朝着相同的方向发生变化,那么我们就说这两个变量之间存在相关性。

预测一家商场的商品销量统计数据发现,尿布和啤酒的销量会出现大致相同的变化趋势,啤酒和尿布有什么关联呢?采访小虎的爸爸,他说自己下班后,给小虎的弟弟买尿布的同时,也会购买自己喜欢喝的啤酒。

相关性预测,就是寻找变量之间相互关联的程度,相关性一般通过相关系数衡量。最常见的是用于计算线性相关系数的Pearson相关系数,取值区间在1到-1之间。1表示两个变量完全线性相关,-1表示两个变量完全负相关,0表示两个变量不相关。统计数据越趋近于0表示相关关系越弱。

数据分析没思路,这些数据分析方法掌握了么?

用Excel进行简单的相关预测,通常包括以下 3 个步骤:

需要注意的是,相关性不等于因果性。两个变量之间相关性,并不代表其中两个变量的改变,是由另两个变量的变化导致的。

比如说,预测发现,国家的诺贝尔奖数量,与巧克力消费量之间呈现正相关关系,但这并不是说,多吃巧克力有助于获得更多的诺贝尔奖。一种合理的解释是,诺贝尔奖的数量与巧克力的消费量,很可能都是由其他变量导致的,例如国民的受教育程度和富裕程度。

六、溯源影响因素:归因预测

实际业务中,很多难题的出现并非是单个因素造成的,而是经过多种因素的影响而共同造成的。

所以统计数据挖掘最头秃的难题就是:导致难题的原因到底是什么?归因预测(Attribution Analysis)要解决的难题就是多因素影响的情况下,最终效用的提升/下降,应该如何合理地分配给过程中的各个因素。

小虎在手机上看到了朋友圈广告发布了最新的iPhone,午休的时候刷抖音看到了有网红在测评这款手机,下班在地铁上刷朋友圈的时候发现已经有小伙伴收到手机在晒图了,于是喝了一杯江小白壮壮胆回家跟老婆申请经费,最后老婆批准了让他去京东买,有保障。那么请问,朋友圈广告、抖音、好友朋友圈、京东各个渠道对这次成交分别贡献了多少价值?

现实情况往往是很复杂的,在衡量其贡献价值时,只依靠单渠道归因预测得到的结果是不科学的,需要引入多渠道归因预测。常见的多渠道归因预测模型如下:

末次归因模型:将功劳100%分配给成交前的最后两个各个环节首次归因模型:将功劳100%分配给第两个各个环节线性归因模型:将功劳平均分配给过程中的每个各个环节时间衰减归因模型:距离最终结果时间越短的各个环节,可以获得越多的权重位置归因模型:第一次和最后一次各个环节各贡献40%,中间的所有各个环节平分剩下的20%贡献自定义模型:根据自身业务的市场需求,自定义各各个环节分配比例数据分析没思路,这些数据分析方法掌握了么?

没有完美的归因预测模型,任何模型都存在它的局限性和不足,如何有效地结合使用场景和模型特点是用好归因模型的前提。

七、预测变化趋势:预测预测

了解完难题的现况,定位到难题的原因后,我们还需要预测难题接下来的行业发展趋势。

另一方面,在各行业各领域,只要有核心的业务指标,都要预测核心业绩未来的走势,销售,市场营销,营运,财务等,一方面可以对未来的行业发展趋势有个大致的掌控,另一方面也可以提前规划,设定各子部门的KPI,以期尽可能地完成或者超过KPI,所以,如何准确地预测核心指标的变化趋势非常重要。

什么是预测?用最简单的术语来说,它是在预测过去和现在的统计数据,进而预测未来的过程。我们主要根据时间序列统计数据进行定量预测。我们通过两个案例说明时间序列统计数据的主要组成。

如下是各年搭乘飞机飞行乘客数量的趋势。

趋势性:趋势是事物发展或变化的总体方向。在上面的例子中,我们看到时间序列呈增长趋势,这意味着在搭乘飞机飞行的乘客数量总体趋势上是在增加。如下图中第一张图所示。季节性:在上述时间序列中可以看到的另两个清晰的模式,就是该变化趋势以固定的时间周期重复,我们称为季节性。在特定时间周期内重复出现或重复的时间序列中任何可预测的变化模式都可以说是季节性。下图中第二张图所示。随机性:去除趋势性和季节性后,剩下的就是一些随机的、无任何规律的白噪声。下图中第三张图所示。数据分析没思路,这些数据分析方法掌握了么?

时间序列预测的模型有很多,主要归为以下2类:

(1)传统预测方式

AR(Auto Regressive Model)自回归模型MA(Moving Average Model)移动平均模型ARMA(Auto Regressive and Moving Average Model)自回归移动平均模型ARIMA(Auto Regressive Integrate Moving Average Model)差分自回归移动平均模型等

(2)现代预测方式

基于机器学习方式、深度学习的预测方式。对机器学习方式,xgboost,随机森林及SVM这些都是可以用的,也没有说哪个模型好用,需要看具体的场景及实验,总之就是看效用说话。

(3)用Excel也能做预测

黑猫白猫,能抓住老鼠的就是好猫,不需要复杂的算法和模型,用Excel也能做简单的预测。

数据分析没思路,这些数据分析方法掌握了么?

以上就是产品、营运工作中7种常见的统计数据挖掘方式的内容。

责任编辑由@统计数据挖掘星球 原创发布于人人都是商品副经理,未经许可,禁止转载。

题图来自 Unsplash,基于CC0协议

该文观点仅代表作者本人,人人都是商品副经理平台仅提供信息存储空间服务。

相关文章

发表评论
暂无评论
官方客服团队

为您解决烦忧 - 24小时在线 专业服务