责任编辑的主要内容是为大家科学普及统计数据挖掘的概念和方式,译者用明晰的“是甚么,为甚么,怎么做”路子,为听众提供了两个又两个的方式论,为统计数据挖掘阿宝们带来了紧凑型的一流科学知识。
有老师问:张老师,每天被复试都被问“你采用过甚么样统计数据挖掘的方式”。结果都觉得答不上去。究竟统计数据挖掘有甚么方式?咋我在做统计数据挖掘,却觉得没甚么方式?今天系统答疑一下。
首先,并不是英文名字带“预估”俩字的,是统计数据挖掘方式。有很多XX预估,是语言学、软件工程、微积分的专精辅助工具,并不直接对准销售业务难题的标准答案。当现代人在问:”有甚么预估方式”的时候,更多期许听到两个能得出推论的方式。
所以想回答好这个难题,要回到:统计数据挖掘究竟化解甚么样销售业务难题上去。
从销售业务商业用途上看,统计数据挖掘能化解5大类难题
是啥(统计数据叙述情况)是甚么(践行统计数据标准)为甚么(积极探索难题原因)会什么样(预估销售业务走势)又如何(综合判断情况)紧紧围绕每一难题情景,有某一的方式女团(如下表所示图)
电视广告一、化解“是啥”的方式
用统计数据叙述情况,须要创建健全的统计数据分项体系。创建统计数据分项体系,则须要剖析清楚统计数据分项之间的认识论。统计数据分项间有三种基本上的认识论:以太网认识论和博戈达认识论,因此派生出三种基本上的预估方式:棒状预估法&分项回收法。
回收的销售业务多了,现代人发现,某些统计数据分项能一般来说的女团采用,比如说:
使用者营运情景:AARRR分项、RFM分项零售业店面场景:人、货、场分项商品管理情景:进、销、存分项这些也习惯性被称为:预估模型。但注意,这些都只是在展示统计数据。统计数据+判断标准,才有预估推论。有关判断标准的预估,是:是甚么类难题。
二、化解“是甚么”难题的方式
判断标准能很简单,比如说领导的指令、KPI要求、过往同期统计数据,都能作为标准。这些统称为:简单标准。但很多时候,分项走势是否正常,并无明确的KPI约束,甚至KPI达标,但是走势奇特,领导们还是会觉得有难题。这时候就须要找其他参照物。因此派生出一系列预估方式。
比如说:
与销售业务自身规律比较,判断好坏:生命周期法、自然周期法与同类型,同期发展的销售业务比较:同期群预估法与其他销售业务个体进行比较:分层预估法这样对比,即使只有1个统计数据分项,也能得出好坏判断。如果销售业务发展违背过往规律,明显比其他个体更差,则能判定为:不好。
电视广告当然,也能采用2个分项,比如说经典的矩阵预估法,通过两分项交叉+两分项平均值,分出四类销售业务,从而得出好坏判断。
如果用更多分项也行,比如说常用的Kmean聚类,能先利用多个分项对销售业务个体聚类,之后再看各类型之间表现优劣。
以上这些方式,都能将销售业务的好/坏区分出来,从而在一定程度上辅助判断。
三、化解“为甚么”难题的方式
“预估下这个难题是甚么原因导致的……”是常见的要求,这是“为甚么”难题。化解为甚么难题,有两大基本上路子:
1. 结果推断常见的,比如说:
结构预估法:通过结构预估,找到难题发生点标签预估法:通过打标签,做个体对比,找到难题原因相关预估法:通过计算分项相关关系,找到相关分项,再形成假设MECE法:讲多个销售业务假设,按MECE原则合并成微积分认识论,一一验证结果推断,意为难题发生后,用各种统计数据寻找差异,创建假设。能把销售业务口中“我觉得这是XX原因”,抽象成两个统计数据可验证的假设,因此适用范围非常广。但结果推断只是单方面从结果做归纳,有可能有偏颇,还须要实验验证。
2. 实验推断这些方式更接近传统语言学的实验,大部分都要求:
开展统计数据实验,验证假设设参照组/实验组,且参照组/实验组特征相似区分控制变量、环境变量,重点测控制变量的影响先有假设,然后通过实验/分组对比,验证假设。常见的方式,包括ABtest、DID、PSM、RDD、Uplift等方式。实验推断有语言学依据,计算过程复杂,看起来更量化一些。但是对实验条件要求太高,比如说大促销类ALL in的销售业务,比如说商品、店铺这些无法控制环境的销售业务情景,比如说销售业务员行为、内容传播等难采集统计数据的领域,都很难用。
理想的状态,肯定是两者结合,事实-假设-验证,不断循环,接近真相。但现实中有很多条件制约。导致我们只能从两个角度切入,慢慢靠近真相。
四、化解“会什么样”难题的方式
预估类难题,是所有人都感兴趣的话题,也是语言学/算法最有可能发挥作用的地方。唯一限制方式采用的,是:究竟有啥统计数据&业务人员要不要参与。
如果销售业务人员坚持参与预估过程,就只能用销售业务假设法或者滚动预估法,这些方式把影响结果的参数都列出来,方便销售业务人员拍脑袋,也能帮他们明晰:我要做啥。
如果销售业务人员不参与,则视统计数据量的啥。统计数据少,则采用时间序列预估,统计数据多,且有影响结果的原因统计数据,则能用诸如回归模型一类算法预估。
五、化解“又如何”难题的方式
综合评估与分配难题,统称“又如何”难题。这是决策的最后一步,决定是否对销售业务做动作,做多大动作。有些简单的评估是很容易的,比如说销售签了生死状,达不成业绩目标就炒鱿鱼。
但大部分情况,评估很复杂,要考虑方方面面。这里最大的区别,在于要不要考虑领导的主观意见。如果要,果断采用主观评分法!满足领导的打分欲是第一位的。如果不要,再考虑采用有监督的机器学习算法,或者因子预估法,DEA法(求的是相对效率)等客观方式。
至于:做啥,谁来做。是更复杂的难题了。想做好分配,得先把前边几步预估做完,对每一销售业务线基础能力有充分认识,才好下判断。这里,线性规划的方式,能用来做支持。
六、为甚么觉得没用上方式?
综上可见,统计数据挖掘的方式是非常多的。但为甚么很多老师觉得自己没用上方式呢?因为每种方式是和销售业务情景、领导风格、统计数据质量、息息相关的。
比如说因果推断算法大多基于分组测试展开,而实际销售业务中,很多因果预估是事后再查原因,也不给二次实验的机会。
比如说很多公司的分配方案,根本是领导拍脑袋,一言堂,根本没机会让预估师用算法。
比如说预估难题,很多公司根本没有足够统计数据积累,只有一条销售统计数据,那撑死了也只能用时间序列法。
这种理想与现实的差距,让很多老师很痛苦。一方面不清楚究竟这些方式该如何用,另一方面不了解,自己该如何应对销售业务需求。复试和工作都很吃力。
专栏作家
据相关经验。
责任编辑原创发布于人人都是产品经理。未经许可,禁止转载。
题图来自Unsplash,基于CC0协议。
该文观点仅代表译者本人,人人都是产品经理平台仅提供信息存储空间服务。