创创编者按
提出诉讼统计数据挖掘,大家经常会TNUMBERA51到一些布满的位数表单,或者高阶的统计数据可视化表现手法,再或者绚丽的统计数据报表。只不过,“ 预测 ”本身是每个人都具有的能力;比如依照股票的走势决定买回却是放出,依每星期的时间和过往经验优先选择行驶走线;买回飞机票、预约饭店时,对照数家的价格后作出最终优先选择。
那些较大型重大决策,只不过都是依他们脑子里的统计数据点作出判断,这就是简单预测的操作过程。对销售业务重大制定者而言,则需要掌控两套系统的、科学的、合乎商业性规律的统计数据挖掘科学知识。
1.统计数据挖掘的Haveri
不论是商品、市场、营运却是运营者,你必须深思:统计数据其本质的价值,究竟在哪里?从那些统计数据中,你和你的项目组都能学习到什么?
1.1 统计数据挖掘的最终目标
对民营企业来说,统计数据挖掘的能远距民营企业强化业务流程,提高效率率,提高销售额,经常他们把此类统计数据挖掘表述为商业性统计数据挖掘。商业性统计数据挖掘的最终目标是利用大统计数据为所有婚恋人员作出敏捷、SE9、高效率的重大决策,提供更多可品牌化的软件系统。商业性统计数据挖掘的其本质在于缔造商业性价值 ,驱动力民营企业销售业务快速增长。
1.2 统计数据挖掘的作用
他们经常讲的民营企业快速增长模式中,经常以某一销售业务网络平台为核心。这其中,统计数据和统计数据挖掘,是必不可少的各个环节。
透过民营企业或者网络平台为最终目标用户群提供更多商品或服务项目,而使用者在使用商品或服务项目操作过程中产生的可视化、交易,都能作为统计数据采集下来。依照那些统计数据洞悉,透过预测的手段Wasselonne顾客的市场需求,缔造更多合乎市场需求的产品服务商品和服务项目,重新投入使用者的使用,从而形成形成一个完整的销售业务闭环。这样的完整销售业务逻辑,能真正意义上驱动力销售业务的快速增长。
1.3 统计数据挖掘进化论
他们经常以商业性回报比来定位统计数据挖掘的不同阶段,因此他们将其分为四个阶段。
阶段1:观察统计数据当前发生了什么?
首先,基本的统计数据展示,能告诉他们发生了什么。例如,公司上周投放了新的搜索引擎A的广告,想要对照一周下来,新渠道A比现有渠道B情况如何,A、B各自带来了多少流量,转化效果如何? 又比如,新上线的商品有多少使用者喜欢,新注册流中注册的人数有多少。那些都需要透过统计数据来展示结果,都是基于统计数据本身提供更多的“发生了什么”。
阶段2:理解为什么发生?
如果看到了渠道A为什么比渠道B带来更多的流量,这时候他们就要结合商提供更多更多商业性价值上的体现。
阶段3:预测未来会发生什么?
而当他们理解了渠道A、B带来流量的高低,就依照过往的科学知识预测未来会发生什么。在投放渠道C、D的时候,猜测渠道C比渠道D好,当上线新的注册流、新的优化,能知道哪一个节点比较容易出问题;他们也能透过统计数据挖掘的手段,自动预测判断C和D渠道之间的差异,这就是统计数据挖掘的第三个进阶,预测未来会发生的结果。
阶段4:商业性重大决策
所有工作中最有意义的却是商业性重大决策,透过统计数据来判断应该做什么。而商业性统计数据挖掘的目的,就是商业性结果。当统计数据挖掘的产出能直接转化为重大决策,或直接利用统计数据作出重大决策,那么这才能直接体现出统计数据挖掘的价值。
1.4 统计数据挖掘的 EOI 框架
EOI 的架构是包括 LinkedIn、Google 在内的很多公司表述预测型项目的最终目标的基本方式,也是运营者在思考商业性统计数据挖掘项目中一种基本的、必不可少的手段。
其中,他们先会把公司销售业务项目分为三类:核心任务,战略任务,风险任务。以谷歌为例,谷歌的核心任务是搜索、SEM、广告,这是已经被证明的商业性模型,并已经持续从中获得很多利润。谷歌的战略性任务(在2010年左右)是安卓网络平台,为了避免苹果或其他厂商占领,所以要花时间、花精力去做,但商业性模式未必成型。风险任务对创新来说是十分重要的,比如谷歌眼镜、自动驾驶汽车等等。
统计数据挖掘项目对这三类任务的最终目标也不同,对核心任务来说,统计数据挖掘是助力(E),帮助公司更好的盈利,提高盈利效率; 对战略任务来说是强化(O),如何能够远距战略型任务找到方向和盈利点;对风险任务,则是共同创业(I),努力验证创新项目的重要性 。运营者需要对公司销售业务及发展趋势有着清晰的认识,合理分配统计数据挖掘资源、制定统计数据挖掘最终目标方向。
2. 统计数据挖掘的 3 大思路
而面对海量的统计数据,很多人都不知道从如何准备、如何开展,如何得出结论。下面为大家介绍做统计数据挖掘时的 3 个经典的思路,希望在统计数据挖掘的实际应用中能给大家带来帮助。
2.1 统计数据挖掘的基本步骤
上面他们提到了统计数据挖掘与商业性结果之间关联的重要性,所有商业性统计数据挖掘都应该以销售业务场景为起始思考点,以销售业务重大决策作为终点。统计数据挖掘该先做什么、后做什么?基于此,他们提出了商业性统计数据挖掘业务流程的五个基本步骤。
第一步,要先挖掘销售业务含义,理解统计数据挖掘的背景、前提以及想要关联的销售业务场景结果是什么。
第二步,需要制定预测计划,如何对场景拆分,如何推断。
第三步,从预测计划中拆分出需要的统计数据,真正落地预测本身。
第四步,从统计数据结果中,判断提炼出商务洞悉。
第五步,依照统计数据结果洞悉,最终产出商业性重大决策。
举个例子:
某国内互联网金融理财类网站,市场部在百度和 hao123 上都
在这种多渠道的投放场景下,如何进行广度重大决策? 他们按照上面商业性数据预测业务流程的五个基本步骤来拆解一下这个问题。
第一步:挖掘销售业务含义。
首先要了解市场部想强化什么,并以此为北极星指标去衡量。对渠道效果评估,重要的是销售业务转化:对 P2P 类网站来说,是否发起 “投资理财” 要远重要于 “访问使用者数量” 。所以不论是神马移动搜索却是金山渠道,重点在于如何透过统计数据手段衡量转化效果;也能进一步依照转化效果,强化不同渠道的营运策略。
第二步,制定预测计划。
以 “投资理财”
第三步,拆分查询统计数据。
既然预测计划中需要对照渠道流量,那么他们需要各个渠道追踪流量、落地页停留时间、落地页跳出率、网站访问广度以及订单等类型统计数据,进行深入的预测和落地。
第四步,提炼销售业务洞悉。
依照统计数据结果,对照神马移动搜索和金山网络联盟投放后的效果,依照流量和转化两个核心KPI,观察结果并推测销售业务含义。如果神马移动搜索效果不好,能思考是否商品适合移动端的顾客群体;或者仔细观察落地页表现是否有能强化的内容等,需找出销售业务洞悉。
第五步,产出商业性重大决策。
依照数据洞悉,指引渠道的重大决策制定。比如停止神马渠道的投放,继续跟进金山网络联盟进行评估;或强化移动端落地页,更改使用者营运策略等等。
以上那些都是商务统计数据挖掘拆解和完成推论的基本步骤。在接下来的内容中,他们都会有这个预测思路。
2.2 内外因素分解法
在统计数据挖掘的操作过程中,会有很多因素影响到他们的北极星指标,那么如何找到那些因素呢?在此向大家推荐内外因素分解法。内外因素分解法是把问题拆成四部分,包括内部因素、外部因素、可控和不可控,然后再一步步解决每一个问题。
举个例子:
某社交招聘类网站,分为求职者端和民营企业端。其盈利模式一般是向民营企业端收费,其中一个收费方式是买回职位的广告位。销售业务人员发现, “发布职位” 的数量在过去的 6 月中有缓慢下降的趋势。对此类某一统计数据指标下降的问题,能怎么预测呢?
依照内外因素分解法,他们能从四个角度依次去预测可能的影响因素。
内部可控因素:商品近期上线更新、市场投放渠道变化、产品粘性、新老使用者留存问题、核心最终目标的转化。
外部可控因素:市场竞争对手近期行为、使用者使用习惯的变化、招聘市场需求随时间的变化。
内部不可控因素:商品策略(移动端/PC端)、公司整体战略、公司顾客群定位(比如只做医疗行业招聘)。
外部不可控因素:互联网招聘行业趋势、整体经济形势、季节性变化。
有了内外因素分解法,他们就能较为全面地预测统计数据指标,避免可能遗失的影响因素并且对症下药。
2.3 DOSS 思路
DOSS 思路是从一个具体问题拆分到整体影响,从单一的软件系统找到一个品牌化软件系统的方式。快速品牌化有效的快速增长软件系统,DOSS 是一个有效的途径。
举个例子:
某在线教育网络平台提供更多免费课程视频,同时售卖付费会员,为付费会员提供更多更多高阶课程内容。如果我想将两套计算机技术的付费课程,推送给一群持续在看 C++ 免费课程的使用者,那么统计数据挖掘应该如何支持呢?
他们按 DOSS 思路的四个步骤,分解如下:
具体问题:预测是否有可能帮助某一群组顾客买回课程。
整体影响:
单一回答:针对该群使用者进行可视化,监控该模型对最终转化的影响。
品牌化方案:之后推出品牌化的软件系统,对合乎某种行为轨迹和特征的行为进行可视化,商品化课程推荐模型。
3. 统计数据挖掘的 8 种方法
上面介绍了 3 个经典预测思路,它们能帮你搭建一个清晰的统计数据挖掘思路框架。那么对具体的销售业务场景问题,他们又该怎么办呢?
他们以一个电子商务网站为例,用统计数据挖掘商品 GrowingIO 对该网站进行快速地统计数据采集、清晰和可视化展示,然后给大家分享这 8 种常见的统计数据挖掘方法。
3.1 位数和趋势
看位数、看趋势是最基础展示统计数据信息的方式。在统计数据挖掘中,他们能透过直观的位数或趋势图表,迅速了解例如市场的走势、订单的数量、业绩完成的情况等等,从而直观的吸收统计数据信息,有助于重大决策的准确性和实时性。
对电子商务网站,流量是非常重要的指标。上图中,他们将网站的访问使用者量(UV)和页面浏览量(PV)等指标汇汇聚到统一的统计数据看板(Dashboard),并且实时更新。这样的一个统计数据看板,核心位数和趋势一目了然,对他们来说一目了然。
3.2 维度分解
据洞悉。在优先选择维度时,需要仔细思考其对预测结果的影响。
3.3 使用者分群
针对合乎某种特定行为或背景信息的使用者,进行归类处理,是他们经常讲到的使用者分群(segmentation )的手段。他们也能透过提炼某一群使用者的特定信息,创建该群体使用者的画像。 例如访问购物网站、寄送地址在北京的使用者,能被归类为“北京”使用者群体。而针对“北京”使用者群体,他们能进一步观察他们买回商品的频度、类别、时间,这样他们就创建出该使用者群体的画像。
在统计数据挖掘中,他们经常针对特定行为、特定背景的使用者进行有针对性的使用者营运和商品强化,效果会更加明显。上图中,他们透过 GrowingIO 的使用者分群功能将一次促销活动中支付失败的使用者挑选出来,然后推送相应的优惠券。这样精准的营销推广,能大幅度提高使用者支付的意愿和销售金额。
3.4 转化漏斗
绝大部分商业性变现的业务流程,都能归纳为漏斗。漏斗预测是他们最常见的统计数据挖掘手段之一,不论是注册转化漏斗,却是电商下单的漏斗。透过漏斗预测能从先到后还原使用者转化的路径,预测每一个转化节点的效率。
其中,我
第一,从开始到结尾,整体的转化效率是多少?
第二,每一步的转化率是多少?
第三,哪一步流失最多,原因在什么地方?流失的使用者合乎哪些特征?
上图中注册业务流程分为 3 个步骤,总体转化率为45.5%;也就是说有 1000 个使用者来到注册页面,其中 455 个成功完成了注册。但是他们不难发现第二步的转化率是 56.8% ,显著低于第一步 89.3% 和第三步转化率 89.7%,能推测第二步注册业务流程存在问题。显而易见第二步的提升空间是最大的,投入回报比肯定不低;如果要提高注册转化率,他们应该优先解决第二步。
3.5 行为轨迹
的抽象,例如,网站预测如果只看访问使用者量(UV)和页面访问量(PV)此类指标,断然是无法全面理解使用者如何使用你的商品。
,依照使用者使用习惯设计商品、投放内容。
上图中展示了一位使用者在某电商网站上的详细行为轨迹,从官网到落地页,再到商品详情页,最后又回到官网首页。网站买回转化率低,过往的销售业务统计数据无法告诉你具体的原因;透过分析上面的使用者行为轨迹,能发现一些商品和营运的问题(比如是不是商品不匹配等等),从而为重大决策提供更多依据。
3.6 留存预测
在 LinkedIn,快速增长项目组透过统计数据发现,如果新使用者进来后添加5个以上的联系人(上图红色线条),那么他/她在LinkedIn 上留存要远远高于那些没有添加联系人(上图绿色和紫色的线条)的留存。 这样,添加联系人称为 LinkedIn 留存新使用者的最核心手段之一。
留存预测场景。
3.7 A/B 测试
A/B 测试用来对比不同商品设计/算法对结果的影响。商品在上线操作过程中经常会使用 A/B 测试来测试不同商品或者功能设计的效果,市场和营运能透过 A/B 测试来完成不同渠道、内容、广告创意的效果评估。
举个例子,他们设计了两种不同的商品可视化形式,透过比较实验组(A 组)和对照组(B 组)的访问时长和页面浏览量两个衡量指标,来评估哪一种可视化形式更佳。
要进行A/B测试有两个必不可少因素:第一,有足够的时间进行测试;第二,统计数据量和统计数据密度较高。因为当商品流量不够大的时候,做 A/B 测试得到统计结果是很难的。而像 LinkedIn 这样大体量的公司,每天能同时进行上千个 A/B 测试。所以 A/B 测试经常在公司统计数据规模较大时使用会更加精准,更快得到统计的结果。
3.8.数学可视化
当一个商业性最终目标与多种行为、画像等信息有关联性时,他们通常会使用数学可视化、统计数据挖掘的手段进行可视化,预测该商业性结果的产生。
作为一家 SaaS 民营企业,当他们需要预测判断顾客的流失时,能透过使用者的行为统计数据、公司信息、使用者画像等统计数据建立流失模型。利用统计学的方式进行一些组合和权重计算,从而得知使用者满足哪些行为之后流失的可能性会更高。
他们经常说,不能度量,就无法快速增长,统计数据挖掘对民营企业商业性价值的提升有着至关重要的作用。当然,仅仅掌控单纯的理论还远远不够,实践出真知。统计数据挖掘的方法大家不妨在自己日常工作中,有预测相关项目里尝试使用,相信能事半功倍,缔造更多商业性价值。
长江创创是长江商学院旗下的【创业创新网络平台】,透过专业、聚焦、创新的【创业课程】和开放跨界的【社群服务项目】为创业者升级思维认知和管理框架,链接资本、产业、跨境资源,探索未来产业与商业性发展边界,共同塑造新商业性价值。