原副标题:统计数据分析、可视化ETL、大统计数据大mammalian……这才是民营企业须要的BI远距工具!
在没有利用BI(数据发掘)构筑完整的统计数据预测结构前,民营企业都是按照传统的方式来实现销售业务统计数据市场需求,是各职能部门将自己的市场需求提给信息技术职能部门去做。
自助式BI远距工具能解决这些问题。
我们能打声将民营企业涉及统计数据预测的群体分为两类:
1、统计数据图书馆员
该些群体掌握着统计资料库、统计此基础架构,对此基础统计数据拥有设计和可视化潜能。特别针对她们,BI能作为一个网络平台帮助相连各统计资料库、统计此基础架构。控管、资源整合、冲洗统计数据,为有预测市场需求的人准备统计数据,在预测过程中手动可视化。功能上务求努力做到——高效率高效能、稳定。
2、预测使用者
特别针对广度预测使用者,她们常常就有统计数据预测此基础和认知数学模型的潜能,对统计数据有再处理加工和广度预测发掘的市场需求。这时BI更多甘当加速可视化预测的远距工具,通过可视化远距统计数据预测时的思索。
特别针对最高级预测使用者,她们的市场需求常常是DashboardMadurai预测,结合可视化有主题的展现销售业务统计数据,动态监视,预警系统预测。这时的BI最好能有较高的上手准入门槛,能加速取数。
特别针对一些查阅统计数据的使用者,比如领导boss们,她们的政治理念是看调查报告,了解销售业务状况,远距销售业务重大决策。BI要努力做到调查报告可读耐用,让使用者著眼于认知中控台要抒发的统计数据涵义。
也正是如前所述以上的实际统计数据预测情景,FineBI5.0做了脱胎换骨的升级换代。著眼于两个各个环节,统计数据的递送和统计数据的预测。
统计数据的递送
如前所述统计信息安全和精巧的职权管理工作,让信息技术职能部门放心的把统计数据职权留用,销售业务职能部门能完整方便快捷的领到所需统计数据,这是自助式预测实行的基石。
统计数据的管理工作是妨碍民营企业统计数据预测实行的很大原因。信息技术职能部门担心风险,引致销售业务职能部门很简单的市场需求不能得到及时积极响应;许多统计数据的市场需求本身时效性极高,一旦过了这个统计数据再领到也已经没有价值了;还有部分是统计数据给的不完整,脏统计数据许多,引致销售业务想展开的预测努力做到一半展开不下去,逐渐舍弃…
统计数据的预测
最低成本的发现统计数据价值,也是FineBI5.0最核心解决的问题。
FineBI5.0能说是真正能够覆盖“个人统计数据预测”到“民营企业统计数据价值发掘”的统计数据预测网络平台。
新版本赋予了其4类特性:统计数据预测发掘、统计数据处理、大统计数据高效能、民营企业级统计数据控管。
—统计数据预测发掘—
1、更符合人类思维的探索预测——stepbystep
统计数据预测思索过程不可能是一步到位的,一定是预测——发现问题——修正的螺旋上升的过程。我们发现使用者在领到统计数据时,都先是尝试性的预测看一下统计数据的趋势,然后在逐渐一步一步地去深入预测。在这过程中,有可能许多思索是错误的,有些指标是须要再计算的。对于这些“探索性”的操作,FineBI提供增加,修改,删除历史操作功能,及时修正,每一个步骤都能预览统计数据。且提供无限层级的统计数据预测:使用者能对自己职权下的统计数据任意处理。
2、预测思维主导的可视化
5.0的可视化预测,采用全新的设计理念。如前所述著名的图形语法(TheGrammarOfGraphics)设计改良,提供了无限的视觉预测可能,我们称之为“无限图表类型”。
取消了传统图表类型的概念,取代以形状和形状对应的颜色,大小,提示,‘标签’等属性;取消了分类、系列等概念,取代以横轴、纵轴两个方向。当你预测两个统计数据字段的相关性时,会手动选择最合适的图表(也可手动调整)。这样的思维更符合大家领到统计数据不知如何预测,先初步了解统计数据情况的探索式预测情景。
每种图表背后都有很强的统计数据预测算法,让预测更加专业科学。此外FineBI5.0还优化了底层统计数据逻辑,重新设计了图表的大统计数据模式,支撑图表展现统计数据量可达百万以上。
一些FineBI5.0实现的可视化效果:
3、新增统计数据分析算法
在5.0版本中,增加了五类发掘算法,分别为时间序列、聚类、分类、回归和关联规则。
此外,我们将时间序列算法和聚类算法和图表预测相结合,不用写任何算法代码只须要简单的拖拖拽着就能立马看到预测和聚类的结果。
如果须要更多的算法怎么办,我们当然为这种复杂的挖掘市场需求做好了准备,5.0能集成了R语言,能直接在FineBI中展开R语言编译,实现统计数据统计和预测的市场需求。并且直接将统计数据统计和预测结果通过finebi展现,完美的结合了R语言的统计潜能优势和FineBI的展现优势。
当然,以上还只是开始,未来还会增强FineBI的统计数据分析潜能,开发更多的内置算法,让统计数据分析更为简单易用。
—统计数据处理—
(2)简单高效的统计数据配置。高效的统计数据准备和配置,能减少使用者不必要的麻烦。关联智能继承,能手动对新创建的预测表建立关联,延续统计数据关联关系。在此基础统计数据更新时,将手动触发预测使用者的统计数据更新。根据统计数据量、使用频率以及动态性的要求,能实现动态统计数据和抽取统计数据的无缝切换,完全不影响使用者已经做好的预测。
(3)强大友好的统计数据处理。使用者能对自己的统计数据展开任意处理,即便是已经参与预测的统计数据也一样,展开如冲洗过滤、新增字段、表合并、排序、分组汇总、统计数据分析等操作,来得到自己想要的统计数据。每一步操作都有统计数据预览,操作后立即收到反馈,增强使用者的统计数据操纵感,减少不确定性。
—大统计数据高效能—
5.0将直接对接统计资料库的动态统计数据引擎与抽取统计数据的引擎资源整合统一为Spider计算引擎。使用者能根据数据量、动态性要求、使用频次等,自由选择动态或抽取的方式。动态统计数据与抽取统计数据方式的无缝切换,将更加灵活高效支撑前端的高效能预测。
Spider统计数据引擎可灵活支撑不同统计数据量级的预测,在统计数据量激增之后,可横向扩展机器节点,利用Spider引擎专为支撑海量大统计数据预测而生的分布式方案。
Spider引擎分布式方式,结合Hadoop大统计数据处理思路,以最轻量级的架构实现大统计数据量高效能预测。此分布式方案集成了Alluxio、Spark、HDFS、zookeerer等大统计数据组件,结合自研高效能算法,列式存储、并行内存计算、计算本地化加上高效能算法,解决大统计数据量预测问题与在FineBI中加速展现的问题。同时从架构上保证了计算引擎系统全年可正常使用。
优势:
(1)引擎支撑前端加速地展现预测,真正实现亿级统计数据,秒级展现。
(2)使用者能根据统计数据量、动态性要求、使用频次等,自由选择动态或抽取的方式,灵活满足动态统计数据预测与大统计数据量历史统计数据预测的市场需求。
(3)抽取统计数据的高效能增量更新功能,可满足多种统计数据更新情景,减少统计数据更新时间,减少统计资料库服务器压力。
(4)合理的引擎系统架构设计可保证全年无故障,全年可正常使用。
—民营企业级统计数据控管—
统计数据控管潜能决定BI远距工具的应用范围和广度。FineBI5.0提供了精准的民营企业级统计数据职权控管方案,图书馆员能高效便捷的展开职权配置,放心大胆的交付给预测人员相关统计数据,无需担心隐私统计数据泄露。
(1)权限统一配置。网络平台统一控制职权,如销售业务包职权、统计数据表行职权、统计数据表列职权等,职权控制的粒度更细致,更科学。通过配置主表职权,所有关联的销售业务表职权也会生效。
(2)职权智能继承。预测人员所做的预测表默认继承此基础统计数据的职权,图书馆员无需再担心这些统计数据表的职权分配,每个阅读使用者手动看到自己职权范围内的统计数据,这有利于促进预测人员之间的分享和交流。
(3)满足不同情景。不同情景对统计数据职权的要求是不同的,每个使用者有权将自己职权范围的统计数据,在有须要的情况下开放给其他使用者。比如总部制作的各大区的汇总销售额,想要让每个使用者都能看到,职权继承的情况下,各大区是没有职权看到其他大区的统计数据的,但是总部的预测表制作使用者有权不继承职权,将统计数据开放给各大区使用者。
——最后——
此次的FineBI5.0版,脱胎换骨,将民营企业级自助式BI远距工具提升到一个新的高度。不仅是统计数据预测发掘远距工具、统计数据可视化远距工具、更是适合多数民营企业复杂流程下的统计数据分析网络平台。