大统计数据辅助工具让企业能从统计基础架构赢得想像力,进而在统计数据驱动力的销售业务自然环境中提供更多重要的市场竞争竞争优势。
为的是满足用户坚挺市场需求,大统计数据辅助工具在快速Engilbert。在大统计数据而此基本概念和销售业务发展战略再次出现年来的近两年,市售再次出现了数以千计继续执行各式各样各项任务和业务流程的辅助工具,它都允诺需为你节省成本和资金,挖掘销售业务想像力进而同时实现增加收入。或许,一个急速增长的市场呈现出在大统计数据挖掘辅助工具的眼前。
其中很多辅助工具一开始就像起初的大统计数据应用软件架构Hadoop那般是开放源码项目,但而后商业性公司快速急速涌现,为开放源码产品提供更多新辅助工具或商业性全力支持和合作开发。
由此进行甄选可能很十分困难,特别是很多大统计数据辅助工具商业性用途单个,而你可以用大统计信息处理很多不同的各项任务,因此你的预测辅助widget会塞得水泄不通。责任编辑他们列出了市售主要就的大统计数据挖掘辅助工具市售主要就的大统计数据挖掘辅助工具,分三大?类型来如是说。
·主要就的大统计数据辅助工具·
与此相反,大统计数据辅助工具常常归属于单个商业性用途类型,而使用大统计数据有多种不同形式。因此他们将按类型行业龙头,接着探讨每一类别的预测辅助工具。
一、大统计数据辅助工具:统计数据储存和管理工作
大统计数据全然始自统计数据储存,换句话说始自大统计数据架构Hadoop。它是Apache促进会运转的一种开放源码应用软件架构,用作在平民化计算机系统软件产业上分布式系统储存十分大的统计数据集。
很或许,由于大统计数据需要大量的信息,储存至关重要。但除了储存外,还需要某种形式将所有这些统计数据汇集成某种格式化/治理结构,进而赢得想像力。因此,大统计数据储存和管理工作是真正的基础――离开了它,预测平台一无是处。在一些情况下,这些解决方案还包括员工培训。
这个应用领域的大玩家包括:
1. Cloudera
实际上是增加了一些额外服务的Hadoop,你会需要它,因为大统计数据不容易搞。Cloudera的服务团队不仅可以帮助你构建大统计数据软件产业,还可以帮助培训你的员工,更好地访问统计数据。
2. MongoDB
MongoDB是最受欢迎的大统计数据统计数据库,因为它适用作管理工作经常变化的统计数据:非结构化统计数据,大统计数据常常是非结构化统计数据。
3. Talend
作为一家提供更多广泛解决方案的公司,Talend的产品围绕其集成平台而建,该平台集大统计数据、云、应用程序、实时统计数据集成、统计数据准备和主统计数据管理工作于一体。
图1:Talend大统计数据集成平台包括统计数据质量和治理功能
二、大统计数据辅助工具:统计数据清理
当下,统计数据可能来自任何地方:移动、物联网和社交媒体,统计数据清理显得更为必要。并非所有这些统计数据都可以轻松“清理”以赢得想像力,因此优秀的统计数据清理辅助工具极其重要。实际上,在未来几年,预计经过有效清理的统计数据会是可接受的大统计数据系统与真正出色的大统计数据系统之间的市场竞争竞争优势。
4. OpenRefine
OpenRefine是一款易于使用的开放源码辅助工具,通过删除重复项、空白字段及??其他错误来清理凌乱的统计数据。它是开放源码的,但有一个相当大的社区可提供更多帮助。
5. DataCleaner
与OpenRefine一样,DataCleaner可将半结构化统计数据集转换成统计数据可视化辅助工具可以读取的干净可读的统计数据集。该公司还提供更多统计基础架构和统计数据管理工作服务。
6. 微软Excel
说真的,Excel有其商业性用途。你可以从各式各样统计数据源导入统计数据。Excel在手动统计数据输入和复制/粘贴操作方面特别有用。它能消除重复项,查找和替换内容,检查拼写,还有用作转换统计数据的很多公式。但Excel很快陷入困境,不适合庞大统计数据集。
三、大统计数据辅助工具:统计数据挖掘
一旦统计数据经过清理和准备,你可以通过统计数据挖掘开始搜索统计数据了。这时你继续执行这个实际的过程:发现统计数据、做出决定和进行预测。
统计数据挖掘是大统计数据业务流程的真正核心。统计数据挖掘解决方案通常底层很复杂,但竭力提供更多 一种外观漂亮、对用户友好的用户界面,说起来容易做起来难。统计数据挖掘辅助工具面临的另一个挑战是:它确实需要人来编制查询,因此统计数据挖掘辅助工具的好坏取决于使用它的专业人员。
7. RapidMiner
RapidMiner是一款易于使用的预测预测辅助工具,有着对用户友好的可视化界面,这意味着你没必要编写代码即可运转预测产品。
8. IBM SPSS Modeler
IBM SPSS Modeler是一款包括五个统计数据挖掘产品的套件,面向企业级高级预测。另外IBM的服务和咨询首屈一指。
9. Teradata
Teradata为统计基础架构、大统计数据和预测以及营销等应用提供更多端到端解决方案。而此切意味着贵公司可以真正成为统计数据驱动力的公司,另外还有商业性服务、咨询、培训和全力支持。
图2:与很多目前的大统计数据辅助工具一样,RapidMiner解决方案也全力支持云
四、大统计数据辅助工具:统计数据可视化
统计数据可视化是指以一种可读、实用的格式显示你的统计数据。你可以查看图表图形以及直观显示统计数据的其他图像。
统计数据可视化既是一门科学,又是一门艺术。随着大统计数据从有大批统计数据科学家全力支持的高管转移到整个公司上下,众多员工可以使用可视化辅助工具极为重要。销售代表、IT全力支持和中层管理工作,这些团队个个都需要能理解统计数据,因此重点放在易用性上。然而,易于阅读的可视化有时与来自深度特征集的统计数据读出相冲突,这带来了统计数据可视化辅助工具面临的主要就挑战之一。
10. Tableau
Tableau是该应用领域的领导者,其统计数据可视化辅助工具专注于商业性智能,无需懂得编程,即可创建各式各样地图、图表、图形及更多可视化元素。它共有五款产品,一款名为Tableau Public的免费版供潜在客户试用。
11. Silk
Silk是Tableau的简单版,让你可以通过地图和图表将统计数据可视化,无需任何编程。你在首次加载Silk时,它甚至会试着将统计数据可视化。它还让用户很容易在网上发布结果。
12. Chartio
Chartio使用自己的可视化查询语言,只要点击几下鼠标即可创建功能强大的仪表板,无需懂得SQL或其他建模语言。它有别于其他辅助工具的地方主要就在于,你可以直接连接到统计数据库,因此不需要统计基础架构。
13.IBM Watson Analytics
IBM Watson Analytics结合了机器学习和人工智能,有助于提供更多智能统计数据科学助手,为销售业务预测员和统计数据科学家等拥有众多统计数据科学技能的用户扮演了向导。
·大统计数据辅助工具的三个层次·
普华永道的移动统计数据和预测计划首席技术官Ritesh Ramesh表示,就先进程度和市场发展战略而言,大统计数据辅助工具可分成三层金字塔。
第一层:最庞大的是一系列开放源码辅助工具。每家公司以开放源码起家,像Cloudera和Hortonworks。除了基本的基础设施、服务器和储存外,没有多大的价值。大多数云厂商已将而此层同时实现了商品化。
第二层:在而此层,大多数这类厂商已有意增加各自的市场份额,在开放源码辅助工具上面构建一些专有应用程序,进而做到与众不同。举例说,Cloudera合作开发了很多产品,比如驻留在Hadoop核心上的统计数据科学平台。
第三层:这些是针对特定垂直应用领域的应用程序。这些公司大多与普华永道、高知特或埃森哲等系统集成商合作。真正的价值出在这里,这对大统计数据辅助工具合作开发商来说也是十分有效的市场竞争策略。
Ramesh表示,除了基本功能外,这些辅助工具的三大方面备受欢迎。首先是统计信息处理辅助工具。他说:“统计数据学习辅助工具是客户的辅助widget中确保统计数据质量和预测统计数据的重要辅助工具,比如处理5000万行统计数据以发现想像力。”
他表示,领先的厂商包括Trifacta、Paxata和Talend。
第二大类应用程序是治理,比如你如何定义元统计数据。他说:“好多人在这方面遇到十分困难。人们只是将大量垃圾统计数据倒到统计数据湖。市售可在统计数据湖中积极发挥功效的辅助工具不多。由于这项工作主要就由IT人员完成,他们更有兴趣将统计数据倒到统计数据湖,而不是确立一种治理结构。”
主要就厂商包括Waterline Data、以统计数据编目辅助工具见长的Tamr和Collibra。
Ramesh说,经常再次出现的第三大市场需求是安全。他说:“人们希望一个产品就有安全访问的所有层(列、行和对象)。他们希望一款产品为不同的统计数据对象全力支持用户访问和安全。这也是个新兴应用领域。”
这个应用领域的主要就厂商是Wandisco和FireEye。
End.
文章推荐
如何完成一份高质量统计数据预测报告