统计数据在当今意味着钱财。随着向如前所述app的世界的过渡阶段,统计数据呈指数增长。然而,绝大多数统计数据亦然内部形式化的,因此须要两个操作过程和方法从统计数据中抽取管用的信息,并将其切换为可理解的和需用的形式。
统计数据预测或“统计资料库中的科学知识辨认出”是透过人工智慧、机器自学、统计和统计关系资料库辨认出大统计数据集中的模式的操作过程。
完全免费的统计数据预测辅助工具包括从完备的数学模型开发自然环境如Knime和Orange,到各式各样用Java、c++撰写的库,最常用的是Python。
统计数据预测中通常涉及到三种各项任务:
进行分类: 将熟识的内部结构归纳为新统计数据的各项任务控制点: 在统计数据中以这种方式搜寻特兰县内部结构的各项任务,而不须要在统计数据中采用已注意的内部结构。关连规则自学: 搜寻表达式之间的关系重回: 意在找到两个表达式,用最轻的严重错误来演示统计数据。上面列举了用作统计数据预测的完全免费软件辅助工具:
1. Rapid Miner
Rapid Miner,本名YALE又两个自学自然环境,是两个用作机器自学和统计数据预测试验的自然环境,用作研究和实际的统计数据预测各项任务。众所周知,这是技术领先的统计数据预测开放源码系统。该辅助工具以JavaC语言撰写,透过如前所述模版的架构提供高阶预测。
它使得试验能由大量的可随冗余的运算符组成,这些运算符在XML文档中是详尽的,并且是由快速的Miner的GUI完成的。最好的是使用者不须要撰写标识符。它已经有许多模版和其他辅助工具,让我们能随心所欲地预测统计数据。
2. IBM SPSS Modeler
IBM SPSS Modeler辅助工具滚珠轴承最适宜处理文档预测等项目投资,其建模介面非常管用。 它容许您在不程式设计的情况下聚合各式各样统计数据预测演算法。 它也能用作异常检验、可计算性互联网、CARMA、Cox重回以及采用第二层感知器进行逆向散播自学的基本数学数学模型。
3.Oracle Data Mining
Oracle。 作为“高阶预测统计资料库”选项的一部分,Oracle统计数据预测功能容许其使用者辨认出洞察力,进行预测并利用其Oracle统计数据。您能构建数学模型来辨认出客户行为目标客户和开发概要文档。
Oracle Data Miner GUI使统计数据预测师、业务预测师和统计数据科学家能够采用相当优雅的拖放解决方案处理统计资料库内的统计数据。 它还能为整个企业的自动化、调度和部署创建SQL和PL / SQL脚本。
4. Teradata
Teradata认识到,尽管大统计数据是令人敬畏的,但如果您实际上并不知道如何预测和采用它,那么它是毫无价值的。 想象一下,有数百万的统计数据点没有查询的技能。 这就是Teradata所提供的。它们提供统计数据仓库,大统计数据和预测以及市场营销应用程序方面的端到端解决方案和服务。
Teradata还提供一系列的服务,包括实施,业务咨询,培训和支持。
5. Framed Data
储产品的电离数学模型,并透过API提供预测,消除基础架构开销。他们提供了仪表板和情景预测辅助工具,告诉你哪些公司杠杆是驾驶你关心的指标。
6. Kaggle
Kaggle是全球最大的统计数据科学社区。 公司和研究人员张贴他们的统计数据,来自世界各地的统计人员和统计数据预测者竞相制作最好的数学模型。Kaggle是统计数据科学竞赛的平台。 它帮助您解决难题,招募强大的团队,并扩大您的统计数据科学人才的力量。
3个步骤的工作 :
上传预测问题
提交
评估和交流
7. Weka
WEKA是两个非常复杂的统计数据预测辅助工具。 它向您展示了统计数据集、集群、预测建模、建模等方面的各式各样关系。您能应用多种进行分类器来深入了解统计数据。
8. Rattle
Rattle代表R预测辅助工具随心所欲自学。 它提供统计数据的统计和建模汇总,将统计数据切换为能随心所欲建模的表单,从统计数据中构建无监督数学模型和监督数学模型,以图形方式呈现数学模型的性能,并对新统计数据集进行评分。
它是两个采用Gnome图形介面在统计语言R撰写的完全免费的开放源码统计数据预测辅助工具包。 它运行在GNU / Linux,Macintosh OS X和MS / Windows下。
9. KNIME
Konstanz信息采集器是两个使用者友好、可理解、全面的开放源码统计数据集成、处理、预测和探索平台。它有两个GUI,帮助使用者方便地连接节点进行统计数据处理。
KNIME还透过模块化的统计数据流水线概念集成了机器自学和统计数据预测的各式各样组件,并引起了商业智能和财务统计数据预测的注意。
10. Python
作为一种完全免费且开放源标识符的语言,Python通常与R进行比较,以方便采用。 与R不同的是,Python的自学曲线往往很短,因此成了传奇。 许多使用者辨认出,他们能开始构建统计数据集,并在几分钟内完成极其复杂的亲和力预测。 只要您熟识表达式、统计数据类型、表达式、条件和循环等基本程式设计概念,最常用的业务用例统计数据建模就很简单。
11. Orange
Orange是两个以Python语言撰写的如前所述组件的统计数据预测和机器自学软件套件。它是两个开放源码的统计数据建模和预测的新手和专家。统计数据预测能透过建模程式设计或Python脚本进行。它还包含了统计数据预测、不同的建模、从散点图、条形图、树、到树图、互联网和热图的特征。
12. SAS Data Mining
采用SAS Data Mining商业软件辨认出统计数据集模式。 其描述性和预测性建模提供了更好的理解统计数据的见解。 他们提供了两个易于采用的GUI。 他们拥有自动化的统计数据处理辅助工具,集群到最终能找到正确决策的最佳结果。 作为两个商业软件,它还包括可升级处理、自动化、强化演算法、建模、统计数据建模和勘探等先进辅助工具。
13. Apache Mahout
Apache Mahout是Apache软件基金会(Apache Software Foundation)的两个项目,用作聚合主要集中在协作过滤、控制点和进行分类领域的分布式或其他可伸缩机器自学演算法的完全免费实现。
Apache Mahout主要支持三种用例:建议挖掘采取使用者行为,并尝试搜寻使用者可能喜欢的项目。 集群须要 文档文档,并将它们分组为局部相关的文档。 进行分类从现有的进行分类文档中自学到特定类别的文档是什么样子,并能够将未标记的文档分配给(希望)正确的类别。
14. PSPP
PSPP是对采样统计数据进行统计预测的程序。 它有两个GUI和传统的命令行介面。 它用C语言撰写,采用GNU科学图书馆的数学例程,并绘制UTILS来聚合图表。 它是专有程序SPSS(来自IBM)的完全免费替代品,能自信地预测接下来会发生什么,以便您能做出更明智的决策,解决问题并改进结果。
15. jHepWork
jHepWork是两个完全免费的开放源标识符统计数据预测架构,它是为了采用开放源标识符软件包和可理解的使用者介面创建两个统计数据预测自然环境,并创建两个与商业程序相竞争的辅助工具。
JHepWork显示统计数据集的交互式2D和3D图,以便更好地预测。 Java中实现了数字科学库和数学表达式。 jHepWork如前所述高阶C语言Jython,但Java编码也需用作调用jHepWork数值库和图形库。
16. R programming Language
为什么R是这个名单上完全免费统计数据预测辅助工具的超级巨星?它是完全免费的、开放源码的,并且很容易为那些没有程式设计经验的人挑选。实际上,有数以千计的库能集成到R自然环境中,使其成为两个强大的统计数据预测自然环境。它是两个完全免费的软件C语言和软件自然环境,用作统计计算和图形。
在统计数据采矿者中广泛采用R语言进行统计软件和统计数据预测。近年来,易用性和可扩展性大大提高了R的知名度。
17. Pentaho
Pentaho为统计数据集成,业务预测和大统计数据提供了
18. Tanagra
TANAGRA是两个用作学术和研究目的的统计数据预测软件。 有探索性统计数据预测,统计自学,机器自学和统计资料库领域的辅助工具。Tanagra包含一些监督自学,但也包括其他范例,如控制点,因子预测,参数和非参数统计,关连规则,特征选择和构建演算法。
19. NLTK
自然语言工具包,是一套用作Python语言的符号和统计自然语言处理(NLP)的库和程序。 它提供了两个语言处理辅助工具库,包括统计数据预测,机器自学,统计数据报废,情感预测和其他各式各样语言处理各项任务。 构建python程序来处理人类语言统计数据。