推荐19款最常用的数据挖掘工具 - 网站源码_资源分享

统计数据在当今意味着钱财。随着向如前所述app的世界的过渡阶段，统计数据呈指数增长。然而，绝大多数统计数据亦然内部形式化的，因此须要两个操作过程和方法从统计数据中抽取管用的信息，并将其切换为可理解的和需用的形式。

统计数据预测或“统计资料库中的科学知识辨认出”是透过人工智慧、机器自学、统计和统计关系资料库辨认出大统计数据集中的模式的操作过程。

完全免费的统计数据预测辅助工具包括从完备的数学模型开发自然环境如Knime和Orange，到各式各样用Java、c++撰写的库，最常用的是Python。

统计数据预测中通常涉及到三种各项任务:

进行分类: 将熟识的内部结构归纳为新统计数据的各项任务控制点: 在统计数据中以这种方式搜寻特兰县内部结构的各项任务，而不须要在统计数据中采用已注意的内部结构。关连规则自学: 搜寻表达式之间的关系重回: 意在找到两个表达式，用最轻的严重错误来演示统计数据。

上面列举了用作统计数据预测的完全免费软件辅助工具：

1. Rapid Miner

Rapid Miner，本名YALE又两个自学自然环境，是两个用作机器自学和统计数据预测试验的自然环境，用作研究和实际的统计数据预测各项任务。众所周知，这是技术领先的统计数据预测开放源码系统。该辅助工具以JavaC语言撰写，透过如前所述模版的架构提供高阶预测。

它使得试验能由大量的可随冗余的运算符组成，这些运算符在XML文档中是详尽的，并且是由快速的Miner的GUI完成的。最好的是使用者不须要撰写标识符。它已经有许多模版和其他辅助工具，让我们能随心所欲地预测统计数据。

2. IBM SPSS Modeler

IBM SPSS Modeler辅助工具滚珠轴承最适宜处理文档预测等项目投资，其建模介面非常管用。它容许您在不程式设计的情况下聚合各式各样统计数据预测演算法。它也能用作异常检验、可计算性互联网、CARMA、Cox重回以及采用第二层感知器进行逆向散播自学的基本数学数学模型。

3.Oracle Data Mining

Oracle。作为“高阶预测统计资料库”选项的一部分，Oracle统计数据预测功能容许其使用者辨认出洞察力，进行预测并利用其Oracle统计数据。您能构建数学模型来辨认出客户行为目标客户和开发概要文档。

Oracle Data Miner GUI使统计数据预测师、业务预测师和统计数据科学家能够采用相当优雅的拖放解决方案处理统计资料库内的统计数据。它还能为整个企业的自动化、调度和部署创建SQL和PL / SQL脚本。

4. Teradata

Teradata认识到，尽管大统计数据是令人敬畏的，但如果您实际上并不知道如何预测和采用它，那么它是毫无价值的。想象一下，有数百万的统计数据点没有查询的技能。这就是Teradata所提供的。它们提供统计数据仓库，大统计数据和预测以及市场营销应用程序方面的端到端解决方案和服务。

Teradata还提供一系列的服务，包括实施，业务咨询，培训和支持。

5. Framed Data

储产品的电离数学模型，并透过API提供预测，消除基础架构开销。他们提供了仪表板和情景预测辅助工具，告诉你哪些公司杠杆是驾驶你关心的指标。

6. Kaggle

Kaggle是全球最大的统计数据科学社区。公司和研究人员张贴他们的统计数据，来自世界各地的统计人员和统计数据预测者竞相制作最好的数学模型。Kaggle是统计数据科学竞赛的平台。它帮助您解决难题，招募强大的团队，并扩大您的统计数据科学人才的力量。

3个步骤的工作：

上传预测问题

提交

评估和交流

7. Weka

WEKA是两个非常复杂的统计数据预测辅助工具。它向您展示了统计数据集、集群、预测建模、建模等方面的各式各样关系。您能应用多种进行分类器来深入了解统计数据。

8. Rattle

Rattle代表R预测辅助工具随心所欲自学。它提供统计数据的统计和建模汇总，将统计数据切换为能随心所欲建模的表单，从统计数据中构建无监督数学模型和监督数学模型，以图形方式呈现数学模型的性能，并对新统计数据集进行评分。

它是两个采用Gnome图形介面在统计语言R撰写的完全免费的开放源码统计数据预测辅助工具包。它运行在GNU / Linux，Macintosh OS X和MS / Windows下。

9. KNIME

Konstanz信息采集器是两个使用者友好、可理解、全面的开放源码统计数据集成、处理、预测和探索平台。它有两个GUI，帮助使用者方便地连接节点进行统计数据处理。

KNIME还透过模块化的统计数据流水线概念集成了机器自学和统计数据预测的各式各样组件，并引起了商业智能和财务统计数据预测的注意。

10. Python

作为一种完全免费且开放源标识符的语言，Python通常与R进行比较，以方便采用。与R不同的是，Python的自学曲线往往很短，因此成了传奇。许多使用者辨认出，他们能开始构建统计数据集，并在几分钟内完成极其复杂的亲和力预测。只要您熟识表达式、统计数据类型、表达式、条件和循环等基本程式设计概念，最常用的业务用例统计数据建模就很简单。

11. Orange

Orange是两个以Python语言撰写的如前所述组件的统计数据预测和机器自学软件套件。它是两个开放源码的统计数据建模和预测的新手和专家。统计数据预测能透过建模程式设计或Python脚本进行。它还包含了统计数据预测、不同的建模、从散点图、条形图、树、到树图、互联网和热图的特征。

12. SAS Data Mining

采用SAS Data Mining商业软件辨认出统计数据集模式。其描述性和预测性建模提供了更好的理解统计数据的见解。他们提供了两个易于采用的GUI。他们拥有自动化的统计数据处理辅助工具，集群到最终能找到正确决策的最佳结果。作为两个商业软件，它还包括可升级处理、自动化、强化演算法、建模、统计数据建模和勘探等先进辅助工具。

13. Apache Mahout