1. Hadoop
Hadoop是他们最脍炙人口的一类大统计数据挖掘预测,它是两个能让采用者随心所欲构架和采用的并行排序网络平台。采用者能在Hadoop上合作开发和运转处置海量统计数据的插件。它主要就有下列两个缺点:
●高效率:Hadoop按位储存和处置统计数据的潜能值得称赞现代人尊敬。
● 高可扩展性:Hadoop是在需用的排序机集簇间重新分配统计数据并顺利完成排序各项任务的,那些集簇能方便快捷地扩展到数以百计的结点中。
● INS13ZD:Hadoop能在结点间静态地终端统计数据,并确保各结点的良性循环,因而反应速度十分快。
● 高可扩展性:Hadoop能手动留存统计数据的数个复本,因此能手动将失利的各项任务重新配置。
Hadoop暗含用 Java 词汇编写的架构,因而运转在 Linux 制造网络平台上是十分平庸的。Hadoop 上的插件也能采用其它词汇撰写,比如说 C++。
2. HPCC
做为Hadoop以外的一类优先选择,HPCC是两个借助软件产业软件商大统计数据挖掘的控制系统,它已在LexisNexis外部采用十多年,是两个成形可信的控制系统,包涵一连串的辅助工具、两个称作ECL的高阶编程词汇和有关的统计基础构架,可扩展性极强。
3. Storm
Storm是Twitter开源的两个类似于Hadoop的实时统计数据处置架构,它的编程模型简单,能极大降低实时处置的难度,也是当下极具人气的流排序架构之一。与其它排序架构相比,Storm最大的缺点是能达到毫秒级低延时。
4. Apache Drill
Drill是由Apache推出的,让采用者能采用基于SQL的查询,查询Hadoop、NoSQL统计数据库和云储存服务。它能运转在上千个结点的服务器软件产业上,且能在几秒内处置PB级或者万亿条的统计数据记录。它需用于统计数据挖掘和即席查询,支持一连串广泛的统计数据库,包括HBase、MongoDB、MapR-DB、HDFS、MapR-FS、亚马逊S3、AzureBlob Storage、谷歌云储存和Swift。
5. RapidMiner
RapidMiner具有丰富统计数据挖掘预测和算法功能,常见于解决各种的商业关键问题,解决方案覆盖各领域,包括汽车、银行、保险、生命科学、制造业、石油和天然气、零售业及快消行业、通讯业、和公用事业等。
6. Pentaho BI
Pentaho BI 网络平台不同于传统的BI 产品,它是两个以流程为中心的、面向解决方案的架构。它能将一连串企业级BI产品、开源软件、API等等组件集成起来,方便快捷商务智能应用的合作开发。它的出现使得一连串面向商务智能的独立产品(如Jfree、Quartz等)能集成在一起,构成一项项复杂的、完整的商务智能解决方案。
“大
主编:王宏志
特邀副主编: 朱劼
副主编: 丁小欧
齐志鑫,王雨茁,陈柯昊
编辑: 陶颖安
-精彩内容,记得分享到朋友圈-
学家微信公共号