7种最佳自动机器学习框架简介

全自动机器自学控制系统有甚么有意思的地方?什么样架构适宜AutoML?目前的管制是甚么?他们将在该文中提问这些难题。

假定有两个统计数据集，他们想由此获得两个预估数学模型。现代的机器自学方式须要下列一连串姿势:

先期统计数据处理；确认重要特点，内部结构新特点；选择恰当的自学商业模式；强化超模块；使用最差模块展开体能训练。

这个操作方式过程可能将很艰难。为了获得更快的结果，须要对假定展开反反复复检验，并且每一步都能进一步明晰。

全自动机器自学（AutoM预估。

但这是否意味著不须要统计数据挖掘研究者呢？当然不是。AutoML技术意在消解常规性的操作方式次序和数学模型的全自动隐式，以期研究者能将更多的时间资金投入到难题的创造力方面。

考虑上述机器自学的各阶段。比如，要预备统计数据，可能将须要全智能化：

确认列的类别（数值统计数据，文档，常量等）；语法内容，比如，如果该表头是文档，则其表示甚么：联系电话，年份，自然地理记号等；各项任务检验：控制点，名列等

当心的是找寻最差数学模型超模块的操作方式过程。搜寻它们的三种最常用方式是：

分层搜寻。随机搜寻。

这三种方式仅适用于于小量超模块。其他用于强化模块的演算法：可计算性强化，边界值，变异演算法等。

MLBox

MLBox解决了下列各项任务：

统计数据预备（复本比较成形的部分）数学模型选择超模块搜寻

在Linux控制系统上加装要比在Mac或Windows控制系统上难得多。

Auto Sklearn

顾名思义，Auto Sklearn架构是建立在流行的scikit-learn机器自学库之上的。Auto Sklearn能做甚么:

特点描述(架构的两个显著特性)机器自学数学模型选型超模块设定

Auto Sklearn在处理小统计数据集方面做得很好，但不处理大型统计数据集不太理想。

TPOT被定位为两个架构，其中机器自学管道是完全全智能化的。为了找到最差数学模型，它使用了遗传演算法。

像Auto Sklearn一样，此架构是scikit-learn的附加组件。但是TPOT有其自己的回归和分类演算法。缺点包括TPOT无法与自然语言交互等。

H2O AutoML支持现代的机器自学数学模型和神经网络。特别适宜那些正在找寻一种全智能化深度自学方式的人。

Auto Keras遵循经典scikit-learn API的设计，但是使用了功能强大的神经网络用Keras来搜寻数学模型模块。

Cloud AutoML使用神经网络架构。此谷歌产品具有用于自学和部署数学模型的简单用户界面。

然而，该平台是付费的，从长远来看，只在商业项目中使用它是有意义的。另一方面，出于研究目的，全年都能免费使用有管制的Cloud AutoML。

Uber Ludwig项目的目标是用最少的代码实现深度自学操作方式过程的全智能化。该架构仅适用于于深度自学数学模型，而忽略了其他经典机器自学数学模型。当然，与深度自学通常的情况一样，统计数据量起着重要的作用。

AutoML已经非常适用于于教学（用高质量的记号统计数据）。但是到目前为止，AutoML技术在处理复杂的原始统计数据和强化内部结构新特点（特点工程）的操作方式过程中仍然存在困难，重要特点的选择仍然是数学模型自学操作方式过程的基石之一。