全自动机器自学控制系统有甚么有意思的地方?什么样架构适宜AutoML?目前的管制是甚么?他们将在该文中提问这些难题。
假定有两个统计数据集,他们想由此获得两个预估数学模型。现代的机器自学方式须要下列一连串姿势:
先期统计数据处理;确认重要特点,内部结构新特点;选择恰当的自学商业模式;强化超模块;使用最差模块展开体能训练。这个操作方式过程可能将很艰难。为了获得更快的结果,须要对假定展开反反复复检验,并且每一步都能进一步明晰。
全自动机器自学(AutoM预估。
但这是否意味著不须要统计数据挖掘研究者呢?当然不是。AutoML技术意在消解常规性的操作方式次序和数学模型的全自动隐式,以期研究者能将更多的时间资金投入到难题的创造力方面。
考虑上述机器自学的各阶段。比如,要预备统计数据,可能将须要全智能化:
确认列的类别(数值统计数据,文档,常量等);语法内容,比如,如果该表头是文档,则其表示甚么:联系电话,年份,自然地理记号等;各项任务检验:控制点,名列等当心的是找寻最差数学模型超模块的操作方式过程。搜寻它们的三种最常用方式是:
分层搜寻。随机搜寻。这三种方式仅适用于于小量超模块。其他用于强化模块的演算法:可计算性强化,边界值,变异演算法等。
MLBox
MLBox解决了下列各项任务:
统计数据预备(复本比较成形的部分)数学模型选择超模块搜寻在Linux控制系统上加装要比在Mac或Windows控制系统上难得多。
Auto Sklearn
顾名思义,Auto Sklearn架构是建立在流行的scikit-learn机器自学库之上的。Auto Sklearn能做甚么:
特点描述(架构的两个显著特性)机器自学数学模型选型超模块设定Auto Sklearn在处理小统计数据集方面做得很好,但不处理大型统计数据集不太理想。
TPOT
TPOT被定位为两个架构,其中机器自学管道是完全全智能化的。为了找到最差数学模型,它使用了遗传演算法。
像Auto Sklearn一样,此架构是scikit-learn的附加组件。但是TPOT有其自己的回归和分类演算法。缺点包括TPOT无法与自然语言交互等。
H2O
H2O AutoML支持现代的机器自学数学模型和神经网络。特别适宜那些正在找寻一种全智能化深度自学方式的人。
Auto Keras
Auto Keras遵循经典scikit-learn API的设计,但是使用了功能强大的神经网络用Keras来搜寻数学模型模块。
Cloud AutoML
Cloud AutoML使用神经网络架构。此谷歌产品具有用于自学和部署数学模型的简单用户界面。
然而,该平台是付费的,从长远来看,只在商业项目中使用它是有意义的。另一方面,出于研究目的,全年都能免费使用有管制的Cloud AutoML。
Uber Ludwig
Uber Ludwig项目的目标是用最少的代码实现深度自学操作方式过程的全智能化。该架构仅适用于于深度自学数学模型,而忽略了其他经典机器自学数学模型。当然,与深度自学通常的情况一样,统计数据量起着重要的作用。
最后
AutoML已经非常适用于于教学(用高质量的记号统计数据)。但是到目前为止,AutoML技术在处理复杂的原始统计数据和强化内部结构新特点(特点工程)的操作方式过程中仍然存在困难,重要特点的选择仍然是数学模型自学操作方式过程的基石之一。