资源｜机器学习必知的15大框架，欢迎补充！ - 网站源码_资源分享

责任编辑约4000字，提议写作8两分钟。

责任编辑向我们如是说了机器自学中必须掌控的15个大架构。

机器自学技师是合作开发商品和构筑演算法项目组中的一小部分，并保证其可信、加速和成规模地工作。他们和统计数据生物学家密切联系来了解专业知识和行业应用领域。统计数据研究者和机器自学技师的主要差别是：

机器自学技师构筑、合作开发和保护机器自学控制系统的商品。统计数据研究者进行进行调查研究形成有关于机器自学项目的设想，然后分析来认知机器自学控制系统的测度影响。

上面是机器自学的架构如是说：

1. Apache Singa 是两个用作在小型统计数据K568体能训练广度自学的通用型分布式控制系统广度自学网络平台，它是如前所述多层抽象化的单纯合作开发数学模型结构设计的。

它还支持各式各样当前盛行的广度自学数学模型，有THF1数学模型（传递函数数学模型，CNN），热量数学模型（受到限制麦克斯韦机，RBM和循环式数学模型，RNN），还为采用者提供更多了许多嵌入层。

2. Amazon Machine Learning（AML）是一种让各式各样等级采用机器自学控制技术的合作开发者可随心所欲掌控的两个服务项目，提供更多了听觉辅助工具和科水狼，能辅导您在无须自学繁杂的机器自学演算法和控制技术的情况下建立机器自学。

3. Azure ML Studio容许谷歌Azure的采用者建立和体能训练数学模型，随即将这些数学模型转化成为能被其他服务项目采用的API。尽管您能将自己的Azure储存镜像到Villamblard数学模型的服务项目，但是每一帐户数学模型统计数据的储存空间最少不超过10GB。在Azure中有大量的演算法可供采用，这要非常感谢谷歌和一些服务器端。甚至你都不需要注册登记帐号，就能匿名登录，采用Azure ML Studio服务项目长达8半小时。

4. Caffe是由伯克利听觉自学中心(BLVC)和社区贡献者们基于BSD-2-协议合作开发的两个广度自学架构，它秉承“表示、效率和模块化”的合作开发理念。数学模型和组合优化通过配置而不是硬编码实现，并且采用者可根据需要在CPU处理和GPU处理之间进行切换，Caffe的高效性使其在实验研究和产业部署中的表现很完美，采用单个NVIDIA K40 GPU处理器每天即可处理超过六千万张图像。

5. H2O使人随心所欲地应用领域数学和预测分析来解决当今极具挑战性的商业问题，它巧妙的结合了目前在其他机器自学网络平台还未被采用的独有特点：最佳开源控制技术，易于采用的WebUI和熟悉的界面，支持常见的统计数据库和不同文件类型。用H2O，你能采用现有的语言和辅助工具。此外，也还能无缝扩展到Hadoop环境中。

6. Massive Online Analysis (MOA)是目前最受热烈欢迎的统计数据流挖掘开源架构，拥有两个非常活跃的社区。它包含一系列的机器自学演算法（分类，回归，聚类，离群检测，概念漂移检测和推荐控制系统）和评价辅助工具。和WEKA项目一样，MOA 也是用Java编写，但扩展性更好。

7. MLlib (Spark)是Apache Spark的机器自学库，目的是让机器自学实现可伸缩性和易操作性，它由常见的自学演算法和实用程序组成，包括分类、回归、聚类，协同过滤、降维，同时包括底层优化原生语言和高层管道API。

8. Mlpack是两个如前所述C++的基础自学库，最早于2011年推出，据库的合作开发者声称，它秉承“可扩展性、高效性和易用性”的理念来结构设计的。执行Mlpack有两种方法：通过加速处理简易的“黑盒”操作命令行执行的缓存，或者借助C++ API处理较为繁杂的工作。Mlpack可提供更多单纯的能被整合到大型的机器自学解决方案中的命令行程序和C++的类。

9. Pattern是Python编程语言的web挖掘组件，有统计数据挖掘辅助工具（ Google、Twitter 、Wikipedia API，网络爬虫，HTML DOM解析器），自然语言处理（词性标注，n-gram搜索，情感分析，WordNet接口），机器自学（向量空间数学模型，聚类，支持向量机），网络分析和可视化。

10. Scikit-Learn为了数学和科学工作，如前所述现有的几个Python包（Numpy，SciPy和matplotlib）拓展了Python的采用范围。最终生成的库既可用作交互式工作台应用领域程序，也可嵌入到其他软件中进行复用。该辅助工具包如前所述BSD协议，是完全免费开源的，可重复利用。Scikit-Learn中含有多种用作机器自学任务的辅助工具，如聚类，分类，回归等。Scikit-Learn是由拥有众多合作开发者和机器自学研究者的小型社区合作开发的，因此，Scikit-Learn中最前沿的控制技术往往会在很短时间内被合作开发出来。

11. Shogu是最早的机器自学库之一，它建立于1999年，用C++合作开发，但并不局限于C++环境。借助SWIG库，Shogun适用作各式各样语言环境，如Java，Python，c#，Ruby，R，Lua，Octave和Mablab。Shogun 旨在面向广泛的特定类型和自学配置环境进行统一的大规模自学，如分类，回归或探索性统计数据分析。

12. TensorFlow是两个采用统计数据流图进行数值运算的开源软件库，它实现了统计数据流图，其中，张量（“tensors”）可由一系列图形描述的演算法来处理，统计数据在该控制系统中的变化被称为“流”，由此而得名。统计数据流可用C++或Python编码后在CPU或GPU的设备上运行。

13. Theano是两个如前所述BSD协议发布的可定义、可优化和可数值计算的Phython库。采用Theano也能达到与用C实现大数据处理的速度相媲美，是支持高效机器自学的演算法。

14. Torch是一种广泛支持把GPU放在首位的机器自学演算法的科学计算架构。由于采用了单纯加速的脚本语言LuaJIT和底层的C/CUDA来实现，使得该框架易于采用且高效。Torch目标是让你通过极其单纯的过程、最大的灵活性和速度建立自己的科学演算法。Torch是如前所述Lua合作开发的，拥有两个庞大的生态社区驱动库包结构设计机器自学、计算机听觉、信号处理，并行处理，图像，视频，音频和网络等。

15. Veles是一套用C++合作开发的面向深层自学应用领域程序的分布式控制系统网络平台，不过它利用Python在节点间自动操作与协作任务。在相关统计数据集中到该集群之前，可对统计数据进行分析与自动标准化调整，且REST API容许将各已体能训练数学模型立即添加至生产环境当中，它侧重于性能和灵活性。Veles几乎没有硬编码，可对所有广泛认可的网络拓扑结构进行体能训练，如全传递函数数学模型，传递函数数学模型，循环式神经网络等。

参考镜像：http://bigdata.evget.com/post/2183.html

运营人员：冉小山

相关文章

微信