统计数据数据自然科学是两门将统计数据数据显得管用的学科专业。它包涵四个关键基本概念:
统计数据机器自学统计数据数据挖掘/预测统计数据数据自然科学的表述
假如你简述呵呵统计数据数据自然科学那个名词的[晚期发展史](),会辨认出有三个主轴紧密相连接:
大统计数据数据意味著计算机系统的采用振幅减少。逻辑学家极难将油墨上所写演算法用计算机系统同时实现。继而,统计数据数据自然科学以求再次出现。先前,现代人将统计数据数据自然生物学家
视为会代码的逻辑学家。现如今直言,此种讲法并不精确,具体来说让他们返回统计数据数据自然科学这类。
twitter得出的表述circa 20142003年,《统计数据数据自然期刊》曾明确提出:“简而言之的‘统计数据数据自然科学’,指的是这些任何人与统计数据数据有关的文本”。为此,我则表示赞成,那时所有人都难以与统计数据数据拆分。
后,对统计数据数据自然科学的表述便不断涌现,比如Conway的哈恩图,和Mason和Wiggins的经典之作看法。
Drew Conway对统计数据数据自然科学的表述维基上对统计数据数据自然科学的表述更吻合于我给小学生研习的文本:
统计数据数据自然科学仅是一类基本概念,它紧密结合了语言学、统计数据数据挖掘、机器自学或其有关方式,意在借助统计数据数据对前述现像展开“认知和预测”。
简单来讲:统计数据数据自然科学是两门将统计数据数据显得管用的学科专业。
那时你也许不禁会问,“这会不会太简单了,‘管用’是不是就能包涵所有的名词呢?”
先看下图,该图文本与维基给出的表述十分契合:
这些都是甚么,他们又如何知道处于图中所描述的哪个阶段呢?
逻辑学家和机器自学工程师的区别不在于前者采用R,而后者采用Python。由于众多原因,按照SQL、R、Python展开分类是不合理的,其中最关键的原因是软件会更新。目前,已经可以用SQL来处理机器自学问题。
新手依旧喜欢采用此种方式展开区分,甚至很多大学课程也是如此安排,但这不够合理。并且,最好不要采用直方图、t检验和神经网络展开分类。假如你足够聪明,并且拥有自己的看法,你可以采用相同的演算法解决所有的数学自然科学问题。
我建议可按如下方式展开区分:
None-One-Many
这究竟指的是甚么呢?没错,就是决定!当所有你需要的事实对你可见时,你可以通过描述性预测做出尽可能多的决定。
他们的行动和决定会影响到他们周围的世界。
接下来他们将继续探讨如何让统计数据数据显得管用。对我来说,管用的基本概念与影响世界的行动紧密相连接。举个形象的例子:假如我们相信圣诞老人的存在,那圣诞老人那个基本概念就不关键了,除非它可能会以某种方式影响我的行为。然后,取决于此种行为的潜在后果,它可能开始显得非常关键。
下图是决策导向图,您可以通过以下三步让统计数据数据显得管用。
统计数据数据挖掘
假如你不知道你要作何决定,最好的办法就是去寻找灵感。这就是简而言之的统计数据数据挖掘、统计数据数据挖掘、描述性预测、探索性统计数据数据挖掘或知识辨认出。
预测的黄金准则:只对你所见的下结论。
除非你知道如何制定你的决策,否则就从寻找灵感开始吧。做法很简单,只需要你将统计数据数据集想象为你在黑暗的房间中辨认出的一堆底片。统计数据数据挖掘就是让设备尽可能快地公开所有的图片,这样你就能看到这些图片上是否有甚么鼓舞人心的东西。和照片一样,不要把你看到的东西想得太严肃。你没有拍这些照片,所以你对屏幕之外的东西了解不多。统计数据数据挖掘的黄金法则是:只对你能看到的做出结论,不对你看不到的做出结论,因为你需要统计数据统计数据数据和更多的专业知识。
除此之外,你还应尽力做到最好。统计数据数据挖掘的专业知识是通过检查统计数据数据的速度来判断的,不要迷恋这些看似有趣的东西。
暗房一开始很吓人,但其实也没甚么大不了的。只要学会操作设备就行。这是R语言的教程,这是Python语言的教程。当你开始玩得开心时,你可以称自己为统计数据数据挖掘师,当你能够以闪电般的速度曝光照片和所有其他类型的统计数据数据集时,你就可以称为专家预测师。
统计数据推断
为一名语言学专业的本科生和研究生,我认为语言学推论(简称语言学)是这四个领域中最难且最具哲学思想的。想要做好它需要花费不少的时间。
假如你打算做出高质量且风险可控的决策,由于决策不仅仅依赖你所得到的统计数据数据,此时你需要在你的预测团队中加入统计数据技能。
在情况不确定的时候,或许语言学能够改变你的想法。
机器自学
机器自学从本质上来讲,是采用示例而非指令来同时实现操作的。我也曾写过一些关于机器自学的文章,包括机器自学与人工智能有何不同、如何入门机器自学、企业运用机器自学的经验教训和向孩子介绍监督自学
等。
统计数据数据工程
统计数据数据工程指的是将统计数据数据传递给统计数据数据自然科学团队的工作。它这类就是一个复杂的领域,通常而言,它更吻合于软件工程,而不是语言学。
统计数据数据工程与统计数据数据自然科学的差异是前后的区别。
决策智能
决策智能是关于决策的,包括基于统计数据数据的大规模决策,这使得它变成了两门工程学科专业。借助社会和管理学科专业的看法,增强统计数据数据自然科学的应用。
决策只能是社会和管理学科专业的组成部分。换句话说,它是这些统计数据数据自然科学的超集,而不涉及为通用用途创建基本方式之类的研究工作。
以上为译文,由阿里云云栖社区组织翻译。
文章原标题《What on earth is data science?》
作者:Cassie Kozyrkov,译者:Elaine,审校:袁虎。
文章为简译,更为详细的文本,请查看原文。
本文为云栖社区原创文本,未经允许不得转载。