13张图看6年来数据科学概念之争

2023-05-26 0 780

大统计数据数据季刊经典作品 转发具体内容明确要求见variations

原作 | David Taylor

文言 | Aileen  译者 | Aileen  校订 | 黄念

萨德基:统计数据数据自然科学是个十分火热但表述仍旧模糊不清的基本上概念,天下人都在谈及,但是它究竟是甚么?或是那个学科专业与甚么样应用领域领域有关?或许并没有明晰的讲法。

2010年起,Drew Conway已经开始用两张哈恩图(即用相同的圆盘表明原素子集重合地区的库尔)则表示统计数据数据自然科学,后,相同的统计数据数据自然生物学家也依照他们对统计数据数据自然科学的认知对这一哈恩图展开了相同某种程度的删去和修正。

Drew Conway的第三张哈恩图迄今仍然是许多统计数据数据自然生物学家最普遍认可的对统计数据数据自然科学的基本上叙述,这那哥确切的表明了,统计数据数据自然科学最有关科学知识源自三大此基础应用领域领域:微积分和统计数据科学知识、计算机自然科学、金融创新行业应用领域科学知识。

大统计数据数据季刊自2013年设立年来就把这那哥做为文言和撰稿关键手册,深入细致的听众能辨认出他们的每一首诗基本上上都走不下这三大应用领域领域:微积分和统计数据、计算机自然科学和相关金融创新行业的应用领域(他们的医疗保健、金融创新等时评),获益匪浅,也期望这那哥、这首诗能给你一个统计数据数据自然科学更辽阔自上而下的基本上概念。

本文用13张经典哈恩图展示了统计数据数据自然科学那个应用领域领域,你最喜欢哪两张?你觉得哪那哥最能代表你对统计数据数据科学的认知,在variations留言告诉他们吧。

◆ ◆ 

统计数据数据自然科学是一个表述十分模糊不清的词语。我听到的一些表述有——

“这是一项需要比大多数统计数据学家更多的编程技巧,和比程序员更多的统计数据统计数据数据技能的工作。”

“是应用领域统计数据,但在旧金山却不是。”

“有人突然决定在他们的名片上印上‘统计数据数据自然生物学家’这几字,然后靠着那个涨了工资。”

就我个人而言,我最近决定称呼他们为统计数据数据矿工来避免争议。(无论如何,统计数据数据矿工并不时髦。)

统计数据数据自然科学是一个寻找表述的金融创新行业,人们展开着许多相同的尝试来表述它也不足为奇。

做为一个充满着统计数据数据书呆子而且对可视化情有独钟的应用领域领域,许多人在尝试表述时使用哈恩图也是不足为奇。

1. 2010年·Drew Conway版

13张图看6年来数据科学概念之争

他的个人博客在2013年因为发表了统计数据数据自然科学哈恩图而火了起来。对于Conway,图的中心是统计数据数据自然科学。关于下面的那个圈“实质性专业(Substantive Expertise)”的含义(我接下来会进一步解释)有过一些争议:我只能说,如果是Conway的意思不是我所说的应用领域领域科学知识(例如物理学)而是其他的东西,那么他选择的那个名字确实不怎么样。

因此,假如应用领域领域科学知识是他的意思,至少那个想法的一部分是:比如一个物理学家,本来具有物理和微积分/统计数据的专业科学知识,但缺乏黑客科学知识(我见过不少物理学家也有黑客科学知识,故而那个现象现在并不那么普遍了);机器学习专家有时会在缺乏对要展开分析的事情所在应用领域领域科学知识情况下,对他们要分析的事情应用领域算法(这和我第一次在一个全新的产业里起步建立模型时的情况一模一样,我不得不作了许多科学知识补充);还有的人能编程,并且知道他们应用领域领域内的科学知识,但却没办法知道甚么时候是偶然,甚么时候是一个统计数据上显著的结果,这样的人是很危险的;他们给出的解决办法可能会是非常错误的,导致他们公司大量的经济损失。

2.2012年 Brendan Tierne版

那个图……确实看起来有点乱。顺便说一句,KDD代表科学知识辨认出和统计数据数据挖掘(Knowledge Discovery and Data Mining)。尽管如此,统计数据数据挖掘也有他们的圈。我欣赏他在这里的所作所为,这里为了说明统计数据数据自然科学是个多学科专业的应用领域领域,统计数据数据自然科学的价值在于其所需技能的广度。显然,这些技能中有一个是神经计算(Neurocomputing) ,这或许也有点太…..具体内容了。

13张图看6年来数据科学概念之争

注:

KDD:Knowledge Discovery and Data Mining,科学知识辨认出和数据挖掘。

AI:Artificial Intelligence,人工智能。

3. 2013·Ulrich Matter版

紧跟着Conway的脚步,Ulrich Matter也在2013年同一个月内在博客上发表了他们的版本。

他把Conway的版本沿对角线做了个翻转,把“实质性专业”指定为社会自然科学(他的应用领域领域),把“ 黑客能力(Hacking)” 改成“计算机自然科学” (你能认知为甚么有人会不想被定性为一个黑客,虽然我本人没意见),由于一些原因,他把“ 微积分与统计数据” 改成了“ 定量方法(Quantitative Methods)” 。更关键的是,他把在Conway版本中本应该是“机器学习”的地方改成了“统计数据数据自然科学”——这是一个有趣的差别。有些统计数据数据自然生物学家专注于一个应用领域领域,也有些人是通才(这些人通常在一个应用领域领域已经开始,但一发不可收拾,像我这样的:我一已经开始在化学金融创新行业而现在我在保险金融创新行业)的统计数据数据自然生物学家。此外,他显然对“危险区”那个词感到不舒服,将其更改为…一个问号。但很显然,最关键的是图的中心:统计数据数据驱动计算[社会](Data-driven Computational [Social] Science)。

13张图看6年来数据科学概念之争

他们可以说它有点…罗嗦?他还在“传统研究”的前面加上了“实验性”那个词。

4.Joel Grus版

爱德华·斯诺登消息传出后, Joel Grus提供了那个混乱的版本。现在他们进入这种四个圈的哈恩图应用领域领域,第四个圈就是很讨厌的。

13张图看6年来数据科学概念之争

注:

NSA:National Security Agency,国家安自上而下。

5.2013年·Harlan Harris版

2013年9月,Harlan Harris用了那个图来处理统计数据数据产品,而不是统计数据数据自然科学。

自然科学/黑客”仍然做为“ 软件工程”存在。此外,关键的是Harris在统计数据圈上增加了预测分析和可视。统计数据圈和软件工程圈的交集是实际应用领域的工具。

13张图看6年来数据科学概念之争

6.2014年·Steven Geringer版

2014年1月,Steven Geringer提供了一个修正,不再像Conway那样把统计数据数据自然科学放在中间三路交叉口,而是称整个事情为“统计数据数据自然科学”, 三个圈的交界处为独角兽(意思是像一个神兽一样,传言存在,但从来没有人在野外亲眼看到。)

这是…有点怪异,如果按哈恩图解来说。我想我知道他想要干吗。当我第一次听到有人被称为统计数据数据自然生物学家,我经常听到还击,“难道不是所有的自然生物学家,顾名思义,都是统计数据数据自然生物学家?”诚然,任何自然科学都不能没有统计数据数据处理,不过,统计数据数据自然科学,而十分模糊不清的,不能是一个总称。

另外,我很抱歉,但你能看到他的鼠标箭头还在截屏图上呢。

13张图看6年来数据科学概念之争

7.2014年·Michael Malak版

在2014年2月,Michael Malak增加了第四个圈,声称Conway在说“实质性专业”时,意思不是应用领域领域科学知识。

依照Malak的讲法,当涉及到“实质性专业识:“你继续用那个词。我不认为它是你认为的意思。” Malak把它分成应用领域领域专业科学知识,和……呃,和某一个应用领域领域的科学知识比如社会自然科学。也许是我想太多,但我不明白他们的区别。我也不知道他想用“整体的传统研究”表达甚么。自然科学统计数据数据,再次回到了独角兽的位置,有三个危险地区(其中一个还是双重危)。看起来每个人都讨厌“黑客”那个词。

13张图看6年来数据科学概念之争

8.Vincent Granville

我的下一个例子源自Vincent Granville,他于2014年4月转发了Gartner的经典作品,但我不知道其原作的具体内容日期。

这是统计数据数据自然科学解决方案,而不是统计数据数据自然科学本身的哈恩图; 因此,统计数据数据自然科学是其中一个圈,与其他的能力(通常不属于同一个人,但期望在同一个团队里)是IT技能和业务技能。有点困扰我的是,文字标签指着每个圈里非常具体内容的位置,但实际位置却是任意的。

13张图看6年来数据科学概念之争

9.Shelly Palmer

Shelly Palmer在赫芬顿邮报上客串博客中发表了他他们书里的那个图:

13张图看6年来数据科学概念之争

10.2015年·Stephan Kolassa版本

在2015年11月,StackExchange统计数据数据自然科学用户Stephan Kolassa想出了我个人的最爱的图,其在Conway的版本上加了“交流”,并把“实质性专业”改成了“业务”。

关于他的那个成果,在那个测试版发布论坛上得到了21个“赞”(我就是其中之一)。他的分类都还不错。我想我能被归入“好的顾问”这一类。或可能是“平庸顾问”。或是是个“用力过猛”的顾问?

是的,这才是一个四圈哈恩图该有的样子,不是之前Malak那种不能包含交叉点的所有组合的四个同心圆。

13张图看6年来数据科学概念之争

11.2016年·Matthew Mayo与Gregory Piatetsky-Shapiro版

2016年,Matthew Mayo的博客发表了由Gregory Piatetsky-Shapiro制作的一那哥。

好吧,虽然它声称是统计数据数据自然科学的哈恩图:第一,它不是一个哈恩图;第二,统计数据数据自然科学是其中的一个圈。大统计数据数据被承认令人欣喜,不过…那个字体是啥情况?

13张图看6年来数据科学概念之争

12.2016年·Gartner版

最后(我敢肯定,我没有收集到所有的。如果你知道有哪张哈恩图我错过了,请让我知道),后来在2016年,Gartner在他的博客上重做了他那样有点繁忙的统计数据数据解决方案图,并使其更漂亮和更加基于统计数据数据自然科学。

他们兜了一圈,又回到Conway,除了“危险区”又一次所取代,这一次被改了“统计数据数据工程师”。我喜欢这次文字都指向圈的边缘,比他们以前的乱标注好多了。

13张图看6年来数据科学概念之争

13.未来的统计数据数据自然科学哈恩图:

维基百科上关于自然科学的页面有以下那个不完全是哈恩图的图:

13张图看6年来数据科学概念之争

说真的,在我看来,这是看待统计数据数据自然科学的方式。也许不是这些具体内容的技能,但它确实是相同学科专业的协同作用。不幸的是,在一门学科专业的技能有时能掩盖他们也许在另外一门学科专业科学知识的严重缺陷,从而破坏统计数据数据自然科学的名声。(在我虚度年华的青春岁月,我也许也是促成了这一现象的一分子。)

当然,那么你则需要一个非常复杂的哈恩图。

它们确实存在——

这里有一个七维级别的:

13张图看6年来数据科学概念之争

有人打算尝试一下吗?

13张图看6年来数据科学概念之争

关于转发digest.cn。

◆ ◆ 

志愿者介绍

志愿者

”,了解如何加入他们

13张图看6年来数据科学概念之争

13张图看6年来数据科学概念之争

◆ ◆ 

往期精彩该文推荐,点击图片可阅读

关于人工智能的七大常见误解13张图看6年来数据科学概念之争

13张图看6年来数据科学概念之争

13张图看6年来数据科学概念之争

相关文章

发表评论
暂无评论
官方客服团队

为您解决烦忧 - 24小时在线 专业服务