大统计数据季刊经典作品,转发明确要求见variations
原作 | David Venturi
校对 | yawei,Arcturus,
Saint,番薯,霍去病
音频 | 霍去病,海波,陈少伟,郭丽
一年前,我优先选择退出了澳大利亚最合适的计算机自然科学工程项目众所周知,借助新浪网天然资源已经开始建立属于自己的统计数据自然科学硕士学位专业课程。我意识到我能透过edX, Coursera,和Udacity自学我所须要的所有人,所以学的更快、工作效率更高,学杂费更低。
统计数据建模:Alanah Ryding
那时我相差无几忽然顺利完成了。我上了许多统计数据自然科学有关的专业课程,列席过更多专业课程的部份文本。我晓得对两个预备正式成为统计数据策略师或统计数据自然生物学家的新手而言有怎样优先选择,和怎样的专业技能是须要的。两个月前,我已经开始建立两个用赞扬驱动力的手册,用以为统计数据自然科学中的每一主轴所推荐最差专业课程。
假如你不确认统计数据自然科学专业课程进阶囊括甚么,这首诗将向你如是说。
为了制作这份手册,我花了10多个小时设法识别了截止2017年1月所有的数据自然科学的线上进阶专业课程,从它们的大纲和赞扬中提取关键信息,并为它们编制评级。除了开源的Class Central 社区和它数以千计的专业课程评分及评论的统计数据库,我没有借助其他任何帮助。
Class Central的主页
如何挑选入围专业课程
每门专业课程必须满足三个标准:
它必须教授统计数据自然科学过程(data science process),稍后会做出解释。
它必须随需应变或每两个月就推陈出新。
它必须是互动的新浪网专业课程,而不是书本或只能阅读的教材。虽然自学有许多种方式,但是这份指南主要专注于专业课程。
我们确信这个手册已经囊括了满足以上三个标准的所有重要专业课程。Udemy上有上百种专业课程,因此我们只优先选择那些评论最多和评分最高的专业课程。然而,我们仍然有可能百密一疏。所以假如我们漏掉了哪个不错的专业课程,请在评论区里告知。
我们如何评估专业课程
我们汇总从Class Central和其他评论网站得来的平均评级和评论数量,来计算每门专业课程的加权平均评分。同时我们阅读文本评论,并将其作为统计数据评分的补充。
我们基于以下两点对教学大纲进行主观判断:
统计数据自然科学过程的覆盖面。专业课程是否将某个主轴简略带过或干脆跳过不说?是否对某个主轴又倾注了太多的细节?在下个章节能看到这些过程的具体文本。
通用统计数据自然科学工具的使用。课程是不是使用Python和/或R语言等主流编程语言?虽然这些并不是必须的,但多数时候有益,因此我更偏爱这类专业课程。
Python和R语言是统计数据自然科学领域最主流的两种编程语言
统计数据自然科学过程(data science process)是甚么?
统计数据自然科学是甚么?统计数据自然生物学家做些甚么?这是统计数据自然科学进阶专业课程须要回答的基本问题。下面这张来自哈佛大学教授Joe Blitzstein和Hanspeter Pfister的示意图,概述了典型的统计数据自然科学过程,能帮助我们回答这些问题。
建模来自于Opera Solutions
我们对统计数据自然科学进阶专业课程的目标是熟悉统计数据自然科学过程,并不想对过程的某个方面涉入过深,这也是为甚么标题使用了“进阶”字眼的原因。
对每一方面,理想的专业课程都会在过程的框架内解释关键概念,如是说常用工具,并提供一些案例(动手操作会更好)。
我们只搜集进阶专业课程,因此这份手册并不包括像约翰霍普金斯大学在Coursera的Data Science Specialization或是Udacity上的Data Analyst Nanodegree这样的专项专业课程或工程项目。这些专业课程的汇编与这份手册的目的相悖:为统计数据自然科学教育寻求每一方面最合适的单独专业课程。本系列文章的最后三份手册,将详细如是说统计数据自然科学过程中的每一方面。
基本的编程、统计和概率背景是必须的
下面列出来的一些专业课程须要基础的编程、统计和概率背景。这个明确要求很容易理解,因为新的文本为进阶阶段,所以这些主轴经常要用到这些背景知识。
这些背景知识能在这份我们所推荐的统计数据自然科学就业手册的前两章(编程,统计)中获得。
我们认为最合适的统计数据自然科学进阶专业课程是——
统计数据自然科学从A到Z:现实生活中的数据自然科学(含练习)(Kirill Eremenko/Udemy)
在我们评估的20多门统计数据自然科学专业课程中,Kirill Eremenko在Udemy上的“统计数据自然科学从A到Z”不管从广度还是深度上而言都是当之无愧的赢家。它拥有3071条评论,4.5星的加权平均评分,是评分最高、评论最多的入围专业课程。
它概述了完整的统计数据自然科学过程,并提供了真实案例。音频文本为21小时,长度刚好。评论者们喜欢导师的讲解方式和文本组织方式。价格经常会跟着Udemy的优惠而变化,因此你也有可能以10美金的低价购买到该专业课程。
虽然它并不满足我们“使用通用统计数据自然科学工具”的评估原则,但是非Python/R工具的应用(gretl, Tableau, Excel)也都算恰如其分。Eremenko在解释他为甚么用gretl(一种统计软件包)时说了以下这段话,这个解释也适用于他所使用的其他工具(敲黑板划重点!):
使用gretl,我们能像在R和Python中一样建模,但却不必编程。这很重要。你们中的一些人可能已经很熟悉R语言,但还有一些人可能不。而我的目标是向你们展示如何建立稳定的模型,并且给你两个能应用于任何工具的框架。gretl能够帮助我们避免于纠结编程。
两个著名的评论者是这样写的:
Kirill是我新浪网上发现的最合适的老师。他透过生活中的案例向你解释一些常见问题,这样你就能对专业课程作业有更深的理解。他还提供了许多关于作为两个统计数据自然生物学家意味着甚么的洞见,从如何处理不充分的统计数据到向高级管理层汇报工作等。我强烈建议初级和中级统计数据策略师们自学这门专业课程。
“统计数据自然科学从A到Z”预览音频
专注于Python的精品进阶专业课程
统计数据分析进阶(Udacity)
Udacity的统计数据分析进阶(Intro to Data Analysis)是门新上线的专业课程,是受欢迎的Data Analyst Nanodegree系列中的一部份。虽然在建模方面有所欠缺,它仍然清晰地囊括了使用Python的统计数据自然科学过程。预估专业课程时间是36个小时(跨度六周,每周六小时),尽管以我个人经验看会更短。它仅有1个5星好评(译者安:那时有两个),并且免费。
该专业课程的音频制作精良,导师(CarolineBuckey)思维清晰、风度翩翩,有大量的编程小测验能强化人们在音频中学到的概念和知识。专业课程顺利完成后,学生们会为他们新学和/或提高的NumPy和 Pandas(这两个都是流行的Python库)专业技能感到自信。最后的作业(在这个单独的免费专业课程中没有,但是会在Nanodegree中得到评分和评估)是两个很好的额外补充。
Udacity导师Caroline Buckey
概述了统计数据分析过程(也叫数据自然科学过程)
一门很不错却没有赞扬统计数据的专业课程
统计数据自然科学基础(大统计数据大学Big Data University)
统计数据自然科学基础是由IBM的大统计数据大学(Big Data University)提供的有四门课的系列专业课程。这四门课分别是统计数据自然科学101、统计数据自然科学方法论、使用开源工具已经开始自学统计数据自然科学,和R语言 101。
它囊括了整个统计数据自然科学过程,并如是说了Python、R和其他开源工具。专业课程的实用价值惊人。估计须要13-18小时自学时间,具体取决于你是否参加最后一门“R 101”。当然,从这份手册的目的而言,这门课也不是必须。不幸的是,我们用于这次分析的主要评论网站上竟然两个赞扬都没有,因此我们无法基于评论做出赞扬,不过这个专业课程是免费的。
来自大统计数据大学(Big Data University)
统计数据自然科学101专业课程(统计数据自然科学基础系列专业课程)
第一模块的音频
第一名是加权评分4.5星评论超过3068条的专业课程。下面我们按评分降序排列来看看其他值得一学的专业课程。假如你对R语言感兴趣,你还能在下面找到重点教授R语言的专业课程。
Python统计数据自然科学与机器自学训练营(Jose Portilla/Udemy):着重于如是说工具使用(Phon/R和统计数据自然科学。该专业课程包含21.5小时的自学文本,1644条赞扬,综合评分4.7。专业课程价格取决于Udemy的打折力度,经常变化。
R语言统计数据自然科学与机器自学训练营 (Jose Portilla/Udemy):了Python/R和统计数据自然科学。该专业课程包含18小时的自学文本,847条赞扬,综合评分4.6。专业课程价格取决于Udemy的打折力度,经常变化。
Jose Portilla在Udemy上
设置了两个分别使用Python
和R的统计数据自然科学与机器自学的训练营
Python统计数据自然科学和机器自学(实战)(Frank Kane/Udemy):仅囊括部份知识点。专注于统计学和机器自学,长短适宜(约9个小时),语言为Pyhton。该专业课程拥有3104条评论,综合评分4.5。专业课程价格取决于Udemy的打折力度,经常变化。
统计数据自然科学进阶(Data Hawk Tech/Udemy):专业课程覆盖了统计数据自然科学的全过程,但深度有限,相当简短(仅3个小时),包含简单的R和Python如是说。该专业课程有62条评论,综合评分4.4。专业课程价格取决于Udemy的打折力度,经常变化。
统计数据自然科学应用进阶(雪城大学/Open Education by Blackboard):免费。
统计数据自然科学进阶(Nina Zumel & John Mount/Udemy):仅囊括部份知识点,但在统计数据清洗和建模方面讲解深度到位。专业课程长度适中(6小时),使用的是R语言。该专业课程有101条评论,综合得分4.3分。专业课程价格取决于Udemy的打折力度,经常变化。
使用Python的统计数据自然科学应用(V2 Maestros/Udemy):专业课程覆盖了统计数据自然科学的全过程,并且专业课程设置的每一方面都有相当的深度。长短适宜(8.5小时),使用的语言为Python。该专业课程有92条评论,综合评分4.3分。专业课程价格取决于Udemy的打折力度,经常变化。
V2 Maestros的统计数据自然科学应用专业课程
有两个版本,两个使用Python,两个使用R。
想正式成为统计数据自然生物学家?(V2 Maestros/Udemy):专业课程覆盖了统计数据自然科学的全过程,但是专业课程深度有限。专业课程时间很短(3小时),涉及的工具有限。该专业课程获得790条评论,综合评分4.3分。专业课程价格取决于Udemy的打折力度,经常变化。
洞见统计数据:统计数据分析进阶(奥克兰大学/FutureLearn):暂不清楚专业课程覆盖广度。该专业课程宣称专注于统计数据探索、发现和建模。不按需提供专业课程文本,专业课程内容为24小时(每周3个小时,总共8周)。累该专业课程获得2条评论,综合评分4分。专业课程免费,可付费获得认证证书。
统计数据自然科学进阶培训(Microsoft/edX):仅覆盖部份知识点(缺少统计数据建模部份)。使用的是Excel,鉴于这是微软认证的专业课程,也能理解。专业课程包含12-24小时的文本(每周2-4小时,总共6周)。该专业课程获得40条评论,综合评分3.95。专业课程免费,可付25美元获得认证证书。
统计数据自然科学基础 (微软/edX):专业课程覆盖了统计数据自然科学的全过程,并且每一部份都有相当的深度。专业课程囊括了R、Python和Azure ML(微软的机器自学平台)。有许多1星赞扬给到该专业课程使用的糟糕的工具(Azure ML))和导师差劲儿的授课能力。该专业课程获得67条评论,综合评分3.81分。专业课程免费,但想要认证证书须要支付49美元。
上面两个专业课程来自于微软的
在edX上的“统计数据自然科学专业认证”
使用R语言的应用统计数据自然科学 (V2 Maestros/Udemy):与之前V2 Maestros的Python专业课程类似。专业课程覆盖了统计数据自然科学的全过程,并且有相当的专业课程深度。专业课程长度适宜(11小时),使用的语言为R语言。该专业课程有212条评论,综合得分3.8。专业课程价格取决于Udemy的打折力度,经常变化。
统计数据自然科学进阶(Udacity):仅覆盖部份知识点,虽然覆盖的专业课程具有相当的深度。该专业课程缺少统计数据探索部份,尽管Udacity在探索性统计数据分析(EDA)方面提供两个高质量的完整专业课程。该专业课程明确要求48小时的自学时长(每周6小时,总计8周),但以我的经验而言实际会比48小时短。有评论认为专业课程缺乏高级文本。感觉讲述比较零散,使用的语言为Python。该专业课程有18个评论,综合得分3.61。专业课程免费。
使用Python的统计数据自然科学进阶(密歇根大学/Coursera):仅涉及部份知识点。缺少建模和建模部份,尽管在专业课程“专注Python的应用统计数据自然科学”的#2和#3部份覆盖了这两部份文本,但是自学所有三门专业课程对本文而言过于深入了。使用的语言是Python。专业课程时长为4周。该专业课程有15条评论,综合得分3.6分。包含免费和付费选项。
密歇根大学在Coursera上教授
“专注Python的应用统计数据自然科学”
统计数据驱动力决策 (普华永道/Coursera):仅涉及与商业有关的部份知识(缺少建模部份)。如是说了多种工具,包括R、Python、Excel、SAS和Tableau。专业课程时长4周,获得2条评论,综合得分3.5分。包含免费和付费选项。
统计数据自然科学速成(约翰霍普金斯大学/Coursera):对统计数据自然科学全过程的两个非常简明的概括。但对本手册而言太过于简明了。专业课程时长2个小时。该专业课程得到19个评论,综合评分3.4分。包含免费和付费选项。
统计数据自然生物学家的工具箱(约翰霍普金斯大学/Coursera):对统计数据自然科学全过程的两个非常简明的概括。可看作是针对Johns Hopkins大学统计数据自然科学专业的基础专业课程。宣称的专业课程时长为4-16小时(每周1-4小时,总共4周),但有评论提到该专业课程2小时即可顺利完成。该专业课程获得182个评论,综合评分3.22分。包含免费和付费选项。
统计数据管理与建模(卫斯理大学/Coursera):仅涉及部份知识(不包含建模)。专业课程时长4周,高价值产出。使用Python和SAS。该专业课程有6条评论,综合得分2.67分。包含免费和付费选项。
下列专业课程截至2017年1月没有任何评论。
CS109 统计数据自然科学(哈佛大学):专业课程覆盖了统计数据自然科学的全过程并有不错的专业课程深度(对本手册而言可能有点过于深奥了)。该专业课程是完整的12周本科生专业课程。专业课程方向很难,因为起并不是
商业统计数据分析进阶 (科罗拉多大学博尔德分校/Coursera):e chain”)。专业课程时长为4周。专业课程讲述了不少工具,但仅深度覆盖了SQL。没有评论统计数据,包含免费和付费选项。
统计数据自然科学进阶(Lynda):专业课程覆盖了统计数据自然科学的全过程,但是深度有限。时长很短(3小时)。专业课程如是说了R和Python。没有评论统计数据。具体专业课程费用由Lynda决定。
结语
本文是六部曲系列的第三首诗,囊括了引领你进入统计数据自然科学领域的最合适的新浪网专业课程。我们已经在第一首诗中囊括了编程,第二篇中囊括了统计学和概率论。该系列的剩下部份将囊括统计数据自然科学的其他核心部份:统计数据建模和机器自学。
👇戳
ed-all-the-best-data-science-intro-courses-based-on-thousands-of-data-points-db5dc7e3eb8e
本文仅代表原作观点
大统计数据季刊和文中涉及的
所有专业课程均无利益关系
关于转发[email protected]。志愿者如是说志愿者”了解如何加入我们
往期精彩文章点击图片阅读文章