数据分析和数据科学的五大不同之处

2023-08-23 0 832

翻译者:陈峻

在大统计数据的世界里,您可能会经常听到两个词汇:统计数据自然科学(Data Science)和统计数据挖掘(Data Analytics)。它虽然从字面有些相近,但是在大统计数据的大背景下它强调的是不同的能力和专精技能各方面。上面,我将从业余重大决策与总体规划的视角,和您探讨二者之间的差别。

数据分析和数据科学的五大不同之处

一、自然科学知识贮备

不论是统计数据挖掘却是统计数据自然科学应用领域领域,都正在变得更为丰富、更为规范化。因此,如果您想进入这两种业余应用领域领域中的任何一种,都须要搞好充份的预备,以满足用户每项实际组织工作的需求。其中:

统计数据挖掘

统计数据挖掘应用领域领域的有关组织工作,常常须要预先对RDBMS(关系统计数据库信息系统,Relational Database Management System)和操作统计计算机程序商业模式(Structure Schema)的SQL、和查阅合作开发等各方面有所介绍。与此同时,您也须要具有使用R或Python词汇,展开统计程式设计的有关自然科学知识。除此之外,机器学习(Machine Learning,ML)、人工智慧(Artificial Intelligence,AI)、自订演算法的合作开发、和紧紧围绕着信息搜集与储存的统计数据处理自然科学知识,也会让您达到四两拨千斤的效用。具体来说,您须要拥有IT、计算机自然科学、微积分、和词汇学的有关应用领域自然科学知识与专精技能。

统计数据自然科学

统计数据自然生物学家常常具有计算机自然科学、科技、应用领域微积分或词汇学的教育大背景。那些核心理念自然科学知识能为您积极开展提供、搜集、组织、处理和建模业务统计数据,搞好预备。与此同时,您也能介绍并掌控有关统计数据建模、如前所述API的统计数据搜集与预备等各方面的专精自然科学知识。那些对于您积极开展开拓性统计数据挖掘,遵从和建立数学模型,和Kangra展开订制化设计与试验等组织工作,都十分有益于。除此之外,您在如前所述AI的预测性建模时,后面提及的ML和AI应用领域领域的有关专精技能也总之是技不压身的。

2.组织工作配角和职责

不论是统计数据挖掘师却是统计数据自然生物学家,根据专精水平和企业性质的差别,他们的日常生活配角和组织工作职责也会略有不同。主要充分体现在:

统计数据分析

统计数据挖掘师常常主要聚焦于分析、建模、和挖掘那些特定于业务的统计数据。其配角职责包括:

清理、处理、验证、和例证(exemplify)统计数据的完整性对大型统计数据集展开开拓性统计数据挖掘实施ETL(抽取extract、转换transform、加载load)管道,并展开统计数据挖掘使用逻辑回归、KNN(K最邻近,K-NearestNeighbor分类演算法)、随机森林、和重大决策树,展开统计分析在编写自动化代码的与此同时,构建和管理机器学习(ML)库使用ML工具和演算法获得新的统计数据洞见识别统计数据数学模型,进而做出明智的、以统计数据为支持的预测

统计数据自然科学

统计数据自然科学主要涉及到从业务的上下文统计数据中,获得洞见并得出推论。其配角职责包括:

搜集和解释统计数据识别统计数据集中的有关商业模式执行如前所述SQL的统计数据查阅和子查阅使用SQL、Python、SAS(统计分析软件)等RDBMS工具去查阅统计数据熟练掌控各种全面性、规范性、描述性和诊断性的分析工具掌控Tableau和IBM Cognos Analytics等建模工具的使用

3.基本专精技能组合

由于这两个配角都属于专精应用领域领域,因此它须要特定的专精技能集,才能胜任日常生活的基本组织工作。具体而言:

统计数据挖掘

除了具有问题解决能力的中级统计(intermediate statistics)自然科学知识和高级分析专精技能外,统计数据挖掘师的专精技能还包括:

能够通过Microsoft Excel和SQL统计数据库,对统计数据展开切片和切块运用商业智能工具生成有关报告通过运用Python、R和SAS等工具,来管理、操作和使用统计数据集相对于IT工程经验,统计数据挖掘师更须要掌控学习统计、统计数据库管理、统计数据建模、和预测分析等专精技能。

统计数据自然科学

作为统计数据自然生物学家,您除了须要精通微积分、高级词汇学、全面性建模、和机器学习之外,还须要掌控如下应用领域领域的软件自然科学知识:

Hadoop和Spark针对大统计数据工具的专精自然科学知识SQL、NoSQL和PostgreSQL统计数据库各方面的专精自然科学知识介绍统计数据可视化工具和诸如Scala和Python之类的词汇

4.工具谱

常言道:“工欲善其事,必先利其器。”好的工具不论是对于统计数据挖掘,却是统计数据自然科学都是至关重要。为了便于下载和选用,我将当前市场上的工具,有针对性地展开了分类:

统计数据挖掘

统计数据建模类:Splunk、QlikView、Power BI、和TableauETL类:Talend大统计数据处理类:Spark和RapidMiner统计数据挖掘类:Microsoft Excel、R、和Python

统计数据自然科学

应用领域统计数据自然科学类:SAS、KNIME、RapidMiner、PowerBI、和DataRobotETL类:Apache Kafka大统计数据处理类:Apache Hadoop、Spark统计数据建模类:Tableau、BigML、Trifacta、QlikView、MicroStrategy、和Google Analytics统计数据挖掘类:Microsoft Excel、Apache Flink、SAP Hana、MongoDB、MiniTab、和SPSS程式设计类:R、Julia、和Python程式设计库类:可用于针对如前所述Python统计数据建模的TensorFlow

5.业余机会

有了后面的信息,您一定想知道在企业中,会有哪些适合统计数据挖掘和统计数据自然科学应用领域领域的热门业余可供选择呢?

统计数据挖掘

商业智能分析师统计数据挖掘师定量分析师统计数据挖掘顾问运营分析师营销分析师项目经理IT系统分析师运输物流专家

统计数据自然科学

统计数据挖掘师统计数据工程师统计数据库管理员机器学习工程师统计数据自然生物学家统计数据架构师统计员业务分析师统计数据和分析经理

小结

根据上述比较,我们不难发现企业对于统计数据自然生物学家本身、和专精技能上的要求,要比对普通统计数据挖掘师的要求高出一些。不过,在职场上,人们通常会以统计数据挖掘师的身份开始他们的业余生涯,然后再逐渐转向统计数据自然科学应用领域领域。对于初学者而言,您也能从统计数据架构、和统计数据工程的有关职位开始,不断打磨和历练自己,最终成为该应用领域领域的专家。

相关文章

发表评论
暂无评论
官方客服团队

为您解决烦忧 - 24小时在线 专业服务