五个给机器学习和数据科学入门者的学习建议

2023-05-26 0 668

Liziertowardsdatascience

译者:Daniel Bourke

电脑之心校对

参予:韩放、一鸣

都说做两件事最合适的最佳时机就是「现在」,但从何早已开始常常会编出一批人,更别说是想进阶统计数据自然科学和机器自修的好友了。责任编辑是一则科学普及普及教育该文,译者以新手的视点,为反之亦然想「入坑」的听众们提供更多了许多提议,除了许多能赢得的自修天然资源。「我想自修电脑自修和人工智慧,该从哪早已开始呢?从这儿早已开始。

五个给机器学习和数据科学入门者的学习建议

一年前,我早已开始在网路上自修电脑自修,因此透过 YouTube 和网志撷取了我的自修操作过程。我并不晓得我在做甚么,在下定决心早已开始自修电脑自修以后我从来没写过标识符。当现代人辨认出我的经典作品,他们一般来说会好友圈并发问。我不一定晓得大部份的标准答案现代人最常问的难题是:「该从哪早已开始?」,其二是:「我须要啥微积分此基础?那时中午我就提问了一大堆这样的难题。没人说我他早已早已开始自修 Python 并急于自修电脑自修了,但不晓得下一步棋该做甚么。「我早已自修了 Python,下一步棋该做甚么?假如你想成为两个电脑自修专业人士,却不晓得是不是写标识符不然,能把责任编辑当做两个概要。我的自修艺术风格是标识符优先:先把标识符运行起来,再依照须要自修方法论、微积分、统计以及概率等方面的东西,而不是一早已开始就学方法论。记住,早已开始自修电脑自修你会面临很多阻碍。别急,慢慢来。把这篇该文添加到收藏夹,以便随时参考。我倾向于使用 Python,因为我是从 Python 早已开始的,因此一直在持续使用它。你也能用其他语言,但责任编辑的大部份步骤都是基于 Python 的。自修 Python、统计数据自然科学工具和电脑自修概念问我难题的那些邮件译者们说他们早已学了许多 Python。但这一步棋也反之亦然适用于新手。花几个月的时间自修 Python 编程和不同的电脑自修概念。这两部分知识你都会须要。在自修 Python 编程的同时,练习使用 Jupyter 和 Anaconda 等统计数据自然科学工具。花几个小时来研究一下,它们是用来做甚么的以及为甚么要使用它们。自修天然资源

人工智慧要素 (https://www.elementsofai.com/)—人工智能和电脑自修主要概念概述。

Coursera 上的 Python 教程—(https://bit.ly/pythoneverybodycoursera) 从头自修 Python。

透过 freeCodeCamp 自修 Python (https://youtu.be/rfscVS0vtbw)—两个视频涵盖了 Python 大部份主要概念。

Corey Schafer 的 Anaconda 教程 (https://youtu.be/YJC6ldI3hWk)—两个视频学会 Anaconda(统计数据自然科学和电脑自修须要的配置环境)。

Dataquest 的新手 Jupyter Notebook 教程 (https://www.dataquest.io/blog/jupyter-notebook-tutorial/)—一则该文学会启动和运行 Jupyter Notebook。

Corey Schafer 的 Jupyter Note 教程 (https://www.youtube.com/watch?v=HW29067qVWk)—两个视频学会使用 Jupyter Notebook。

自修透过 Pandas、Numpy 和 Matplotlib 进行统计数据分析、操作和可视化一旦你早已掌握了许多 Python 技巧,就会早已开始想自修如何处理和操作统计数据,为了实现这一目的,你须要熟悉 Pandas、Numpy 和 Matplotlib。

Pandas 能帮助你处理二维统计数据,类似 Excel 文件里的信息表,包含行和列。这类统计数据被称为结构化统计数据。

Numpy 能帮助你进行数值计算。电脑自修把你能想到的大部份东西都转化成数字,进而在这些数字中寻找模式。

Matplotlib 能帮助你绘制图形和可视化统计数据。理解表格中的一大堆数字对人类来说可能很困难。我们更喜欢看到有一条线穿过的图。可视化能更好得传达你的辨认出。

自修资源

Cousera 上的 Python 应用统计数据自然科学 (http://bit.ly/courseraDS)—早已开始打磨统计数据自然科学方向的 Python 技能。

10 分钟进阶 pandas (https://pandas.pydata.org/pandas-docs/stable/gettingstarted/10min.html)—快速概览 pandas 库及其部分最有用的函数。

Codebasics 的 Python pandas 教程 (https://youtu.be/CmorAWRsCAw)—该 YouTube 系列介绍了 pandas 的大部份主要功能。

freeCodeCamp 的 NumPy 教程 (https://youtu.be/QUT1VHiLmmI)—两个 YouTube 视频学会 NumPy。

Sentdex 的 Matplotlib 教程 (https://www.youtube.com/watch?v=q7Bo_J8x_dw&list=PLQVvvaa0QuDfefDfXb9Yf0la1fPDKluPF)—YouTube 系列助你学会 Matplotlib 大部份最有用的功能。

借助 scikit-learn 自修电脑自修现在你早已掌握了操作和可视化统计数据的技能,是时候自修在统计数据中寻找模式了。scikit-learn 是两个 Python 库,它内置了许多有用的电脑自修算法供你使用,它还提供更多了许多其他有用的函数来探究自修算法的自修效果。重点在于自修都有甚么样的电脑自修难题,比如分类和回归,甚么样的算法最适合解决这些难题。现在还不须要从头早已开始理解每个算法,先自修如何应用它们。自修天然资源

Data School 的基于 scikit-learn 的 Python 电脑自修 (https://www.youtube.com/watch?v=elojMnjn4kk&list=PL5-da3qGB5ICeMbQuqbbCOQWcS6OYBr5A)—两个 YouTube 播放列表教你 scikit-learn 的大部份主要函数。

Daniel Bourke 对探索性统计数据分析的简要介绍 (https://towardsdatascience.com/a-gentle-introduction-to-exploratory-data-analysis-f11d843b8184)—把你在上述两个步骤中学到的知识融合在两个项目中。提供更多标识符和视频,助你早已开始第两个 Kaggle 竞赛。

Daniel Formosso 的基于 scikit-learn 的探索性统计数据分析笔记 (https://github.com/dformoso/sklearn-classification)—以上天然资源的更深入版本,附带了两个实践上述内容的端到端项目。

自修深度自修神经网络深度自修和神经网络在没有太多结构的统计数据上最有效。二维统计数据虽然有结构,图像、视频、音频文件和自然语言文本也有,但不会太多。小贴士在大多数情况下,你会想对结构化统计数据使用一组决策树(随机森林或 XGBoost 之类的算法),而对于非结构化统计数据,你会想使用深度自修或迁移自修(使用预先训练的神经网络并将其用于你的难题)。你能早已开始把这样的小贴士用一张便条记录,然后边自修边收集这些信息。自修天然资源

Cousera 上 Andrew Ng 的 deeplearning.ai (https://bit.ly/courseradl) (https://bit.ly/courseradl)—商业上最成功的专业人士之一讲授的深度自修课程。

Jeremy Howard 的 fast.ai 深度自修课程 (https://course.fast.ai/) (https://bit.ly/courseradl)—工业界最合适的实践者之一讲授的深度自修实际操作方法。

其他课程和书籍在自修操作过程中,最理想的情况是你能用自己的小项目来练习所学的东西。这不必是复杂的,须要改变世界的事,但你能说「我用 X 做了这个」。然后透过 github 或网志撷取你的工作。github 用于展示你的标识符,网志该文用于展示你如何表达自己所做的工作。你应该为每个项目都发布一下这些内容。申请一份工作的最合适方法是你早已做完了工作要求做的事。撷取你的工作是向未来的潜在雇主展示你能力的好方法。在你熟悉了如何使用不同的电脑自修和深度自修框架之后,你能尝试透过从头早已开始构建它们来巩固你的知识。你不必总是在生产或从事电脑自修时这样做,但从内部了解事是如何工作的将有助于你建立自己的工作。自修天然资源

Daniel Bourke 的如何早已开始你自己的电脑自修工程 (https://towardsdatascience.com/how-to-start-your-own-machine-learning-projects-4872a41e4e9c)—早已开始你自己的工程可能会很难,这篇该文能给你许多指引。

Jeremy Howard 的 fast.ai 深度自修此基础 (https://course.fast.ai/part2)—自上而下自修后,本课程将帮助你从下往上填补空白。

Andrew Trask 的 Grokking Deep Learning (https://amzn.to/2H497My)—这本书将教你如何从头早已开始构建神经网络,以及为甚么你应该晓得如何构建。

Daniel Bourke 推荐的电脑自修书籍 (https://www.youtube.com/watch?v=7R08MPXxiFQ)—该 YouTube 视频整理了许多电脑自修最佳书籍。

答疑每一步棋须要多长时间?你可能会花 6 个月或更长的时间。别着急,自修新事物须要时间。作为一名统计数据自然科学家或电脑自修工程师,你正在培养的主要技能是如何针对统计数据提出好的难题,然后使用你的工具来尝试寻找标准答案。有时候你会觉得自己甚么都没学到。甚至倒退。忽略它。不要以天为单位来衡量,看看你一年后有甚么样的进步。我在哪里能学到这些技能?我在上面列出了许多天然资源,它们都是在线的,而且大部分都是免费的,类似的天然资源除了很多。DataCamp (http://bit.ly/datacampmrdbourke) 是两个很好自修网站。另外,我的 Machine Learning and Artificial Intelligence resources database (https://bit.ly/AIMLresources) 整理了免费和付费的自修资料。记住,作为统计数据自然科学家或电脑自修工程师,很大一部分工作是要解决难题。透过你的第两个作业探索这儿的每两个步骤,并创建你自己的课程来帮助自修。假如你想晓得两个自我引导的电脑自修课程的例子是甚么样子的,看看我的 Self-Created AI Masters Degree (https://bit.ly/aimastersdegree)。这是我在过去 9 个月内从零编码变成电脑学习工程师的操作过程。它不是完美的,但我的真实经历,因此你能试试。统计是不是办?微积分是不是办?概率呢?实践操作过程中你会学到这些东西的。先从标识符早已开始。把标识符运行起来。在运行标识符以后,尝试自修大部份的统计、微积分、概率知识,就像是在试图煮沸大海。它会让你退缩。假如标识符不运行,统计、微积分和概率都不重要。先运行起来,然后用你的研究技巧来验证它是否正确。证书?证书很好,但你不是为了证书而自修,而是为了提高技能。不要和我犯反之亦然的错误,不要认为证书越多代表技能越多,并不是这样的。透过上述课程和天然资源建立知识此基础,然后透过自己的项目完善专业知识(这些是课程无法传授的知识)。参考链接:https://towardsdatascience.com/5-beginner-friendly-steps-to-learn-machine-learning-and-data-science-with-python-bf69e211ade5文为电脑之心校对,✄————————————————加入电脑之心(全职记者 / 实习生):[email protected]投稿或寻求报道:content@jiqizhixin.com广告 & 商务合作:[email protected]

相关文章

发表评论
暂无评论
官方客服团队

为您解决烦忧 - 24小时在线 专业服务