去年,我自学了数据科学,收集了数百个在线资源,每天学习6-8小时。同时,白天还在日托中心工作,拿的是***工资。尽管我资金不足,但我的目标是追求我热爱的事业。所以在过去的几个月里我完成了一些事情。我推出了我的网站,在主要的在线数据科学网站KDnuggets上得到了推荐,并在一个竞争激烈的计算机科学研究生项目中获得了奖学金。网址:https://harrisonjansma.com/我在本文中提供了一些指导和建议,以便您可以自学数据科学课程。我还提供了一些参考工具,希望能帮助那些想学习的人在数据科学领域追求更有激情的职业。快速说明:当我说“数据科学”时,我指的是将数据转化为现实世界行为的工具集合,包括机器学习、数据库技术、统计、编程和特定领域的技术。开始学习之旅的一些资源Internet是一团糟。从中学习就像从消防水龙带的末端喝水一样。有更简单的选择可以为您解决问题。Dataquest、DataCamp和Udacity等网站将教您数据科学的技巧。这些站点中的每一个都为您创建了一个教育计划,您可以按主题学习,而您几乎不需要课程计划。问题是这些网站都不便宜,它们不会教你如何在工作环境中应用这些概念,它们会阻止你继续探索你的兴趣和激情。edX和coursera等替代方案免费提供特定主题的一次性课程。如果您可以在视频环境或课堂环境中做好,这些是学习数据科学的最佳方式。您可以从第一个URL获得一些数据科学课程,或者您可以从DavidVenturi的博客或OpenSourceDSMaster找到一些免费课程。地址:https://www.class-central.com/subject/data-science大卫文丘里:https://medium.com/@davidventuri/i-dropped-out-of-school-to-create-my-own-data-science-master-s-here-s-my-curriculum-1b400dcee412开源DS大师:http://datasciencemasters.org/如果你只需要读书就可以学好,我推荐你阅读《Data Science From Scratch》。本书是一个完整的学习计划,可以作为在线资源的补充。您可以在线免费获得本书的pdf版本,或在亚马逊上购买印刷版。在线PDF:http://math.ecnu.edu.cn/~lfzhou/seminar/[Joel_Grus]_Data_Science_from_Scratch_First_Princ.pdf这只是学习数据科学的免费资源的一小部分,还有更多。为了更好地了解学习时需要掌握的技能,我将在下面详细介绍更广泛的学习指南。这些内容不仅仅是课程列表或者书籍列表,而是一些更高级的内容。课程指南数据科学课程指南1.PythonProgramming编程是数据科学的必备技能。熟悉Python的语法并学习如何以不同的方式(Jupyternotebook、命令行和IDE)运行Python程序。我花了大约一个月的时间查看Python文档、Hitchhiker的Python指南以及CodeSignal上的代码问题。Python文档:https://docs.python.org/3/tutorial/Python漫游指南:https://docs.python-guide.org/intro/learning/CodeSignal:https://codesignal.com/提示:注意程序员用来解决问题的常用技巧(又名“算法”)。2.Statistics&LinearAlgebra这是机器学习和数据分析的先决条件。如果您已经足够了解它,请花一两周的时间来复习关键概念。特别注意描述性统计。了解统计数据是一项非常重要的技能。3.Numpy、Pandas和Matplotlib了解如何加载、操作和可视化数据。掌握这些库对于您的个人项目至关重要。快速提示:您不需要记住每个方法或每个函数的名称,记住这些东西需要练习。如果你忘记了,谷歌一下。浏览以下三个文档:Pandas文档:http://pandas.pydata.org/pandas-docs/stable/Numpy文档:https://docs.scipy.org/doc/numpy/user/index.htmlMatplotlib教程:https://matplotlib.org/tutorials/index.html记住,实践出真知!4.机器学习学习机器学习算法的理论和应用。然后将学到的概念应用到现实世界中您关心的数据中。大多数初学者都是从使用UCIML存储库中的小型数据集开始的。他们处理这些数据并在这些数据上练习ML教程。Scikit-learn文档有一些关于常见算法应用的优秀教程。我还找到了一个关于ML背后理论的很好的教学播客。您可以在锻炼或通勤时收听。地址:http://ocdevel.com/mlg5。在生产系统上工作意味着能够获取真实世界的数据并进行分析。为此,您需要学习如何使用业务计算资源来获取、转换和处理数据。AWS、谷歌云和微软Azure是数据科学课程中教授最少的部分,因为你将使用的具体工具在很大程度上取决于你以后要进入的行业。但是数据库操作是一项必需的技能。您可以在ModeAnalytics或Codecademy上学习使用代码操作数据库。您也可以在DigitalOcean上实现自己的数据库。另一个常见的技能是版本控制。您可以通过创建一个GitHub帐户并每天使用命令行提交代码来轻松掌握此技能。在学习其他技能时,一定要考虑到你的兴趣和爱好。例如,如果您对Web开发感兴趣,请查看该行业公司使用的工具。实施课程的建议1.获得概念的速度比学习概念的速度快事实上,有数以千计的网页和论坛解释了常见数据科学工具的用法。因此在线学习时很容易分心。当您开始研究一个主题时,请牢记您的目的。如果你还没有背过,你可能会被任何吸引眼球的内容所吸引。解决方案:创建一个收藏夹来保存所有你感兴趣的网络资源。这样你可以在以后查看保存的材料时首先关注你现在关心的主题。如果这样做,您将获得一条有序的学习路径,告诉您要关注的重点。请注意,当您探索感兴趣的新主题时,您的阅读列表可能会迅速增长到数百个。但是等等,请看第二个建议。2.别担心,这是一场马拉松,而不是短跑如果你想在数据科学领域取得成功,你必须将学习视为终生的过程。请记住,学习过程就是您的回报。在整个学习过程中,您将探索自己的兴趣并发现更多关于推动您学习的因素。你学得越多,你从中获得的乐趣就越多。3.学习->应用->重复不要只学习一个概念然后继续下一件事。在您将其应用到现实世界中之前,学习过程不会停止。并非每个概念都必须在您的研究中占有一席之地。坚持下去并记住你正在学习,这样你才能对世界产生影响,这一点很重要。4.建立一个投资组合,告诉别人你可以信任。当谈到投资组合时,怀疑是你在学习数据科学时将面临的最大困境之一。这种怀疑可能来自于别人,也可能来自于你自己。您的作品集是向世界展示您有能力并对自己的能力充满信心的一种方式。因此,建立投资组合是学习数据科学时最重要的事情。一个好的作品集可以让你找到一份好工作,让你成为一个更自信的数据科学家。您是否从头构建了自己的Web应用程序?创建了自己的IMDB数据库?写一篇有趣的医疗保健数据分析?把它们放在你的投资组合中。请注意,书面内容需要可读,代码有良好的文档记录,作品集本身也需要好看。这是我的投资组合。公开你的作品集的一个简单方法是创建一个GitHub存储库,其中包含一个好的自述文件(摘要页面)和相关的项目文件。GitHub作品集需要美观且简单。如需更高级的产品组合,请查看GitHub-IO以托管您的免费网站(示例:https://alexisbcook.github.io/#blog)5.数据科学+_______=充满激情的职业数据科学是一系列工具的设计改变世界。有构建计算机可视化系统来诊断医学图像的数据科学家,也有遍历数十亿数据以寻找网站用户偏好行为模式的数据科学家。数据科学的应用永无止境,这就是为什么找到您感兴趣的应用领域很重要。如果你找到了自己感兴趣的话题,你会更加致力于做出一个好的项目。因此,在学习时,请注意让您兴奋的项目或想法。一旦你花时间学习,试着把这些点联系起来。找到让您着迷的项目之间的相似之处,然后花一些时间研究涉及此类项目的行业。找到您感兴趣的行业后,将获得该行业所需的技能和专业知识作为您的目标。如果你能做到这一点,你就已经准备好将你在学习中付出的努力变成充满激情和成功的职业。总结如果你喜欢探索世界,如果你对人工智能着迷,那么无论你目前的情况如何,你都可以加入数据科学行业。为了激励你的学习之旅,你需要坚持不懈和自律。如果你是那种可以推动自己提高的人,你可以自己掌握这些技能。毕竟,这就是数据科学家的全部职责。好奇、自我驱动并热衷于寻找答案。原文地址:https://towardsdatascience.com/how-to-learn-data-science-if-youre-broke-7ecc408b53c7(id:almosthuman2014)”]点此阅读本作者更多好文
