免费资源,用于从头开始学习数据科学。如何开始数据科学?这个GitHub项目提供免费的学习资源,包括超详细的学习路线图、多门免费在线课程、海量数据科学项目,以及100多本免费机器学习书籍。该项目在上线几天内将获得2.4kstar。项目地址:https://github.com/therealsreehari/Learn-Datascience-for-Free#5_-expressions本项目收集了网上散落的不同资源,并按照一定的顺序组合起来,帮助数据科学初学者解决如何搜索免费和结构化的学习资源。据项目作者介绍,该项目将根据新的免费资源不断更新。数据科学家学习路线图“磨刀不误”。该项目首先详细介绍了一个数据科学路线图,列出了数据科学学习者需要掌握的内容:基础知识(矩阵和代数基础等);统计科学(概率论、贝叶斯定理等);编程;机器学习;文本挖掘/自然语言处理;数据可视化;大数据;数据采集??;数据再处理(DataMunging);工具箱。作为数据科学家需要掌握的基础知识在成为数据科学家之前,需要掌握矩阵的理论知识,理解矩阵的运算方式,熟悉矩阵的各种变换。项目作者还向我们介绍了各种数据结构,包括哈希函数、二叉树等。以二叉树为例,项目作者解释了什么是二叉树:“在计算机科学中,二叉树是一种树数据每个节点最多有两个子节点的结构,称为左孩子和右孩子。”二叉树,除了矩阵知识外,数据科学初学者还需要掌握关系代数、数据库基础知识、CAP原理、ETL等十余个知识点(部分内容还在更新中)。Statistics本课程介绍了很多关于统计学的知识,包括数据集选择、描述性统计、探索性数据分析、直方图、概率论、贝叶斯定理等。以探索性数据分析为例,项目作者从两个方面入手数据可视化与分析,为我们介绍了完成整个数据分析任务所需的开发环境、依赖库、安装方式和分析方法。点击Seaborn链接进入Seaborn主页,此图为链接主页内容。在数据分析方面,项目作者介绍了PCA降维方法,帮助学习者理解什么是主成分分析,以及如何在Python中实现。要成为数据科学家,编程离不开编程。本项目介绍需要掌握的编程语言Python、Rsetup/Rstudio等。以Rsetup/Rstudio为例,项目作者介绍了两种安装方式:Linux和Windows。但是这部分还有很多知识需要补充。待补充MachineLearning该项目还列出了掌握数据科学所需的机器学习知识,包括数值变量、分类变量、监督学习、无监督学习、训练和测试集、分类器、过拟合、偏差和方差、支持向量机等30项。以支持向量机为例,项目作者首先介绍了支持向量机的作用——可以用于分类和回归任务,然后用简单明了的语言解释了支持向量机的原理。此外,项目作者还列出了支持向量机的其他知识,读者可以通过链接自行学习。除了上述支持向量机的内容,项目作者还整理了文本挖掘、数据可视化等内容,这里不再赘述。免费在线课程本项目基于GitHub用户Developer-Y的项目,整理了大量免费在线课程资源,主要包括三个部分:人工智能、机器学习、机器人。机器学习部分细分为机器学习概论、数据挖掘、数据科学、概率图模型、深度学习、强化学习、机器学习高级课程、基于机器学习的自然语言处理与计算机视觉、时序分析、概率与统计、线性代数等。该项目提供的部分免费在线课程列表截图。从项目列表中,我们可以看到大家耳熟能详的吴恩达机器学习课程,以及来自卡耐基梅隆大学、斯坦福大学、苏黎世联邦理工学院、加州大学伯克利分校、微软等机构的丰富课程资源。人工智能开源项目此外,该项目还列出了大量人工智能开源项目,涵盖机器学习、深度学习、自然语言处理、计算机视觉等领域。该资源来自AI研究人员和数据科学家AshishPatel创建的GitHub存储库。它目前包含71个条目。点击链接获取对应的项目和代码资源。项目列表部分的屏幕截图。从目前的榜单可以看出,包括了目标检测、聊天机器人、GUI、无监督学习、回归分析、情感分析、推荐系统、数据科学、NLP、计算机视觉等细分领域的相关项目资源。封面名单会持续更新。100多本免费机器学习书籍项目作者从Insane编译了一篇机器学习书籍清单文章。该榜单是2021年1月刚刚更新的,包括大家熟悉的“花书”《深度学习》,还有图算法、自然语言处理、数据挖掘、GAN、Python等书籍。来源:https://www.theinsaneapp.com/2020/12/download-free-machine-learning-books.html项目作者表示希望这些免费资源能够帮助那些无法支付教育费用的人,从头科学掌握数据。
