当前位置: 首页 > 科技观察

机器学习之路-0-介绍与学习资源

时间:2023-03-21 00:56:33 科技观察

机器学习想要深入、专业、有品位,需要对编程、算法、数学、计算机分布式技术有一定的掌握。所以,相比之前的技术升级,这条路的门槛提高了不少。编程,熟练不是必要条件,但必须熟练使用一门语言,非专业人士也可以学习;数学,需要掌握概率论、线性代数、微积分等基础理论;计算机分布式技术,可选,非必需。另一个是统计。统计和大数据的来源是对数据的分析。因为统计学是一门理论功底深厚的学科,理解统计学有助于提升分析数据的能力。并避免掉入坑中。初学者不需要,但高级阶段需要。我也是一个正在这条路上摸索的程序员。好在现在的工作内容也是朝着这个方向发展的,可以投入更多的时间和精力。写这个教程,一是总结学习,给自己定一个可衡量的目标,自我监督;另一种是与志同道合的伙伴交朋友,共同成长。本系列文章的核心思想只有一个:用动手实践带动理论学习。本教程的开发将遵循敏捷实践。一开始可能会有很多不准确和不精确的地方。希望大家批评指正,不断改进。当程序员学习一门新技术时,第一个问题就是用什么语言?在考察了R语言、Java和Python之后,我最终选择了Python。作为程序员,统计出身的R一来就被秒杀。与Python相比,Java和Java的区别就很明显了。在入门学习方面,Python的学习资料和工具最多。所以从学习的角度来说,还是先用python吧。以后实际工作和产品开发使用Java也不晚,不会有太大影响。一旦掌握了算法和思想,语言就只是一种工具。知乎上机器学习的资料很多,也可以百度一下。娱乐版有多少明星新闻,就有多少文章。这里只说一下我现在学习的资料,仅供参考:书:《机器学习实战》(https://book.douban.com/subject/24703171/),虽然有人说代码写得不好,数学理论入门不够详细差评,但完全满足实战需要。本书特色:主流算法只介绍基本原理。数学部分虽然讨论的比较简单,但是我们可以通过相应的知识点在知乎、百度或者谷歌上进行补充。一些大而全的书,虽然讲了,但似乎无话可说;另外还有很多基于Python的习题,附有参考代码~。视频:看过吴恩达最火的视频,看了几节课就没再看了。主要是因为我需要的是一个快速反馈的学习过程(动手实践),所以以后只能继续“看”了。2017年1月上了《小象》的机器学习课程,避开广告,不多讨论。“书不买就不能读”~,唯有花钱的人才能逼迫自己前行。数学:又买了一套大学教材,有概率论、线性代数、高等数学。需要的同学可以去“闲鱼”二手货。主要作为工具书使用,不懂的公式可以复习一下。有空的同学,最好再复习一遍。下一部分是介绍Python的机器学习工具和数学库。可以先准备学习环境:1.Anaconda,https://www.continuum.io/anaconda-overview。这是一个集成了机器学习所需的python运行环境、依赖库和代码编辑器的安装器。为了快速搭建学习环境,安装这个就足够了。Python选择安装2.7版本,因为网上大量例子和代码都是基于2.7的。2、Python语言学习,网上有很多2.7的教程,重点是了解语法、方法和数据结构,其他内容等到用到的时候再学。好了,准备工作就到这里,今天的实践:下载安装Anaconda,熟悉ipython交互环境的使用Python语言基础自学更多本作者好文