机器学习100天学习计划——Day2线性回归

时间：2023-03-26 15:15:06 Python

一起学习吧！机器学习百日学习计划（第一天数据预处理）](http://mp.weixin.qq.com/s?__b...今天是机器学习百日计划的第二天学习，我们将实现一个简单的线性回归模型。线性回归模型是基于单个特征（X）来预测结果（Y）。回归任务的难点在于找到最佳拟合线，而目的使用机器学习训练模型就是找到这条最佳拟合线。构建模型的整个过程如下：Step0:在开始之前，你需要确保你的Python和pip已经成功安装如果没有，请访问这篇文章：超详细的Python安装指南安装，如果你使用Python进行数据分析，可以直接安装Anaconda：Python数据分析和挖掘的好帮手——Anaconda，内置Python和pip.另外推荐大家使用VSCode编辑器：Python编程最佳搭档—VSCode详解指南准备输入命令安装依赖。如果你没有VSCode编辑器，Windows环境下打开Cmd（开始-运行-CMD），苹果系统环境下打开Terminal（command+空格输入Terminal）。如果你使用的是VSCodeEditor或者Pycharm，可以直接在下面的Terminal中输入命令：`pipinstallpandas``pipinstallnumpy``pipinstallmatplotlib``pipinstallscikit-learn`第一步：根据what进行数据预处理第一天学习了数据预处理知识，在这一步我们会进行以下步骤：1.导入库2.导入数据集3.检查缺失数据4.划分数据集5.特征归一化（缩放）代码如下,studentscores.csv和本文完整源码可以在Python实战宝典上下载公众号后台回复：机器学习2。`fromsklearn.model_selectionimporttrain_test_split``importpandasaspd``importnumpyasnp``importmatplotlib.pyplotasplt``dataset=pd.read_csv('studentscores.csv')``X=dataset.iloc[:,:1].values``Y=dataset.iloc[:,1].values``X_train,X_test,Y_train,Y_test=train_test_split(``X,Y,test_size=1/4,random_state=0)`th第二步：训练模型使用sklearn的LinearRegression可以轻松实现线性模型的训练。我们在这篇文章中解释过：Python用5行代码学习机器学习——线性回归`fromsklearn.linear_modelimportLinearRegression``regressor=LinearRegression()``regressor=regressor.fit(X_train,Y_train)`第三步1:预测结果是基于sklearn优秀的代码封装能力。只需要一行代码就可以预测测试集的结果：Y_pred=regressor.predict(X_test)第四步：可视化单纯看数据不是很直观。我们可以使用matplotlib来可视化数据。在实际应用中，使用matplotlib进行数据可视化的步骤往往是在训练模型之前完成的，因为拿到数据之后首先要做的就是探索性数据分析，也叫EDA分析。不过由于这是一篇类似教程的文章，不需要探索性的数据分析，所以我们跳过了EDA分析。训练集可视化：``plt.scatter(X_train,Y_train,color='red')``plt.plot(X_train,regressor.predict(X_train),color='blue')``plt.show()`test设置可视化：`plt.scatter(X_test,Y_test,color='red')``plt.plot(X_test,regressor.predict(X_test),color='blue')``plt.show()`这样，我们会比较简单的完成一个简单的线性回归模型的训练和测试。如果想看更多的应用，可以看这篇文章：Python用5行代码学机器学习——线性回归。这是我们文章的结尾。如果喜欢今天的Python实战教程，请继续关注Python实战宝典。有问题可以在公众号后台回复：进群，回答对应的红字验证信息，进入互助群提问。原创不易，希望大家能在下方点赞观看支持我继续创作，谢谢！点击下方阅读原文，更好的阅读体验Python实战宝典（pythondict.com）不只是合集欢迎关注公众号：Python实战宝典

上一篇：killerxadmin开发在线教育网站2_需求分析与表结构设计2_主要讲解模型设计中会出现的陷阱

下一篇：开始使用docker和docker-compose

机器学习100天学习计划——Day2线性回归相关文章