当前位置: 首页 > 后端技术 > Python

机器学习100天学习计划——Day2线性回归

时间:2023-03-26 15:15:06 Python

一起学习吧!机器学习百日学习计划(第一天数据预处理)](http://mp.weixin.qq.com/s?__b...今天是机器学习百日计划的第二天学习,我们将实现一个简单的线性回归模型。线性回归模型是基于单个特征(X)来预测结果(Y)。回归任务的难点在于找到最佳拟合线,而目的使用机器学习训练模型就是找到这条最佳拟合线。构建模型的整个过程如下:Step0:在开始之前,你需要确保你的Python和pip已经成功安装如果没有,请访问这篇文章:超详细的Python安装指南安装,如果你使用Python进行数据分析,可以直接安装Anaconda:Python数据分析和挖掘的好帮手——Anaconda,内置Python和pip.另外推荐大家使用VSCode编辑器:Python编程最佳搭档—VSCode详解指南准备输入命令安装依赖。如果你没有VSCode编辑器,Windows环境下打开Cmd(开始-运行-CMD),苹果系统环境下打开Terminal(command+空格输入Terminal)。如果你使用的是VSCodeEditor或者Pycharm,可以直接在下面的Terminal中输入命令:`pipinstallpandas``pipinstallnumpy``pipinstallmatplotlib``pipinstallscikit-learn`第一步:根据what进行数据预处理第一天学习了数据预处理知识,在这一步我们会进行以下步骤:1.导入库2.导入数据集3.检查缺失数据4.划分数据集5.特征归一化(缩放)代码如下,studentscores.csv和本文完整源码可以在Python实战宝典上下载公众号后台回复:机器学习2。`fromsklearn.model_selectionimporttrain_test_split``importpandasaspd``importnumpyasnp``importmatplotlib.pyplotasplt``dataset=pd.read_csv('studentscores.csv')``X=dataset.iloc[:,:1].values``Y=dataset.iloc[:,1].values``X_train,X_test,Y_train,Y_test=train_test_split(``X,Y,test_size=1/4,random_state=0)`th第二步:训练模型使用sklearn的LinearRegression可以轻松实现线性模型的训练。我们在这篇文章中解释过:Python用5行代码学习机器学习——线性回归`fromsklearn.linear_modelimportLinearRegression``regressor=LinearRegression()``regressor=regressor.fit(X_train,Y_train)`第三步1:预测结果是基于sklearn优秀的代码封装能力。只需要一行代码就可以预测测试集的结果:Y_pred=regressor.predict(X_test)第四步:可视化单纯看数据不是很直观。我们可以使用matplotlib来可视化数据。在实际应用中,使用matplotlib进行数据可视化的步骤往往是在训练模型之前完成的,因为拿到数据之后首先要做的就是探索性数据分析,也叫EDA分析。不过由于这是一篇类似教程的文章,不需要探索性的数据分析,所以我们跳过了EDA分析。训练集可视化:``plt.scatter(X_train,Y_train,color='red')``plt.plot(X_train,regressor.predict(X_train),color='blue')``plt.show()`test设置可视化:`plt.scatter(X_test,Y_test,color='red')``plt.plot(X_test,regressor.predict(X_test),color='blue')``plt.show()`这样,我们会比较简单的完成一个简单的线性回归模型的训练和测试。如果想看更多的应用,可以看这篇文章:Python用5行代码学机器学习——线性回归。这是我们文章的结尾。如果喜欢今天的Python实战教程,请继续关注Python实战宝典。有问题可以在公众号后台回复:进群,回答对应的红字验证信息,进入互助群提问。原创不易,希望大家能在下方点赞观看支持我继续创作,谢谢!点击下方阅读原文,更好的阅读体验Python实战宝典(pythondict.com)不只是合集欢迎关注公众号:Python实战宝典