当前位置: 首页 > 科技观察

在两行Python中应用40个机器学习模型

时间:2023-03-16 12:58:30 科技观察

我们将使用lazypredict库,它允许我们仅用一行代码就可以在我们的数据集上实现许多机器学习模型,本文将演示lazypredict的快速使用。步骤1.使用以下命令安装lazypredict库:pipinstalllazypredict步骤2.导入pandas库以加载我们的机器学习数据集。数据集链接:https://raw.githubusercontent.com/tirthajyoti/Machine-Learning-with-Python/master/Datasets/Mall_Customers.csvimportpandasaspddf=pd.read_csv("Mall_Customers.csv")步骤3.查看机器了解数据集的前几行。df.head()第四步,拆分训练集和测试集。这里的Y变量是SpendingScore列,而其余列是X变量。fromsklearn.model_selectionimporttrain_test_splitx=df.loc[:,df.columns!='支出分数(1-100)']y=df['支出分数(1-100)']x_train,x_test,y_train,y_test=train_test_split(x,y,test_size=0.3)步骤5.让我们导入之前安装的lazypredict库。lazypredict中有两个类,一个是Classification类,一个是Regression类。importlazyRegressorfromlazypredict.SupervisedimportLazyRegressorfromlazypredict.SupervisedimportLazyClassifier导入后,我们将使用LazyRegressor,因为我们处理的是回归问题,如果你处理的是分类问题,这两种类型的问题都需要类似的步骤。multiple_ML_model=LazyRegressor(verbose=0,ignore_warnings=True,predictions=True)models,predictions=multiple_ML_model.fit(x_train,x_test,y_train,y_test)这里,prediction=True表示你想得到每个模型的准确率,想对每个模型进行预测。模型变量包含每个模型的准确性,以及其他重要信息。models正如你所看到的,它已经在我的回归问题上实现了42个机器学习模型,本指南更侧重于如何测试许多模型而不是提高它们的准确性。查看每个机器学习模型的预测如下:predictions您可以使用这些预测来创建混淆矩阵。如果您正在处理分类问题,这就是您使用lazypredict库的方式。multiple_ML_model=LazyClassifier(verbose=0,ignore_warnings=True,predictions=True)models,predictions=multiple_ML_model.fit(x_train,x_test,y_train,y_test)要记住的要点:该库仅用于测试目的,并为您提供有关哪些信息模型在您的数据集上表现良好。由于我将使用的库需要特定版本,因此建议使用单独的环境。