当前位置: 首页 > 科技观察

二分类、多分类、回归任务,项目必备模型get竞赛

时间:2023-03-15 00:54:46 科技观察

数据挖掘竞赛,四种实现方式,你值得拥有。数据科学竞赛是学习各种算法、加深对数据科学的理解、提升和挑战自我的好机会,这些竞赛中有一些常用的模型。最近有开发者在GitHub上开源了一个项目,里面包含了数据挖掘竞赛常用的模型,主要涵盖二分类、多分类和回归任务。项目代码全部用Python实现。项目地址:https://github.com/QLMX/data_mining_models本项目包括二分类模型、多分类模型和回归模型,分别基于lightgbm实现、xgboost实现、keras实现和pytorch实现:lightgbmbinary_class.py:lightgbmimplementationThebinaryclassificationmulti_class.py:multi-classregressionrealizedbylightgbm:regressionrealizedbylightgbmmulti_class_custom_feval.py:lightgbm自定义评价函数实现多类multi_class_weight_loss.py:lightgbm多类不平衡问题,实现类权重优化xgboost二进制类。py:xgboost实现的二元分类multi_class.py:xgboost实现的多类回归.py:xgboost实现的回归,keras实现的mlpkeras,多分类任务regression.py:keras实现的mlp,pytorch实现的mlp,用于回归任务binary_class.py:pytorch实现的mlp,二分类任务multi_class.py:pytorch实现的mlp,多分类任务regression.py:对于实现的mlp,可以直接通过pipinstall-rrequirements.txt安装指定的功能包来设置回归任务环境。具体功能包如下:pandasnumpymatplotlibsklearntensorflow==1.12.0keras==2.2.4pytorchseabornlightgbm==2.2.1xgboost==0.90项目解读lightgbm的第一部分数据是基于从PPDA比赛中截取的一部分feature,以及随机选取5000个训练数据和3000个测试数据。对于gender、cell_province等类别特征,直接重新编码。第二部分基于xgboost实现二分类、多分类和回归任务。第三、四部分是深度网络部分,是一个基于keras的多层感知器网络(mlp)。pytorch主要用于图像处理任务,很少用于数据挖掘比赛,但是本项目整理了基于pytorch的mlp用于分类和回归任务的代码。项目作者对项目的每一部分都做了详细的解读。有关详细信息,请参阅以下内容: