当前位置: 首页 > 网络应用技术

Sklearn中不同分类方案评估指标的功能概述

时间:2023-03-07 03:07:52 网络应用技术

  在Sklearn中,在模块下实施了一些损失,分数和实际功能以衡量分类性能。一些指标可能需要正面的概率,置信价值或二进制决策值 - 制定价值。通过sample_weight参数的总分数。

  让我们简要介绍由Sklearn实施的不同分类方案实施的模型评估指标。

  这是一些函数描述仅限于第二类方案:

  (y_true,probas_pred, *)根据不同的概率阈值计算召回率对的准确性。(y_true,y_score, *[,pos_label,...])计算ROC曲线。。

  (y_true,y_pred, *[,...])计算平均准确性率。管道类别的平均准确性和不平衡数据集的多类分类问题的处理。每个类。(Y1,Y2, *[,标签,...])计算Korn的Kappa系数并测量评估者之间的一致性统计数据。(Y__True,Y__Pred, *[,...])计算混淆矩阵以评估评估分类的准确性。(y_true,pred_decision, *[,...])计算平均铰链损失(非调查)。可以将铰链损失函数用于“ Max -Margin”分类及其最著名的应用程序是SVM的损耗函数。(y_true,y_pred, *[,...])计算Matthews关系的数量(MCC)。(Y__True,Y__Score, *[,...])TOP_K计算的准确性,指标计算的准确性是预测k -tag(根据预测分数排名)中的次数。请注意,请注意这里没有多个标签。在这里,有些功能也可以应用于多标签方案(同时可以应用于双类和多类类别):

  (y_true,y_pred, *[,...])计算精度。(y_true,y_pred, *[,...])构造一个文本报告,显示主分类指标。...])计算$ f1 $ value。(y_true,y_pred, *,beta [,...])计算$ f_ {beta} $ value。(y_true,y_pred, *[,sample_weight])损失。(y_true,y_pred, *[,标签,...])计算jaccard相似系数。(y_true,y_pred, *[,EPS,...])计算数字损失,也称为逻辑损失或交叉- 熵损失。(y_true,y_pred, *)计算每个类或样品的混淆矩阵。(y_true,...)计算每个类的准确性,召回率,f值和实际值的数量。(y_true,y_true,y_pred, *[,标签,...])计算精度。(y_true,y_pred, *[,标签,...])计算召回率。(y_true,y_score, *[,平均,...])根据预测的分数计算ROC曲线下的面积(AUC)。(y_true,y_pred, *[,...])计算0-1损失,这适用于分类问题。还有一些应用于管道类别和多标签分类场景的功能(但不能应用于多个分类场景):

  (y_true,y_score, *)根据预测分数计算平均精度(AP)。该值在0到1之间,值越高,越好。某些指标基本定义为第二个分类任务(例如,)。默认情况下,仅评估了标签。我们假设默认情况下,正类别标记为1(尽管可以通过参数配置)。

  将二进制评估指数扩展到多重分类或多标签分类问题时,数据被视为双重分类问题的集合。每个类别都是集合中的一个元素。(即多类或多标签分类基于第二分类集合。对于每个标签,它是两个分类模型。例如,有三个类别。:红色,黄色和蓝色。对于负标签,基于此训练模型。如果黄是正标,红色和蓝色是基于此训练的负标签。)

  Sklearn中有许多方法可以是类集合中的第二分类指标的平均值,并且在某些情况下,每种方法可能很有用。在可用的情况下,您应该在{,,,}中使用参数。

  除此之外,还可以为第二分类模型选择参数。

  当需要情况时,输入是两个值(仅包含0和1),并且涉及评分函数的另一个参数,即指定为视图值的值,默认情况下是默认情况下,也就是说,默认值为1.仅计算指定的准确性,召回率等。

  评论:

  当多个分类数据提供测量值时,如果目标值为两个类,则将常规类标签用作数组,对于多标签数据,则将其指定为指示矩阵。在其中,如果样本i具有标签j,则单元格(i,j的值)为1,否则值为0。