- 精确率(precision):对于每个类别,计算预测为该类别的样本中真正属于该类别的比例,即
precision = 预测为正且实际为正的样本数 / 预测为正的样本数
。 - 召回率(recall):对于每个类别,计算实际属于该类别的样本中被正确预测为该类别的比例,即
recall = 预测为正且实际为正的样本数 / 实际为正的样本数
。 - F1 - score:精确率和召回率的调和平均数,用于综合衡量模型在该类别上的性能,计算方式为
F1 = 2 * (precision * recall) / (precision + recall)
。 - 准确率(accuracy):计算模型预测正确的样本数占总样本数的比例,即
accuracy = 正确预测的样本数 / 总样本数
。 - 宏平均(macro avg)和加权平均(weighted avg)是对每个类别指标的不同平均方式,宏平均是对每个类别的指标分别求平均,加权平均是根据每个类别在测试集中的样本数量对每个类别的指标进行加权平均。