- 二分类的混淆矩阵(预测图片是否是汉堡)
- 分类器到底分对了多少?
- 预测的图片中正确的有多少?
- 有多少张应该预测为是的图片没有找到?
- 精确率和召回率在某种情况下会呈现此消彼长的状况。举个极端的例子:
- 假设把所有图片都预测为‘是’:
- 假设把所有图片都预测为‘是’:
- 不能一味的要求精确率和召回率其中某个很高。F1值是Precision和Recall的调和平均。
- 总结:
- 如果是N分类呢?
- 宏观的准确率就是绿色除以绿色加橙色。
- 宏观的精确率就是每一行的每个类别的精确率的平均;宏观的召回率就是每一列的每个类别的召回率的平均。
- 宏观的F1值是macro-Precision和macro-Recall的调和平均。
- 微观的…就是对每个类别计算TP FP FN TN;然后相加,按照之前的公式进行计算。