话说三国时期,乱世出人才,当时刘备让张飞帮忙招兵买马,寻找人才。张飞发公告以后,有10人来面试,这10人分为两类,人才和庸才,各占百分之五十,张飞的主要作用就是从这10人中识别出人才,然后为蜀国所用。
人才代表机器学习中的正样本
庸才代表机器学习中的负样本
那张飞就是你训练的机器学习模型。
1 概念定义
TP: True Positive, 实际是人才,被张飞认为是人才的人数
FP: False Positive, 实际是庸才,被张飞认为是人才的人数
TN:True Negative, 实际是庸才,被张飞认为是庸才的人数
FN:False Negative, 实际是人才,被张飞认为是庸才的人数
格式: XY
X表示此次判断是错误的
Y表示被AI识别的结果
2 召回率(Recall)
召回率 = 人才被识别正确的数量 / 人才总数 = TP/ (TP + FN)
刘备:阿飞啊,你帮哥哥选一下人才,一定要多招人才,保证人才都能招进来” ---- 提高“召回率”
张飞:哥哥,放心,交给俺
张飞心想:把10个人都招进来,这样人才就不会丢失,然后就把10个人都招聘到蜀国当人才来供养。
刘备得知后说:飞飞,你招这么多人,我们发不起工资啊,我们只需要人才,不需要庸才。
上面刘备告诉张飞的话,无形让张飞误认为能把所有的人才都识别正确即可,庸才识别正确与否不重要,因此刘备的话强调了召回率
通过公式,我们发现张飞还是很聪明的。但是,在机器学习中,单纯看召回率容易影响模型的鲁棒性。
3 精确率(Pecision)
精确率 = 人才被识别正确的数量 / 被识别成人才的数量 = TP/ (TP + FP)
刘备告: 阿飞啊,吸取上次教训,这次一定保证识别的人才中不能有庸才。 --- 提高“精确率”
张飞犯难了,他只知道这10个人中的诸葛亮是卧龙,绝对是个人才,其他的九个人,他都没听说过,所以不敢乱选,万一选择出一个是庸才,那岂不是又要被哥哥骂?他将诸葛亮留下了。
刘备知道后,骂张飞:你是不是四肢发达头脑简单,只选一个人才有屁用?
上面刘备告诉张飞的话,无形让张飞误认为只要能识别出来的人中都是人才才是最终要的,其他人才识别正确与否不重要,因此刘备的话强调了精确率
4准确率(Accuracy)
准确率 = (人才识别正确的数量 + 庸才识别正确的数量)/ 总人数 = (TP + TN)/ (TP + FP + TN + FN)
刘备:小飞啊,你这次一定一定要多选择人才,识别出庸才和人才来,把人才都召进宫哈。
张飞:哥哥,这次我一定好好识别
张飞:诸葛哥哥,你能帮帮忙吗?我怎么才能识别人才啊
诸葛亮:小飞弟啊,你可以通过考试的方式来判断,考试分数高的就是人才,考试分数低的就是庸才。
张飞:高,实在是高
通过考试,张飞发现成绩高前5个人都高于60分,然后就说,高于60分的是人才,低于60分的是庸才,最终完成了刘备的任务。
上面刘备告诉张飞的话,强调了准确率
小结
如果你搞不清楚上面7个名词,就把图片和故事记住,保证你能够此生不再忘记这几个容易混淆的名词。