机器学习中的回忆是一个关键措施,在评估分类模型中起着至关重要的作用。了解模型能够识别真正的积极案例至关重要,尤其是在医疗保健,金融和欺诈检测等领域,在这些领域中,缺失的积极实例可能会产生重大后果。
机器学习中有什么回忆?
召回是一种性能指标,用于评估模型在确定数据集中实际积极实例方面的有效性。当目标是最大程度地减少虚假负面因素时,当模型未能识别积极案例时,这一点尤其重要。
关键性能指标
- 混乱矩阵: 一种基本工具,说明模型中的真实和错误预测。
混乱矩阵
混乱矩阵提供了模型预测的详细分解,有助于可视化其性能。它显示了正确或错误地分类的预测有多少个预测。
混淆矩阵的组成部分
- 真正的阳性(TP): 正确预测阳性病例。
- 误报(FP): 错误地预测阳性病例。
- 假否定因素(FN): 错过了积极的案件。
回忆二进制分类
在二进制分类中,通过将真实结果的数量与所有实际积极实例进行比较来计算召回。
定义和计算
计算召回的公式如下:
回忆= Number of True Positives / (Total True Positives + Total False Negatives)
召回计算的示例
例如,在一个少数族裔类与1000个多数类的比率的数据集中,您可以通过分析真实的阳性和虚假负面的数量来计算召回召回。
在多级分类中回忆
回忆超出了二进制分类,可容纳存在多个类别的多类场景。每个班级都可以单独或集体评估。
扩大召回的概念
在解决多类召回时,必须进行调整以有效地包含所有类。
多级召回计算
多级召回公式可以表示为:
回忆= True Positives in all classes / (True Positives + False Negatives in all classes)
召回的重要性和策略
在涉及分类不平衡的情况下,必须最大化召回率。优先考虑假否定性的模型在某些应用中至关重要。
平衡召回和精确
尽管优化召回是必不可少的,但它可能会无意间导致精度下降,强调需要找到增强整体模型性能的平衡的需求。
精密与回忆
了解召回与精度之间的关系是有效评估模型准确性的关键。
定义精度
精确评估使用以下公式的正面预测的正确性:
精度= True Positives / (True Positives + False Positives)
使用F1分数平衡指标
F1分数将召回率和精度融合到单个度量标准中,从而促进了模型性能的更全面的观点:
f1 = 2 × (precision × recall) / (precision + recall)