learning_notes

学习笔记

View project on GitHub

朴素贝叶斯法

原理

基于贝叶斯定理与特征条件独立假设

精确率(Precision),召回率(Recall),准确率(Accuracy)

f1-score

P(Positive)和N(Negative) 代表模型的判断结果 T(True)和F(False) 评价模型的判断结果是否正确 TP(True Positive):预测答案正确

FP(False Positive):错将其他类预测为本类

FN(False Negative):本类标签预测为其他类标

准确率 Acc= (TP+TN)/(TP+TN+FP+FN) 召回率 / 查全率 (recall) Recall=TP/(TP+FN) 指的是被预测为正例的占总的正例的比重 精准度 / 查准率(precision) Precision=TP/(TP+FP) 指被分类器判定正例中的正样本的比重 区分好召回率和精确率的关键在于:针对的数据不同,召回率针对的是数据集中的所有正例,精确率针对的是模型判断出的所有正例

优缺点

  • 优点:
    • 对小规模的数据表现很好,适合多分类任务,适合增量式训练
  • 缺点:
    • 对输入数据的表达形式很敏感