learning_notes

学习笔记

View project on GitHub

支持向量机

概念

SVM:是一种二类分类模型,它的基本模型是定义在特征空间上的间隔最大的线性分类器,间隔最大使它区别与感知机 还包括核技巧,使它成为实质上的非线性分类器 不止线性分类,更高维度的分类 SVM

功能

  • 回归分析
  • 分类(最早用于分类)
  • 模式识别

优势

  • 在高维空间中非常高效
  • 即使在数据维度比样本数量大的情况下仍然有效
  • 在决策函数(称为支持向量)中使用训练集的子集,因此它也是高效利用内存的

缺点

  • 如果特征数量比样本数量大得多,在选择核函数 核函数 时要避免过拟合, 而且正则化项是非常重要的
  • 支持向量机不直接提供概率估计,这些都是使用昂贵的五次交叉验算计算的

区别

  • SVM=Support Vector Machine 是支持向量机
  • SVC=Support Vector Classification就是支持向量机用于分类
  • SVR=Support Vector Regression.就是支持向量机用于回归分析

算法(python-sklearn)

  • svm.LinearSVC Linear Support Vector Classification.
  • svm.LinearSVR Linear Support Vector Regression.
  • svm.NuSVC Nu-Support Vector Classification.
  • svm.NuSVR Nu Support Vector Regression.
  • svm.OneClassSVM Unsupervised Outlier Detection.
  • svm.SVC C-Support Vector Classification.
  • svm.SVR Epsilon-Support Vector Regression.

惩罚系数

惩罚系数(C):C值越大,不愿意出现错误,可能过拟合