支持向量机
概念
SVM:是一种二类分类模型,它的基本模型是定义在特征空间上的间隔最大的线性分类器,间隔最大使它区别与感知机 还包括核技巧,使它成为实质上的非线性分类器 不止线性分类,更高维度的分类 SVM
功能
- 回归分析
- 分类(最早用于分类)
- 模式识别
优势
- 在高维空间中非常高效
- 即使在数据维度比样本数量大的情况下仍然有效
- 在决策函数(称为支持向量)中使用训练集的子集,因此它也是高效利用内存的
缺点
- 如果特征数量比样本数量大得多,在选择核函数 核函数 时要避免过拟合, 而且正则化项是非常重要的
- 支持向量机不直接提供概率估计,这些都是使用昂贵的五次交叉验算计算的
区别
- SVM=Support Vector Machine 是支持向量机
- SVC=Support Vector Classification就是支持向量机用于分类
- SVR=Support Vector Regression.就是支持向量机用于回归分析
算法(python-sklearn)
- svm.LinearSVC Linear Support Vector Classification.
- svm.LinearSVR Linear Support Vector Regression.
- svm.NuSVC Nu-Support Vector Classification.
- svm.NuSVR Nu Support Vector Regression.
- svm.OneClassSVM Unsupervised Outlier Detection.
- svm.SVC C-Support Vector Classification.
- svm.SVR Epsilon-Support Vector Regression.
惩罚系数
惩罚系数(C):C值越大,不愿意出现错误,可能过拟合