二维数据SVM模拟过程

SVM 算法的基本原理。

SVM 问题描述

对于线性可分数据,二维数据决策面方程即为一元一次方程,如下:

其用向量表示可以表示为:

点到直线距离方程为:

即在所有的点 $x$ 中,使得 $d$ 最大的直线即为决策面。

对每一个样本加上一个标签 $y_i$:

如果决策面能够完全正确的对样本进行分类,则满足:

如果决策面正好在间隔区间的中轴线上,且支持向量到决策面的距离为 $d$,那么有:

此时,令$\omega=\omega_d,\gamma=\gamma_d$,则 SVM 的优化问题的约束条件为:

线性 SVM 优化问题基本描述

决策面的方程如 (2) 所示,所有样本点到决策面的距离为:

当 $x_i$ 为支持向量时,等号成立。

式 (8) 的含义为,支持向量样本点到决策面的距离为 $\frac{1}{||\omega||}$ , 需要找到一组参数 $\omega ,\gamma$ 使得 $d$ 最小。对式 (7) 可统一表达如下:

至此,SVM 线性最优化问题的数学描述为:


学习自 零基础学SVM