感知机
感知机(perceptron) 是二类分类的线性分类模型,输入为实例的特征向量,输出为示例的类别,取 -1 和 +1 二值.
定义
假设输入空间(特征空间)是
输入
输出
以上函数称为感知机. 其中,w 和 b 为感知机模型参数,
sign是符号函数
损失函数
给定一个训练数据集
其中,
其中, M 为误分类点的集合.
算法
感知机学习问题可转化为求解损失函数式的最优化问题,最优化的方法是随机梯度下降法.
感知机学习算法的原始形式
给定一个训练数据集
其中,
求参数w, b,使得其为以下损失函数极小化问题的解
其中 M 为误分类点的集合
感知机学习算法是误分类驱动的,具体采用随机梯度下降法(stochastic gradient descent).首先任意选取一个超平面
假设误分类点集合M是固定的,那么损失函数 L(w, b)的梯度由
给出
随机选取一个误分类点
其中
算法描述
输入: 训练数据集
输出: w, b; 感知机模型
选取初值
在训练集中选取数据
如果
转至2,直到训练集中没有误分类点.
当一个实例点被误分类,即误分类,即位于超平面的错误一侧时,则调整w, b的值,使分离超平面向该误分类点的一侧移动,以减少
该误分类点与超平面的举例,直到超平面越过该误分类点使其被正确分类
感知机学习算法的对偶形式
对偶形式的基本想法是,将 w 和 b 表示为示例
一般性,在原始形式中可假设初始值
逐步修改 w, b, 修改 n 次,则 w, b 关于
最后学习到的w, b可以分别表示为
这里,
意味着它举例分离超平面越近,也就越难正确分类.这样的实例对学习结果影响最大