机器学习总结（lecture 2）算法：感知机学习算法 (PLA)

xiaoxiao2021-02-28 72

lecture 2：感知机学习算法

Perceptron Learning Algorithm（PLA）

（1）我们可以使用逐点修正的思想，首先在平面上随意取一条直线，看看哪些点分类错误。（2）然后开始对第一个错误点进行修正，即变换直线的位置，使这个错误点变成分类正确的点。（3）接着，再对第二个、第三个等所有的错误分类点进行直线纠正，直到所有的点都完全分类正确了，就得到了最好的直线

这种“逐步修正”，就是PLA思想所在。

PLA是怎么运行的：W是直线的法向量， WTx<0 ，W和X的夹角大于90度

按照这种思想，遇到个错误点就进行修正，不断迭代。要注意一点：每次修正直线，可能使之前分类正确的点变成错误点，这是可能发生的。但是没关系，不断迭代，不断修正，最终会将所有点完全正确分类。（PLA前提是线性可分的）。这种做法的思想是“知错能改”。

3PLA停下的保证

PLA什么时候会停下来呢？根据PLA的定义，当找到一条直线，能将所有平面上的点都分类正确，那么PLA就停止了。要达到这个终止条件，就必须保证D是线性可分（linear separable）。如果是非线性可分的，那么，PLA就不会停止。

4不可分的数据与Packet Algorithm

对于非线性可分的情况，我们可以把它当成是数据集D中掺杂了一下noise，事实上，大多数情况下我们遇到的D，都或多或少地掺杂了noise。

在非线性情况下，我们可以把条件放松，即不苛求每个点都分类正确，而是容忍有错误点，取错误点的个数最少时的权重w

事实证明，上面的解是NP-hard问题，难以求解。然而，我们可以对在线性可分类型中表现很好的PLA做个修改，把它应用到非线性可分类型中

修改后的PLA称为Packet Algorithm

（1）它的算法流程与PLA基本类似，首先初始化权重w0，计算出在这条初始化的直线中，分类错误点的个数。（2）然后对错误点进行修正，更新w，得到一条新的直线，再计算其对应的分类错误的点的个数，并与之前错误点个数比较，取个数较小的直线作为我们当前选择的分类直线。（3）之后，再经过n次迭代，不断比较当前分类错误点个数与之前最少的错误点个数比较，选择最小的值保存。（4）直到迭代次数完成后，选取个数最少的直线对应的w，即为我们最终想要得到的权重值。

如何判断数据集D是不是线性可分？对于二维数据来说，通常还是通过肉眼观察来判断的。一般情况下，Pocket Algorithm要比PLA速度慢一些。

5总结

对于线性可分问题，PLA可以停下来并实现完全正确分类。对于不是线性可分的问题，可以使用PLA的修正算法Pocket Algorithm来解决。

转载请注明原文地址: https://www.6miu.com/read-2650036.html

技术

最新回复(0)

机器学习总结（lecture 2）算法：感知机学习算法 (PLA)

lecture 2：感知机学习算法

Perceptron Learning Algorithm（PLA）

目录

1Perceptron Hypothesis Set（感知器假设集）

2Perceptron Learning Algorithm (PLA)

3PLA停下的保证

4不可分的数据与Packet Algorithm

5总结

技术