logistic回归与多分类(一)

xiaoxiao2021-02-28  40

      在机器学习中,logistic回归是经常被用到的算法之一,或用于回归预测,或用于分类任务。本文就将介绍什么是logistic回归,并如何应用于多分类任务中去。

回归:

      首先,让我们明确什么是回归。简单的说,就是通过大量已知数据对公式中的未知参数求解,形如中的a,b就是未知参数,用一堆已知的(x,y)训练数据来求解出最适合的a,b值。得到的完整公式后就可以来进行预测了,一般是对于数值型数据的预测,例如销售量的预测或是制造缺陷的预测。

     但是像这种线性回归方程能做的太少了,logistic回归却可以做到更多,尤其在引入Sigmoid函数这种阶跃函数 之后。logistic regression(LR)可以用于估计事情的可能性,也可以用作来分类。那么下面就先介绍一下什么是logistic回归。

logistic回归: 

      与上述回归相同,LR也有着自己的公式与未知参数,其公式为,一般的向量表达式为,其中的和即为未知参数。若是训练一个LR分类器的话,则必须要将得到的函数值Z分别映射到不同的分类区间,比如Z大于0分为一类,小于0分为另一类,这样就能完成简单的二分类任务了。那么这个转化函数怎么选取呢?这就要映入sigmoid函数了。

      sigmoid函数计算公式为,从函数图中就可以看出,函数在实数集上是连续可导的,并且能满足将输出值映射到[0~1]上。当Z值为0时输出值为0.5,那么不妨将0.5作为阈值,超过0.5可归为一类,小于或等于0.5分为另一类。通过这样一个阶跃函数,我们就将线性分类函数转化为了二分类函数,而我们所要求的参数也正是阶跃函数中的参数(可将参数设置为,设置为1)。logistic回归进行分类的主要思想就是:根据现有数据对分类边界线建立回归公式,以此进行分类。回归其实就是指最佳拟合,表示要找到最佳拟合参数集。

转载请注明原文地址: https://www.6miu.com/read-2622511.html

最新回复(0)