什么是生成模型和判别模型?

从本质上讲,生成模型和判别模型是解决分类问题的两类基本思路。首先,您得先了解,分类问题,就是给定一个数据x,要判断它对应的标签y(这么naive的东西都要解释下,求面试官此时内心的阴影面积,嘎嘎)。生成模型就是要学习x和y的联合概率分布P(x,y),然后根据贝叶斯公式来求得条件概率P(y|x),预测条件概率最大的y。贝叶斯公式这么简单的知识相信您也了解,我就不啰嗦了。判别模型就是直接学习条件概率分布P(y|x)。

举个栗子

例子1

假设你从来没有见过大象和猫,连听都没有听过,这时,给你看了一张大象的照片和一张猫的照片。如下所示:

然后牵来我家的大象(面试官:你家开动物园的吗?),让你判断这是大象还是猫。你咋办?

你开始回想刚刚看过的照片,大概记起来,大象和猫比起来,有个长鼻子,而眼前这个家伙也有个长鼻子,所以,你兴奋地说:“这是大象!”恭喜你答对了!

你也有可能这样做,你努力回想刚才的两张照片,然后用笔把它们画在了纸上,拿着纸和我家的大象做比较,你发现,眼前的动物更像是大象。于是,你惊喜地宣布:“这玩意是大象!”恭喜你又答对了!

在这个问题中,第一个解决问题的思路就是判别模型,因为你只记住了大象和猫之间的不同之处。第二个解决问题的思路就是生成模型,因为你实际上学习了什么是大象,什么是猫。

例子2

来来来,看一下这四个形式为(x,y)的样本。(1,0), (1,0), (2,0), (2, 1)。假设,我们想从这四个样本中,学习到如何通过x判断y的模型。用生成模型,我们要学习P(x,y)。如下所示:

img

我们学习到了四个概率值,它们的和是1,这就是P(x,y)。

我们也可以用判别模型,我们要学习P(y|x),如下所示:

img

我们同样学习到了四个概率值,但是,这次,是每一行的两个概率值的和为1了。让我们具体来看一下,如何使用这两个模型做判断。

假设 x=1。

  • 对于生成模型, 我们会比较:

    • P(x=1,y=0) = 1/2
    • P(x=1,y=1) = 0

我们发现P(x=1,y=0)的概率要比P(x=1,y=1)的概率大,所以,我们判断:x=1时,y=0。

  • 对于判别模型,我们会比较:

    • P(y=0|x=1) = 1
    • P(y=1|x=1) = 0

同样,P(y=0|x=1)要比P(y=1|x=1)大,所以,我们判断:x=1时,y=0。

我们看到,虽然最后预测的结果一样,但是得出结果的逻辑却是完全不同的。两个栗子说完,你心里感到很痛快,面试官脸上也露出了赞赏的微笑,但是,他突然问了一个问题。

生成模型为啥叫生成模型

这个问题着实让你没想到,不过,聪明的你略加思考,应该就可以想到。生成模型之所以叫生成模型,是因为,它背后的思想是,x是特征,y是标签,什么样的标签就会生成什么样的特征。好比说,标签是大象,那么可能生成的特征就有大耳朵,长鼻子等等。

当我们来根据x来判断y时,我们实际上是在比较,什么样的y标签更可能生成特征x,我们预测的结果就是更可能生成x特征的y标签。

常见的生成模型和判别模型有哪些呢

  • 生成模型

    • HMM

    • 朴素贝叶斯

  • 判别模型

    • 逻辑回归

    • SVM

    • CRF

    • 最近邻

    • 一般的神经网络