首页 > 代码库 > PGM学习之四 Factor,Reasoning
PGM学习之四 Factor,Reasoning
通过上一篇文章的介绍,我们已经基本了解了:Factor是组成PGM模型的基本要素;Factor之间的运算和推理是构建高维复杂PGM模型的基础。那么接下来,我们将重点理解,Factor之间的推理(Reasoning Patterns)。Factor之间的推理分为以下几类:
1. Causal Reasoning , 因果推理;
2. Evidential Reasoning,证据推理;
3. Intercausal Reasoning
本文将详细描述上述三种推理模式。
一 Casual Reasoning,因果推理
要弄清楚因果推理,我们首先要明白什么是因果关系(Causality)。当我们说A与B之间具有因果关系,如果A是因(cause)B是果(effect),则A与B之间必须具备以下四个必要条件(necessary conditions):
A与B共变(covary),也就是A增加(或减少)B也增加(或是减少)
A发生在B之前,也就是“前因”“后果”
A与B之间的关系具有理论上的连结<-在PGM中,这种连接通常使用图的边表示
A与B之间的关系不是伪关系(spurious relationship)
因果关系曾经被形容为“Cognitive illusion”(认知错觉)。我们对因和果的大多数理解都是基于“associations”(影响),而没有真增认识到结果之间的相互联系。这种理解的缺乏导致了解释深度错觉。人们可能会认为他们已经了解了因果的联系,因为他们知道一个事件(因)能够导致另一个事件(果)。但是当问他们怎么解释这种关系时,他们就不得而知了。因此,有必要首先理解因果关系的类型。通过观察自然世界中的因果关系,前辈们构建了许多种不同类型的causal models(因果模型),例如:常见的原因关系,常见的结果关系,因果链和因果关系动态平衡等。
常见的原因关系描述的是单一原因造成多重结果的影响。
常见的结果关系描述的是多个原因导致统一结果的影响。
因果链描述的是单一原因导致某一结果,这一结果又称为原因,反过来影响下一个结果。“ 蝴蝶效应 “是一个因果链的一个例子。在这个比喻的例子,蝴蝶扇动它的翅膀,这可能会导致空气中的电流,这可能会导致飓风,这反过来又可以造成损害社区的干扰。一个更为现实的例子可能是睡眠不好导致疲劳,这反过来又导致笨拙的协调。
因果关系的动态平衡是若干个因果关系形成一个稳定的周期或者循环。
那么,又该如何进行因果推理呢(reasoning about causals and effects),通过长时间的观察和总结。前辈们归纳出了以几种因果推理:
1.Deduction
Deduction代表一般规则,代表在一些时间发生时,有着确定的结论。在演绎推理中,人们可以在推断结果的基础上对因果关系添加某些其他参数,这些参数可以用来确定一个因果关系。例如,有的人说:地震造成人民和财产的损失。损失是一个负面的结果。因此,地震造成负面结果。基于前两个语句而得到第三个语句的逻辑结论,这个逻辑结论是确定的好不含糊的。
2.Induction
Induction包括在不确定条件下作出的任何推论。在这种情况下,得出的结论是可能的,但不能保证。在这种方式中,感应可以用来推测因果关系,但真正的因果关系的理解是不太可能来自这种类型的推理。例如,使用归纳推理来推断因果关系时,可能会说:所有证据表明,基因突变产生肿瘤。因此,它很可能是所有癌症是由基因突变引起的。在这个例子中,第一条语句是合理的,第二个是一个结论,那就是可能的,但不能保证,因为更多的证据可能还有不同的原因,光。
3.Abduction
在这种情况下,不保证结论。溯因推理是从数据描述的假说没有必然intransient的因果关系。这是一个不那么传统的推理形式为这些情况。例如,你可能会发现在一个房间里开一扇门,并猜想风打开这扇门。也可能会有很多偶然因素可能导致这一结果,但风作为一个原因的假设是合理的。我们倾向于寻找一个单一因果解释在我们的环境的影响,以减少歧义。
在上图给出的例子中,右下角给出了三个概率P(L=1)=0.5,P(L=1|I=0)=0.39,P(L=1|I=0,D=0)=0.51。从推理的角度来理解,也就是说
P(L=1|I=0,D=0)>P(L=1)>P(L=1|I=0)。也就是说,如果智商一般(I=0)并且课程难度较低(D=0),那么就比较容易获得推荐信;如果智商一般,课程难度不确定,那么相对来说,就比课程简单时获得推荐信的可能性要小一些。
二 Evidential Reasoning,证据推理
又称登姆普斯特 谢弗推理(Dempster-Shafer reasoning)方法,简称D-S推理。D-S理论将假设视作一个集合,引入信任函数、似信度函数、类概率函数等概念描述命题的精确信任程度、信任程度和估计信任程度,对命题的不确定性作多角度的描述。对从不同性质的数据源中提取的证据,利用正交求和方法综合证据,通过证据的积累缩小集合,从而获得问题的解。其优点:①能满足更弱的公理系统,有处理信息的无知和缺失的问题的能力,对不同数据中的信息的不准确性和矛盾提供了显式的估计。②能处理类别混合问题,在混合像元的表达中非常有用。
简单来讲,证据推理就是根据结果来推断它可能的原因的过程。例如,一个学生如果理解了课堂上老师讲解的东西,那么他的家庭作业也就会做得比较好。也就是说,通过观察一个学生家庭作业的情况,能够知道他对于课堂老师讲解的东西的掌握情况如何。
三 Intercausal Reasoning,又叫Mixed Reasoning,混合推理。
混合推理是指结合了因果推理和证据推理的推理方式。例如,如果观察到一个学生在考试中取得了好成绩,那么着就表明他理解了老师课堂上讲解的东西;同时也表明他家庭作业也做得不错。