首页 > 代码库 > 挖掘相关规则的算法描述

挖掘相关规则的算法描述

Mining Assocaition rule algrothm(挖掘相关规则的算法)

                  此算法中有两个关键参数,coverage(表示预测正确的案例个数,此参数用来筛选哪些实例个数大于或等于这个值得相关规则)

                                                             accuracy(表示预测数据的精确度,此参数实际上是满足相关规则的实例的个数/满足规则前部分条件的实例个数)

             A  找到满足coverage参数的所有项数的规则集合算法描述

         技术分享

                把1赋给变量k

                找到所有的满足coverage数量的k项规则集合,并且把它们保存到哈希表#1中

                while 发现一些满足coverage数量的k项规则集合

                        k自增长

                        在哈希表#(k-1)中,找出所有的只在最后一项不同的k-1项集合

                        对于每一对创建一个k项集合,通过把两个k-1项集合组合在一起

                        删除所有任意的k-1项没有在哈希表#(k-1)中的k项集合

                        遍历数据,并且移除所有不满足coverage数量的剩下的k项集合

                        把剩下的k项集合和他们的coverage保存到哈希#k的表中并对每一项按语言顺序排序

 

            B  找到k项集合中所有满足给定accuracy(正确率)的相关规则

            技术分享

               把1赋给变量n

               从k项集合中找到满足指定参数accurate的所有的n个结果的规则,并把他们保存到哈希表#1中,使用哈希表计算项集合的accuracy

              while 一些满足accurate的n个结果规则被发现时

                      n自增长

                      在哈希表#(k-1)中,找出所有的只在结果最后一项不同的k-1个结果的规则

                      对于每一对创建一个k个结果的规则,通过把两个k-1个结果的规则组合在一起  

                      移除哪些不满足指定accurate参数的n个结果规则,通过使用 项集合的哈希表来计算accuracy

                      把剩余的n个结果规则和他们的精确性保存到哈希表#k中,并对每一个结果项按照语言顺序排序

 

               具体案例之后再补充!!!!!!!

              

              

        

 

 

 

   

                      

                                      

                     

                    

 

挖掘相关规则的算法描述