其他分享
首页 > 其他分享> > 关联规则挖掘——Apriori

关联规则挖掘——Apriori

作者:互联网

算法目的

    关联规则挖掘中有一个非常典型的案例,"啤酒纸尿裤"案例,讲的是通过对一家超市的销售情况研究发现,很多买了纸尿裤的客户,同时会购买啤酒,经过调查发现,买这些纸尿裤的一般是家庭父亲,他们在被家庭主妇派去买纸尿裤时,会同时选择购买啤酒来犒劳自己,根据这个发现,超市将纸尿裤和啤酒放在一起,或者将它们进行捆绑销售,提高了产品的销量。
    关联规则挖掘就是通过挖掘算法来找到事物背后隐藏的关联规则,从而来指导实践,相类似的还有键盘与鼠标等

关联规则基础概念

Apriori原理

TID 商品
1 {面包,牛奶,果酱,饼干,可乐,泡面}
2 {面包,牛奶,果酱,饼干}
3 {面包,牛奶,果酱}
4 {可乐,泡面}
5 {可乐,泡面}

第一步,找出大小为1的候选集:

项集 支持度计数
{面包} 3
{牛奶} 3
{果酱} 3
{饼干} 2
{可乐} 3
{泡面} 3

第二步,根据最小支持度来筛选出频繁项集,设最小支持度为0.5,则频繁项集为:

项集 支持度计数
{面包} 3
{牛奶} 3
{果酱} 3
{可乐} 3
{泡面} 3

第三步,找出大小为2的候选集:

项集 支持度计数
{面包,牛奶} 3
{牛奶,果酱} 3
{面包,果酱} 3
{可乐,泡面} 3
{面包,可乐} 1
{牛奶,可乐} 1
{果酱,可乐} 1
{面包,泡面} 1
{牛奶,泡面} 1
{果酱,泡面} 1

第四步,根据最小支持度来筛选出频繁项集,设最小支持度为0.5,则频繁项集为:

项集 支持度计数
{面包,牛奶} 3
{牛奶,果酱} 3
{面包,果酱} 3
{可乐,泡面} 3

第五步,找出大小为3的候选集:

项集 支持度计数
{面包,牛奶,果酱} 3

第四步,根据最小支持度来筛选出频繁项集,设最小支持度为0.5,则频繁项集为:

项集 支持度计数
{面包,牛奶,果酱} 3

标签:面包,泡面,牛奶,果酱,Apriori,项集,挖掘,关联,可乐
来源: https://www.cnblogs.com/codedogzlc/p/15484408.html