首页 > TAG信息列表 > headerTable
数据挖掘之关联规则-FP树
1.FP树的生成过程 1)扫描数据,得到所有频繁一项集的的计数。然后删除支持度低于阈值的项,将1项频繁集放入项头表,并按照支持度降序排列。 2)扫描数据,将读到的原始数据剔除非频繁1项集,并按照支持度降序排列。 3)读入排序后的数据集,插入FP树,插入时按照排序后的顺序,插入FP树中,排序靠机器学习(十一):FP增长(FP-growth)
四、代码实现(python) 以下代码来自Peter Harrington《Machine Learing in Action》代码如下(保存为fpGrowth.py): # -- coding: utf-8 --class treeNode: # FP树中节点的类定义,用于构建FP树 def __init__(self, nameValue, numOccur, parentNode): self.name = nameVa关联规则算法
apriori算法 参考链接: https://www.cnblogs.com/pinard/p/6293298.html https://www.cnblogs.com/lsqin/p/9342926.html https://blog.csdn.net/antkillerfarm/article/details/60880477 # Apriori算法#自底向上,是否可以改进为自顶向下,先拆分,再频数统计#首先根据支持度将各元素中机器学习实战8-FP-growth
1 FP树 1.1 FP介绍 将数据结构存储在一种称为FP树的紧凑数据结构中,如图: 一般流程: 输入数据,构建出一个如上图所示的数据结构(可以理解为按每条数据集合一步一步建立出来的树),即FP树 从FP树中挖掘频繁项集 从FP树中获得条件模式基(以某查找元素为结尾的路径集机器学习算法学习---关联分析算法(二)
FP-growth算法只需要对数据库进行两次扫描,故速度要比Apriori算法快。发现频繁项集的基本过程:(1)构建FP树;(2)从FP树中挖掘频繁项集。优点:一般要快于Apriori缺点:实现比较困难,在某些数据集上性能会下降适用数据:标称型1、FP树:用于编码数据集的有效方式FP代表频繁模式(Frequent Pattern)。FP调用存储过程取到数据通过NPOI存到Excel中
//调用 public ActionResult GenerateExcel() { DataTable headerTable = new DataTable(); headerTable.Columns.Add("Status_Id", Type.GetType("System.String")); headerTable.Columns.Add(