摘要:
本文在深度优先搜索的框架上, 引入基于项集前缀树节点链表的项集表示方法N-List, 提出一个高效的最长频繁项集挖掘算法NB-MAFIA。N-List的高压缩率和高效的求交集方法可以实现项集支持度的快速计算, 同时采用对搜索空间的剪枝策略和超集检测策略来提高算法效率。在多个真实和仿真数据集上, 通过实验评估了NB-MAFIA和两个经典算法。实验结果表明NB-MAFIA在多数情况下优于其他算法, 尤其在真实和稠密数据集上优势更为明显。
中图分类号:
沈戈晖, 刘沛东, 邓志鸿. NB-MAFIA: 基于N-List的最长频繁项集挖掘算法[J]. 北京大学学报(自然科学版), 2016, 52(2): 199-209.
SHEN Gehui, LIU Peidong, DENG Zhihong. NB-MAFIA: An N-List Based Maximal Frequent Itemset Algorithm[J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2016, 52(2): 199-209.