Release Time:2019-03-10 Hits:
Indexed by: Journal Article
Date of Publication: 2015-02-15
Journal: 计算机研究与发展
Included Journals: Scopus、EI、CSCD、ISTIC、PKU
Volume: 52
Issue: 2
Page Number: 445-455
ISSN: 1000-1239
Key Words: 高效用模式;频繁模式;频繁项集;数据挖掘;TOP-K
Abstract: 目前TOP-K高效用模式挖掘算法需要产生候选项集,特别是当数据集比较大或者数据集中包含较多长事务项集时,算法的时间和空间效率会受到更大的影响.针对此问题,通过将事务项集和项集效用信息有效地保存到树结构HUP-Tree,给出一个不需要候选项集的挖掘算法TOPKHUP; HUP-Tree树能保证从中计算到每个模式的效用值,不需要再扫描数据集来计算模式的效用值,从而使挖掘算法的时空效率得到较大的提高.采用7个典型数据集对算法的性能进行测试,实验结果证明TOPKHUP的时间和空间效率都优于已有算法,并对K值的变化保持平稳.