Hits:
Indexed by:期刊论文
Date of Publication:2015-02-15
Journal:计算机研究与发展
Included Journals:PKU、ISTIC、CSCD、EI、Scopus
Volume:52
Issue:2
Page Number:445-455
ISSN No.:1000-1239
Key Words:高效用模式;频繁模式;频繁项集;数据挖掘;TOP-K
Abstract:目前TOP-K高效用模式挖掘算法需要产生候选项集,特别是当数据集比较大或者数据集中包含较多长事务项集时,算法的时间和空间效率会受到更大的影响.针对此问题,通过将事务项集和项集效用信息有效地保存到树结构HUP-Tree,给出一个不需要候选项集的挖掘算法TOPKHUP; HUP-Tree树能保证从中计算到每个模式的效用值,不需要再扫描数据集来计算模式的效用值,从而使挖掘算法的时空效率得到较大的提高.采用7个典型数据集对算法的性能进行测试,实验结果证明TOPKHUP的时间和空间效率都优于已有算法,并对K值的变化保持平稳.