查询结果:   顾军华,李如婷,张亚娟,董彦琦.改进的频繁项集挖掘算法及其应用研究[J].计算机应用与软件,2019,36(9):260 - 269.
中文标题
改进的频繁项集挖掘算法及其应用研究
发表栏目
算法
摘要点击数
45
英文标题
IMPROVED FREQUENT ITEMSETS MINING ALGORITHM AND ITS APPLICATION
作 者
顾军华 李如婷 张亚娟 董彦琦 Gu Junhua Li Ruting Zhang Yajuan Dong Yanqi
作者单位
河北工业大学人工智能与数据科学学院 天津 300401 河北省大数据计算重点实验室 天津 300401    
英文单位
School of Artificial Intelligence and Data Science, Hebei University of Technology, Tianjin 300401, China Hebei Province Key Laboratory of Big data Computing, Tianjin 300401, China    
关键词
关联规则 频繁项集挖掘 构建树 剪枝策略 人才引进
Keywords
Association rule Frequent itemsets mining Building tree Pruning strategy Talent introduction
基金项目
河北省科技计划项目(17210305D);天津市科技计划项目(15ZXHLGX00130)
作者资料
顾军华,教授,主研领域:数据挖掘,智能信息处理。李如婷,硕士生。张亚娟,实验师。董彦琦,硕士生。 。
文章摘要
频繁模式增长(FP-growth)算法是挖掘频繁项集的经典算法,解决了挖掘频繁项集时需多次扫描数据库且产生大量候选项集的问题,但大多数基于FP-growth思想的算法在生成频繁项集时存在过程复杂、占用空间多的问题。为此,提出一种基于前序完全构造链表(PF-List)的频繁项集挖掘算法(PFLFIM)。该算法使用PF-List表示项集,通过简单比较和连接两个PF-List挖掘频繁项集,避免复杂的连接操作;使用包含索引、提前停止交集和父子等价策略对搜索空间进行优化,减少空间占用。通过实验验证,相比于FIN算法和negFIN算法,该算法在运行时间和内存占用方面具有更好的性能。将该算法应用于高校人力资源管理系统中进行关联规则挖掘,寻找影响人才发展的因素,为高校人才引进和选拔提供决策支持。
Abstract
Frequent Pattern growth(FP-growth) algorithm is a classic algorithm for mining frequent itemsets. It solves the problem of scanning the database multiple times and generating a large number of candidate sets, but most of the algorithms based on FP-growth idea have the problem of complex process and space occupation. Therefore, we proposed a frequent itemsets mining algorithm(PFLFIM) based on PF-List. PF-List was employed to represent itemsets. By simply comparing and connecting two PF-Lists to mine frequent itemsets, complex join operations were avoided. The search space was optimized by using the strategies of subsume index, stop intersection beforehand, father-son equivalence, which reduced the space occupation. The experimental results show that the algorithm is superior to the FIN algorithm and the negFIN algorithm on both running time and space occupancy. The algorithm is applied to mining association rules in human resource management system of colleges and universities to find factors affecting the development of talents, and it provides decision support for the talent introduction of universities.
下载PDF全文   

根据该篇关键词查找到本刊已发表相关论文供参考
序号
文  章  标  题
作者1
发表栏目
页码
摘要
1
改进的频繁项集挖掘算法及其应用研究
顾军华
算法
2019
9
260
[摘要]
2
基于Spark的并行频繁项集挖掘算法
张素琪
数据工程
2019
2
24
[摘要]
3
基于中智模糊关联规则生成的大数据挖掘分析算法
梁凡
算法
2019
10
摘要还未上传
4
一种改进的基于N-List的频繁项集挖掘算法
翟悦
数据工程
2018
9
67
[摘要]
5
基于多数据库的模糊元关联规则挖掘方法
刘小燕
数据工程
2018
5
42
[摘要]
6
基于OLAP和聚类分析的关联规则挖掘方法
熊中敏
数据工程
2018
5
55
[摘要]
7
全局模式下的深网数据抽取与挖掘
姚晓鹏
应用技术与研究
2018
2
91
[摘要]
8
基于分词的关联规则预测系统研究
王志超
应用技术与研究
2018
12
140
[摘要]
9
基于数据挖掘的攻击场景提取方法研究
彭梦停
安全技术
2018
10
317
[摘要]
10
使用多支持度的关联规则分类算法
黄亚东
算法
2017
9
246
[摘要]
11
Apriori改进算法在研究影响土壤反射率因素中的应用
孙斌
算法
2017
7
293
[摘要]
12
一种基于带权无向图的中医方剂频繁项集挖掘算法
谭龙
数据工程
2017
5
38
[摘要]
13
层次化聚类在分布式计算环境中的剪枝策略
丁晓阳
算法
2017
5
261
[摘要]
14
基于频繁项集挖掘算法的伴随车应用与实现
陈瑶
应用技术与研究
2017
4
60
[摘要]
15
基于前缀项集的Apriori算法改进
于守健
算法
2017
2
290
[摘要]
16
基于效用函数度量的多维效用关联规则挖掘
王仲君
数据工程
2017
12
36
[摘要]
17
基于二叉树编码的关联规则动态挖掘算法
王峰山
数据工程
2017
12
53
[摘要]
18
基于SVR预测的可逆数据库水印技术
龙晓泉
数据工程
2017
12
64
[摘要]
19
探索关联规则可视化的结构化关联映射图
易黎
数据工程
2017
12
68
[摘要]
20
基于特征相似的软件缺陷排除方法
张灿
软件技术与研究
2017
11
13
[摘要]
21
基于条件独立性的LiNGAM模型剪枝算法
郝志峰
算法
2016
8
249
[摘要]
22
基于MapReduce的DHP算法并行化研究
周国军
数据工程
2016
6
47
[摘要]
23
Hadoop下负载均衡的频繁项集挖掘算法研究
朱文飞
数据工程
2016
5
35
[摘要]
24
隐私保护下的组最近邻查询算法研究
刘晓乐
安全技术
2016
5
302
[摘要]
25
民航旅客服务信息系统告警关联规则挖掘
赵纪刚
应用技术与研究
2016
4
72
[摘要]
26
Chrome浏览器历史记录提取与分析
杨雪
安全技术
2016
12
313
[摘要]
27
基于关联规则挖掘的航班协同保障数据知识发现研究
丁建立
数据工程
2016
11
21
[摘要]
28
基于关联规则的语音情感中韵律特征抽取算法研究
徐照松
数据工程
2015
9
42
[摘要]
29
多特征协同的双层组合结构行人监控识别方法
吕真
人工智能与识别
2015
9
170
[摘要]
30
基于FP_Growth的消费行为关联分析系统设计与实现
黄伟
数据工程
2015
8
34
[摘要]
31
一种基于Apriori的微博推荐并行算法
丛颖
算法
2015
8
229
[摘要]
32
基于关联规则的垃圾邮件分类模型
邓慧
信息技术交流
2015
8
320
[摘要]
33
基于FARM降低系统性偏差的缺陷修复时间预测方法
吴含宇
软件技术与研究
2015
7
5
[摘要]
34
基于加权关联规则和文本挖掘的金融新闻传播Agent实现
张人上
人工智能与识别
2015
6
188
[摘要]
35
综合控制流与数据流分析的主机异常检测新方法
吴敏
软件技术与研究
2015
5
33
[摘要]
36
基于概念格的无冗余关联规则提取算法
翟悦
数据工程
2015
4
46
[摘要]
37
基于滑动窗口的不确定性数据流频繁项集挖掘算法
刘慧婷
数据工程
2015
12
12
[摘要]
38
基于多维关联规则的电网脆弱性识别研究
颜宏文
数据工程
2015
11
36
[摘要]
39
一种基于加权规则的显著模式挖掘算法
熊政
应用技术与研究
2015
11
53
[摘要]
40
分布式频繁项集挖掘算法
陈明洁
数据工程
2015
10
63
[摘要]
41
一种适合于保险产品的个性化推荐算法
徐锡忠
算法
2015
10
279
[摘要]
42
基于等价类规则树的高效关联规则挖掘算法
刘晓蔚
信息技术交流
2015
1
313
[摘要]
43
基于RGMM的离散基因表达数据关联规则挖掘
黄睿
人工智能与识别
2014
9
191
[摘要]
44
一种基于R﹡树的自相似性连接算法
周健雯
数据工程
2014
8
50
[摘要]
45
基于数据场的量化关联规则挖掘研究与实现
孟海东
数据库技术
2014
7
40
[摘要]
46
基于知识点的多支持度挖掘算法
杨鹤标
人工智能与识别
2014
7
169
[摘要]
47
一种基于关联规则与支持向量机的基因表达数据分类模型
王美华
人工智能与识别
2014
5
155
[摘要]
48
一种快速的自顶向下挖掘算法
胡宁
算法
2014
5
272
[摘要]
49
一种直接生成频繁项集的分治Apriori算法
郑麟
算法
2014
4
297
[摘要]
50
基于时间规律的独居老人日常行为异常预警系统设计
许丹纯
信息技术交流
2014
3
314
[摘要]
51
基于概念格中紧致依赖的空间数据挖掘方法研究
曾子维
数据库技术
2014
2
33
[摘要]
52
基于RESTFUL的面向服务数据挖掘原型系统的设计与实现
马青霞
数据库技术
2014
2
41
[摘要]
53
云计算环境下的关联挖掘在图书销售中的研究
郭健
数据工程
2014
11
50
[摘要]
54
基于概念格的频繁闭项集挖掘方法
翟悦
数据工程
2014
11
54
[摘要]
55
一种基于数据两方垂直分布的多维关联规则挖掘算法
李海磊
数据库技术
2014
1
18
[摘要]
56
基于观点挖掘的产品特征提取
刘羽
应用技术与研究
2014
1
81
[摘要]