查询结果:   张燕,杜红乐.面向不均衡数据的动态抽样集成学习算法[J].计算机应用与软件,2019,36(6):271 - 276.
中文标题
面向不均衡数据的动态抽样集成学习算法
发表栏目
算法
摘要点击数
192
英文标题
DYNAMIC SAMPLING ENSEMBLE LEARNING ALGORITHM FOR IMBALANCED DATA
作 者
张燕 杜红乐 Zhang Yan Du Hongle
作者单位
商洛学院数学与计算机应用学院 陕西 商洛 726000     
英文单位
School of Mathematics and Computer Applications, Shangluo University, Shangluo 726000, Shaanxi, China     
关键词
抽样概率 不均衡数据 集成学习
Keywords
Sampling probability Imbalanced data Ensemble learning
基金项目
陕西省自然科学基础研究计划项目(2015JM6347);陕西省教育厅科技计划项目(15JK1218);商洛学院科学与技术项目(17sky003)
作者资料
张燕,讲师,主研领域:机器学习,信息安全。杜红乐,副教授。 。
文章摘要
针对网络行为数据不均衡的问题,从数据均衡化和集成学习两个角度出发,提出一种基于动态抽样概率的集成学习算法。依据抽样概分布对多数类样本进行重采样,相比随机抽样,能更准确地加大对错分样本的学习。在更新样本抽样概率时,依据本轮迭代之前所得分类器的集成测试分类效果,而不是只依据本轮迭代所得分类器的分类效果。用7组UCI数据集和KDDCUP数据集来评估算法在不均衡数据集下的分类性能,实验结果显示,算法在不均衡数据集上的分类性能都有相应的提高。
Abstract
In order to solve the problem of imbalanced network behavior data, we proposed a novel ensemble learning algorithm based on dynamic sampling probability. This algorithm resampled the majority class samples according to the sampling probability distribution. Compared to random sampling, this algorithm increased the learning of error samples more accurately. Then we updated the sample probability according to the classification effect of the classifiers before the round iteration. We evaluated the classification performance of the algorithm under unbalanced data sets with 7 sets of UCI data sets and KDDCUP data sets. Experimental results show that the classification performance of the algorithm on imbalanced data sets has been improved correspondingly.
下载PDF全文   

根据该篇关键词查找到本刊已发表相关论文供参考
序号
文  章  标  题
作者1
发表栏目
页码
摘要
1
一种结合模型集成的舆情管理模型的研究
唐存琛
数据工程
2019
6
31
[摘要]
2
面向不均衡数据的动态抽样集成学习算法
张燕
算法
2019
6
271
[摘要]
3
梯度提升随机森林模型及其在日前出清电价预测中的应用
谢晓龙
信息技术交流
2018
9
327
[摘要]
4
基于不平衡数据分类的中药肝毒性检测
郭玉萱
多媒体技术应用
2018
8
226
[摘要]
5
一种异构集成学习的儿科疾病诊断方法研究
霍东雪
应用技术与研究
2018
6
54
[摘要]
6
粒子群APIS-3D算法在三维传感网络中的定位研究
李锋
信息技术交流
2017
3
329
[摘要]
7
基于BHNB的细粒度的Android恶意应用检测模型
孙磊
安全技术
2017
10
310
[摘要]
8
一种大数据分析组件的自动化开发集成方法
陈茜
数据工程
2016
7
33
[摘要]
9
基于惩罚的SVM和集成学习的非平衡数据分类算法研究
刘进军
人工智能与识别
2014
1
186
[摘要]