查询结果:   彭如香,杨涛,孔华锋,姜国庆,凡友荣.基于CPD-SMOTE的类不平衡数据分类算法研究[J].计算机应用与软件,2018,35(12):259 - 262,268.
中文标题
基于CPD-SMOTE的类不平衡数据分类算法研究
发表栏目
算法
摘要点击数
118
英文标题
CLASS IMBALANCE DATA CLASSIFICATION ALGORITHM BASED ON CPD-SMOTE
作 者
彭如香 杨涛 孔华锋 姜国庆 凡友荣 Peng Ruxiang Yang Tao Kong Huafeng* Jiang Guoqing Fan Yourong
作者单位
公安部第三研究所 上海 201204 信息网络安全公安部重点实验室 上海 201204    
英文单位
Third Research Institute of Ministry of Public Security, Shanghai 210204, China Key Lab of Information Network Security, Shanghai 201204, China    
关键词
SMOTE 类不平衡 分类算法
Keywords
SMOTE Class imbalance Classification algorithm
基金项目
国家重点研发计划课题(2016YFC0800909);公安部科技强警基础工作专项项目(2018GBJC19);上海市科委科研项目(17DZ1101004)
作者资料
彭如香,助理研究员,主研领域:信息安全与数据挖掘。杨涛,副研究员。孔华锋,研究员。姜国庆,助理研究员。凡友荣,助理研究员。 。
文章摘要
类不平衡现象普遍存在于不同应用领域中,如金融欺诈、网络入侵、垃圾邮件过滤、医学检测,直接采用传统的学习分类算法,分类准确率较低。针对类不平衡情况对分类器的影响,基于传统过采样算法SMOTE(Synthetic Minority Oversampling Technique)算法处理类不平衡的有效性,致力进一步提升SMOTE算法性能,提出一种面向类不平衡数据集分类的改进型SMOTE算法——CPD-SMOTE算法。通过考虑训练集小样本的特征、位置及其周围样本分布,来确定小样本的强相关邻居集,以此作为SMOTE最近邻居集,产生新的小样本。实验结果表明,CPD-SMOTE算法在处理不平衡数据集上相比SMOTE、Borderline-SMOTE、ADASYN、LN-SMOTE等算法有所提高。
Abstract
Class imbalance is a common phenomenon existing in different applications, such as financial fraud, network intrusion, spam filtering and medical detection. If we directly adopt the traditional learning classification algorithm, classification accuracy is low. Aiming at the effect of class imbalance on classifier, this paper proposed an improved SMOTE algorithm, CPD-SMOTE algorithm, which was oriented to the classification of class imbalance datasets. Based on the effectiveness of traditional over-sampling algorithm SMOTE to deal with class imbalance, CPD-SMOTE algorithm was engaged in further improving the performance of SMOTE algorithm. CPD-SMOTE algorithm determined the strong correlation neighborhood set of small samples by considering the characteristics and location of small samples and distribution of their surrounding samples in the training set. It was used as the nearest neighbor set of SMOTE to generate new small samples. Experimental results show that CPD-SMOTE algorithm is better than SMOTE, Borderline-SMOTE, ADASYN and LN-SMOTE in dealing with imbalanced datasets.
下载PDF全文   

根据该篇关键词查找到本刊已发表相关论文供参考
序号
文  章  标  题
作者1
发表栏目
页码
摘要
1
基于RPN与B-CNN的细粒度图像分类算法研究
赵浩如
图像处理与应用
2019
3
210
[摘要]
2
基于SA-SVM的中文文本分类研究
郭超磊
算法
2019
3
277
[摘要]
3
新型入侵增量识别入侵检测模型
刘佳
安全技术
2019
3
320
[摘要]
4
中文作文句间逻辑合理性智能判别方法研究
刘杰
应用技术与研究
2019
1
71
[摘要]
5
基于不平衡数据分类的中药肝毒性检测
郭玉萱
多媒体技术应用
2018
8
226
[摘要]
6
基于改进卷积神经网络的机动车图像分类算法
王茜
图像处理与应用
2018
7
263
[摘要]
7
基于Hadoop的中医症状群分类应用
石艳敏
信息技术交流
2018
7
325
[摘要]
8
基于模糊C均值改进的粒化特征加权多标签分类算法
柴瑞敏
算法
2018
6
286
[摘要]
9
基于标签传播的P2P网络借贷平台分类
刘翱
安全技术
2018
6
292
[摘要]
10
AUCRF算法在信用风险评价中的特征选择研究
刘忻梅
算法
2018
4
293
[摘要]
11
基于co-location模式的空间分类算法
赵秦怡
算法
2018
3
225
[摘要]
12
基于自适应Voronoi检测器的故障检测算法
尹中川
算法
2018
3
257
[摘要]
13
组合分类器在金融行业数据分类中的应用研究
陈江涛
信息技术交流
2018
2
325
[摘要]
14
基于CPD-SMOTE的类不平衡数据分类算法研究
彭如香
算法
2018
12
259
[摘要]
15
不平衡数据分类研究及其应用
叶枫
应用技术与研究
2018
1
132
[摘要]
16
基于Curvelet变换特征的人脸识别算法
杨晋吉
人工智能与识别
2018
1
169
[摘要]
17
基于深度学习的鱼类分类算法研究
顾郑平
人工智能与识别
2018
1
200
[摘要]
18
使用多支持度的关联规则分类算法
黄亚东
算法
2017
9
246
[摘要]
19
基于图像特征与竞争型神经网络的蟹苗密度估计
张帆
图像处理与应用
2017
8
236
[摘要]
20
在弱标记的传感器时间序列上基于突变的事件分类
汪雅雯
算法
2017
7
198
[摘要]
21
扩展ReliefF的两种多标签特征选择算法
马晶莹
算法
2017
7
298
[摘要]
22
一种改进的增量式贝叶斯文本分类算法
吴国文
算法
2017
6
226
[摘要]
23
P2P应用流量的高效分类方法研究
陈金富
网络与通信
2017
4
110
[摘要]
24
一种基于深度学习的新型小目标检测方法
陈江昀
人工智能与识别
2017
10
227
[摘要]
25
基于BHNB的细粒度的Android恶意应用检测模型
孙磊
安全技术
2017
10
310
[摘要]
26
基于关联特征的贝叶斯Android恶意程序检测技术
王聪
安全技术
2017
1
286
[摘要]
27
基于卫星图像的古民居识别算法
杨帆
人工智能与识别
2016
9
154
[摘要]
28
基于蝙蝠算法的贝叶斯分类器优化研究
蒋礼青
算法
2016
9
259
[摘要]
29
基于证据K-NN改进算法的水声目标识别
杨蕊
算法
2016
9
288
[摘要]
30
基于多约简Fisher-VSM和SVM的文本情感分类
邢玉娟
算法
2016
9
301
[摘要]
31
基于mRMR的多关系朴素贝叶斯分类
张晶
数据工程
2016
8
57
[摘要]
32
基于数据集相似性的分类算法推荐
李洪奇
数据工程
2016
8
62
[摘要]
33
改进的增量贝叶斯模型的研究
苏志同
算法
2016
8
254
[摘要]
34
基于情感特征向量空间模型的中文商品评论倾向分类算法
董祥和
信息技术交流
2016
8
319
[摘要]
35
概念粗糙—支持向量机的启发式火焰特征优化与分类算法研究
沈雯
图像处理与应用
2016
6
212
[摘要]
36
基于PCA-SIFT特征与贝叶斯决策的图像分类算法
涂秋洁
图像处理与应用
2016
6
215
[摘要]
37
基于移动Agent的分布式Web搜索模型的设计与实现
李明
软件技术与研究
2016
4
18
[摘要]
38
一种基于信息融合的指纹奇异点提取及纹型分类算法
张晔
算法
2016
4
246
[摘要]
39
基于熵重要测度权重粗糙集的阿尔法多层凝聚入侵分类
王兴柱
安全技术
2016
3
320
[摘要]
40
基于KNN+层次SVM的文本自动分类技术
王金华
数据工程
2016
2
38
[摘要]
41
基于可变隶属度的模糊双支持向量机研究
任建华
人工智能与识别
2016
2
138
[摘要]
42
基于布鲁姆过滤器的计算机动态取证技术研究
鄢喜爱
安全技术
2016
2
299
[摘要]
43
Spark平台下的高效Web文本分类系统的研究
李涛
数据工程
2016
11
33
[摘要]
44
基于线性解码和深度回归预测的图像分类算法
张鸿
图像处理与应用
2016
11
130
[摘要]
45
一种朴素贝叶斯文本分类算法的分布并行实现
郭绪坤
算法
2016
11
240
[摘要]
46
汉语组块分析在情感分类中的应用研究
杜思奇
人工智能与识别
2016
10
167
[摘要]
47
RERM:一种基于评论挖掘的需求获取方法
崔建苓
数据工程
2015
8
28
[摘要]
48
一种改进的ISOMAP分类算法
杨秀锋
数据工程
2015
8
43
[摘要]
49
基于k-余弦曲率和WSVM的骨龄识别方法
李新华
人工智能与识别
2015
8
158
[摘要]
50
基于统计抽样的非均衡分类方法在软件缺陷预测中的应用
徐可欣
算法
2015
8
215
[摘要]
51
基于监督学习的微博情感分类方法
朱晓光
算法
2015
8
238
[摘要]
52
静息态功能脑网络的基因基础以及分类研究
郑晶晶
应用技术与研究
2015
4
59
[摘要]
53
Hadoop下基于粗糙集与贝叶斯的气象数据挖掘研究
张晨阳
应用技术与研究
2015
4
72
[摘要]
54
基于线性判别回归的最近-最远子空间分类鲁棒人脸识别
姚强
人工智能与识别
2015
4
160
[摘要]
55
一种基于蚁群优化的图像分类算法
屠莉
图像处理与应用
2015
4
202
[摘要]
56
基于系统调用时间特征的异常行为智能检测系统
赵刚
安全技术
2015
4
309
[摘要]
57
云计算环境下基于朴素贝叶斯的数据分类
张红蕊
数据工程
2015
3
27
[摘要]
58
基于动态约简的增量贝叶斯分类算法的研究
孙玲芳
人工智能与识别
2015
3
188
[摘要]
59
自动获取不同义项的相似词算法
王永生
算法
2015
3
258
[摘要]
60
采用边缘分类和平均偏差比较的分形图像编码
裔传俊
图像处理与应用
2015
2
211
[摘要]
61
半监督分类方法的研究
尚耐丽
人工智能与识别
2015
11
162
[摘要]
62
有向无环图-双支持向量机的多类分类方法
牛犇
人工智能与识别
2015
11
167
[摘要]
63
基于特征项区分度的加权朴素贝叶斯邮件过滤方法
王辉
应用技术与研究
2015
10
67
[摘要]
64
相关信息加权的自适应多标签分类算法
周浩
算法
2015
1
239
[摘要]
65
一种解决人脸识别误匹配灾难问题的方法
张永宏
人工智能与识别
2014
9
177
[摘要]
66
基于Fisher准则改进线性判别回归分类的人脸识别
曾贤灏
人工智能与识别
2014
9
184
[摘要]
67
基于加权补集的朴素贝叶斯文本分类算法研究
杜选
算法
2014
9
253
[摘要]
68
BP-AdaBoost分类算法的MapReduce并行化实现
李杨
算法
2014
8
261
[摘要]
69
最小化总投影误差优化一元回归分类的人脸识别
潘锋
人工智能与识别
2014
7
186
[摘要]
70
基于TFIDF与分类树的工程文本信息分类法
孔秋强
人工智能与识别
2014
6
174
[摘要]
71
一种基于加速坐标下降的大规模图像分类算法研究
王智勇
图像处理与应用
2014
4
208
[摘要]
72
一种基于核函数参数优化的属性选择算法
张运涛
算法
2014
4
305
[摘要]
73
遗传算法同步选择特征和支持向量机参数的网络入侵检测
李学峰
安全技术
2014
3
301
[摘要]
74
基于改进流形学习的数据分类算法
关健生
数据工程
2014
12
60
[摘要]
75
静息态功能脑网络差异指标分析及抑郁症分类应用
郭浩
应用技术与研究
2014
12
85
[摘要]
76
一种改进的基于支持向量机的多类分类方法
赵亮
人工智能与识别
2014
12
233
[摘要]
77
融合约束采样和面部对齐的稀疏表示人脸识别
刘晓飞
人工智能与识别
2014
10
192
[摘要]
78
集成PCA降维与分类算法的垃圾网页检测
李法良
算法
2014
10
269
[摘要]
79
基于惩罚的SVM和集成学习的非平衡数据分类算法研究
刘进军
人工智能与识别
2014
1
186
[摘要]