查询结果:   赵锦阳,卢会国,蒋娟萍,袁培培,柳学丽.一种非平衡数据分类的过采样随机森林算法[J].计算机应用与软件,2019,36(4):255 - 261,316.
中文标题
一种非平衡数据分类的过采样随机森林算法
发表栏目
算法
摘要点击数
46
英文标题
AN OVERSAMPLING RANDOM FOREST ALGORITHM FOR CLASSIFICATION OF IMBALANCE DATA
作 者
赵锦阳 卢会国 蒋娟萍 袁培培 柳学丽 Zhao Jinyang Lu Huiguo Jiang Juanping Yuan Peipei Liu Xueli
作者单位
成都信息工程大学电子工程学院 四川 成都 610225 中国气象局大气探测重点开放实验室 四川 成都 610225 电子科技大学航空航天学院 四川 成都 611731 南京财经大学信息工程学院 江苏 南京 210000  
英文单位
College of Electronic Engineering, Chengdu University of Information Technology, Chengdu 610225, Sichuan,China Key Laboratory of Atmospheric Sounding of CMA, Chengdu 610225, Sichuan,China School of Astronautics and Aeronautic, University of Electronic Science and Technology of China, Chengdu 611731, Sichuan,China College of Information Engineering, Nanjing University of Finance and Economics, Nanjing 210000, Jiangsu,China  
关键词
非平衡数据集 少数类 合成样本 分类
Keywords
Imbalance dataset Minority class Synthetic sample Classification
基金项目
四川省教育厅重点科技计划资助项目(14ZA0170)
作者资料
赵锦阳,硕士生,主研领域:信号与信息处理。卢会国,副教授。蒋娟萍,讲师。袁培培,硕士生。柳学丽,硕士生。 。
文章摘要
在灾害天气、故障诊断、网络攻击和金融欺诈等领域经常存在不平衡的数据集。针对随机森林算法在非平衡数据集上表现的分类性能差的问题,提出一种新的过采样方法:SCSMOTE(Seed Center Synthetic Minority Over-sampling Technique)算法。该算法的关键是在数据集的少数类样本中找出合适的候选样本,计算出候选样本的中心,在候选样本与样本中心之间产生新的少数类样本,实现了对合成少数类样本质量的控制。结合SCSMOTE算法与随机森林算法来处理非平衡数据集,通过在UCI数据集上对比实验结果表明,该算法有效提高了随机森林在非平衡数据集上的分类性能。
Abstract
There are often imbalanced datasets in disaster weather, fault diagnosis, network attacks and financial fraud. In view of the poor classification performance of random forest algorithm on imbalanced datasets, this paper proposed a new oversampling method: SCSMOTE (Seed Center Synthetic Minority Over-sampling Technique). The key of the algorithm is to find appropriate candidate samples from the minority samples of the dataset. Then we calculated the center of the candidate samples, produced new minority samples between the candidate samples and the sample center, and realized the control of the quality of synthesis the minority class samples. SCSMOTE algorithm and random forest algorithm were combined to deal with imbalance datasets. The experimental results on UCI data sets show that the algorithm effectively improves the classification performance of random forest on imbalanced datasets.
下载PDF全文   

根据该篇关键词查找到本刊已发表相关论文供参考
序号
文  章  标  题
作者1
发表栏目
页码
摘要
1
特征级融合方法及其在医学图像方面的应用
张飞飞
综合评述
2019
4
1
[摘要]
2
基于全球恐怖主义数据库的特征选择方法研究
姜国庆
数据工程
2019
4
51
[摘要]
3
基于虚假评论识别的微博评论情感分析的研究与应用
罗昌银
应用技术与研究
2019
4
55
[摘要]
4
一套儿童课外读物信息管理系统的设计
邢睿智
应用技术与研究
2019
4
86
[摘要]
5
集成支持向量机在OCT血管内斑块分割中的应用与研究
杨云
应用技术与研究
2019
4
103
[摘要]
6
基于CNN-LSTM网络的声纹识别研究
闫河
人工智能与识别
2019
4
166
[摘要]
7
叠加去噪自动编码器结合深度神经网络的心电图信号分类方法
颜菲
人工智能与识别
2019
4
178
[摘要]
8
有监督鉴别哈希跨模态检索
朱治兰
算法
2019
4
223
[摘要]
9
配电网暂时过电压奇异值分解结合支持向量机的识别方法
付华
算法
2019
4
230
[摘要]
10
一种改进的协同过滤算法在中小企业服务平台的研究与应用
喻金平
算法
2019
4
236
[摘要]
11
基于KMSMOTE和随机森林的爬升段油耗分类
陈静杰
算法
2019
4
247
[摘要]
12
一种非平衡数据分类的过采样随机森林算法
赵锦阳
算法
2019
4
255
[摘要]
13
营销活动问题标签分类语料库的构建与分类研究
徐俊利
数据工程
2019
3
42
[摘要]
14
基于傅里叶描述子和加权稀疏表示的军事图像分类方法
谢泽奇
应用技术与研究
2019
3
68
[摘要]
15
基于改进的直方图均衡化与边缘保持平滑滤波的红外图像增强算法
李贤阳
应用技术与研究
2019
3
96
[摘要]
16
fMRI在注意缺陷多动障碍症的应用
李楠
应用技术与研究
2019
3
121
[摘要]
17
视频监控中私自揽客违法行为检测
张若杨
人工智能与识别
2019
3
168
[摘要]
18
基于深度CNN和极限学习机相结合的实时文档分类
闫河
人工智能与识别
2019
3
174
[摘要]
19
基于卷积神经网络嵌套模型的人群异常行为检测
孙月驰
人工智能与识别
2019
3
196
[摘要]
20
基于RPN与B-CNN的细粒度图像分类算法研究
赵浩如
图像处理与应用
2019
3
210
[摘要]
21
基于SA-SVM的中文文本分类研究
郭超磊
算法
2019
3
277
[摘要]
22
新型入侵增量识别入侵检测模型
刘佳
安全技术
2019
3
320
[摘要]
23
基于人工蜂群算法的分布式入侵攻击检测系统
谭继安
安全技术
2019
3
326
[摘要]
24
基于学习排序的多分类标签排序方法研究
贺成诚
软件技术与研究
2019
2
7
[摘要]
25
基于混合式架构城市轨道交通大数据平台与运营决策应用
张铭
应用技术与研究
2019
2
85
[摘要]
26
基于深度信念网络的CYP450 2C9抑制性分类
李自臣
人工智能与识别
2019
2
189
[摘要]
27
基于灰度混合核AR-SVM的预警模型及应用
贾茹阁
人工智能与识别
2019
2
200
[摘要]
28
一种基于语义的上下位关系抽取方法
陈金栋
人工智能与识别
2019
2
216
[摘要]
29
二进制特征与联合层叠结构的人脸识别研究
胡佩
人工智能与识别
2019
2
228
[摘要]
30
基于改进卷积神经网络的动态障碍物检测方法
孙凯
人工智能与识别
2019
2
235
[摘要]
31
基于Logistic回归和BPNN的二值人脸图像识别
王海燕
人工智能与识别
2019
2
240
[摘要]
32
基于改进的DenseNet深度网络火灾图像识别算法
杨其睿
图像处理与应用
2019
2
258
[摘要]
33
基于依存语法的祈使句分类研究
涂锦宇
算法
2019
2
279
[摘要]
34
中文作文句间逻辑合理性智能判别方法研究
刘杰
应用技术与研究
2019
1
71
[摘要]
35
基于双向LSTM的电网调度日志分类
徐家慧
应用技术与研究
2019
1
142
[摘要]
36
基于LSTM/NN的道岔故障特征提取与识别研究
唐维华
应用技术与研究
2019
1
159
[摘要]
37
基于SVM的学科试题自动分类研究
刘一然
人工智能与识别
2019
1
197
[摘要]
38
基于深度学习的锂电池褶皱检测方法的研究
王刚
人工智能与识别
2019
1
216
[摘要]
39
基于TextRank和字符级卷积神经网络的小学作文素材自动分类模型研究
朱晓亮
人工智能与识别
2019
1
220
[摘要]
40
局部信息保持极限学习机的遥感图像分类
何阳
图像处理与应用
2019
1
263
[摘要]
41
基于机器学习的贫困生分类预测研究
陆桂明
信息技术交流
2019
1
316
[摘要]
42
基于综合改进随机森林算法的中国财政风险预警研究
刘新雯
数据工程
2018
9
73
[摘要]
43
基于改进深度卷积神经网络的病理图像有丝分裂检测算法研究
齐莹
人工智能与识别
2018
9
199
[摘要]
44
基于小波分解和Mel频率的儿童咳嗽干湿性自动分类
俞一奇
人工智能与识别
2018
9
205
[摘要]
45
基于FC-KNN的C语言程序自动评分算法
李亭葳
人工智能与识别
2018
9
225
[摘要]
46
基于小波和可变局部边缘模式的植物物种识别
陈肖蒙
图像处理与应用
2018
9
230
[摘要]
47
基于卷积神经网络的多标签飞机识别算法
孙振华
算法
2018
9
270
[摘要]
48
模糊t-closeness隐私保护方法研究
陈晓宇
安全技术
2018
9
317
[摘要]
49
基于不平衡数据分类的中药肝毒性检测
郭玉萱
多媒体技术应用
2018
8
226
[摘要]
50
基于隐高斯模型的多元离散数据异常检测
李楠芳
人工智能与识别
2018
8
249
[摘要]
51
基于词向量特征扩展的中文短文本分类研究
雷朔
算法
2018
8
269
[摘要]
52
基于粗糙集和遗传算法的中医方证相关性研究
陈建国
人工智能与识别
2018
7
211
[摘要]
53
改进的Alexnet模型及在油井示功图分类中的应用
段友祥
人工智能与识别
2018
7
226
[摘要]
54
具有变精度反馈机制的脱机手写体汉字智能认知
王建平
人工智能与识别
2018
7
231
[摘要]
55
基于卷积神经网络和迁移学习的乳腺癌病理图像分类
郑群花
图像处理与应用
2018
7
237
[摘要]
56
基于改进卷积神经网络的机动车图像分类算法
王茜
图像处理与应用
2018
7
263
[摘要]
57
基于Hadoop的中医症状群分类应用
石艳敏
信息技术交流
2018
7
325
[摘要]
58
基于深度学习的代码分析研究综述
张峰逸
综合评述
2018
6
9
[摘要]
59
一种异构集成学习的儿科疾病诊断方法研究
霍东雪
应用技术与研究
2018
6
54
[摘要]
60
基于增量贝叶斯学习模型的在线电路故障诊断
李梦婷
应用技术与研究
2018
6
70
[摘要]
61
生成式对抗网络在抑郁症分类中的应用
刘宁
人工智能与识别
2018
6
163
[摘要]
62
一种双阶段的高速高精度LED固晶识别定位方法
李呈怡
人工智能与识别
2018
6
169
[摘要]
63
基于降维与聚类的无人机航拍图拼接配准算法
鲁萍萍
图像处理与应用
2018
6
220
[摘要]
64
基于栈式自编码器的FTIR光谱识别
李四海
算法
2018
6
254
[摘要]
65
基于模糊C均值改进的粒化特征加权多标签分类算法
柴瑞敏
算法
2018
6
286
[摘要]
66
基于标签传播的P2P网络借贷平台分类
刘翱
安全技术
2018
6
292
[摘要]
67
会话密钥协商协议研究进展
胡志言
综合评述
2018
5
1
[摘要]
68
基于交易数据的信用评估方法
陈煜
应用技术与研究
2018
5
168
[摘要]
69
基于空间-光谱信息融合的Gabor PCA高光谱人脸识别算法研究
施晓倩
人工智能与识别
2018
5
213
[摘要]
70
融合特征基于深度多核学习的动态表情识别
何秀玲
人工智能与识别
2018
5
218
[摘要]
71
局部遮挡条件下的人脸识别
岳震
人工智能与识别
2018
5
224
[摘要]
72
基于纹理特征的焊缝图像缺陷识别方法
孙士保
图像处理与应用
2018
5
242
[摘要]
73
多特征的网络钓鱼检测算法研究
黄亦睿
算法
2018
5
264
[摘要]
74
基于堆栈稀疏自编码的K-均值聚类算法的种质评价
李伟
算法
2018
5
269
[摘要]
75
基于DBN和TSVM的混合入侵检测模型研究
张克君
安全技术
2018
5
313
[摘要]
76
应用于地理信息数据自动分类的高性能聚类算法
夏梦
数据工程
2018
4
65
[摘要]
77
可拓传导知识挖掘系统的设计与实现
叶广仔
应用技术与研究
2018
4
129
[摘要]
78
基于不可分小波变换与Zernike矩的印刷体汉字识别
刘斌
人工智能与识别
2018
4
227
[摘要]
79
基于联合分类器的非自然图像检索
许婷婷
图像处理与应用
2018
4
244
[摘要]
80
一种基于不规则三角网的地层等值线绘制方法
段友祥
图像处理与应用
2018
4
249
[摘要]
81
AUCRF算法在信用风险评价中的特征选择研究
刘忻梅
算法
2018
4
293
[摘要]
82
一种基于感知哈希选择的最邻近入侵检测方法
江泽涛
安全技术
2018
4
296
[摘要]
83
基于极坐标变换的脱机手写藏文字符特征提取方法
朱利娟
人工智能与识别
2018
3
162
[摘要]
84
基于CIFAR-10的图像分类模型优化
张占军
图像处理与应用
2018
3
177
[摘要]
85
基于机器学习的图像偏色检测
马成前
图像处理与应用
2018
3
199
[摘要]
86
基于co-location模式的空间分类算法
赵秦怡
算法
2018
3
225
[摘要]
87
局部一致性的信息熵Relief特征加权
张敏
算法
2018
3
247
[摘要]
88
基于自适应Voronoi检测器的故障检测算法
尹中川
算法
2018
3
257
[摘要]
89
消除属性间依赖的C4.5决策树改进算法
唐耀先
算法
2018
3
262
[摘要]
90
基于注意力的BiLSTM-CNN中文微博立场检测模型
白静
算法
2018
3
266
[摘要]
91
基于异质多视图主动学习的高光谱地物分类
姚琼
最新技术动态
2018
2
1
[摘要]
92
深度置信网络的Spark并行化在微博情感分类中的应用研究
张翔
数据工程
2018
2
48
[摘要]
93
基于L0稀疏超图半监督学习的异常用电行为识别
郭志民
应用技术与研究
2018
2
54
[摘要]
94
基于大气电场值的雷电发生识别方法
虢韬
应用技术与研究
2018
2
86
[摘要]
95
基于病情自述和知识图谱的疾病辅助诊断
张利萍
人工智能与识别
2018
2
161
[摘要]
96
基于知识图谱的智能答疑系统研究
陈志云
人工智能与识别
2018
2
178
[摘要]
97
基于分块的有遮挡人脸识别算法
周孝佳
人工智能与识别
2018
2
183
[摘要]
98
基于最优特征更新分类器的压缩跟踪算法
冷建伟
人工智能与识别
2018
2
206
[摘要]
99
基于下肢轮廓角度距离和步幅变化的步态识别算法研究
王希娟
图像处理与应用
2018
2
235
[摘要]
100
用于分类决策的有序判别指标性能比较
裴生雷
算法
2018
2
279
[摘要]
101
基于神经网络的图像弱监督语义分割算法
顾攀
算法
2018
2
284
[摘要]
102
信息安全意识评价模型研究
孙夫雄
安全技术
2018
2
294
[摘要]
103
组合分类器在金融行业数据分类中的应用研究
陈江涛
信息技术交流
2018
2
325
[摘要]
104
聊天机器人系统研究进展
王浩畅
综合评述
2018
12
1
[摘要]
105
基于深度学习的移动社交网络用户分类研究
王嘉祺
应用技术与研究
2018
12
42
[摘要]
106
轨道交通线网大数据的建模和存储方案
陈莉莉
应用技术与研究
2018
12
131
[摘要]
107
基于区域网格划分的SVM室内定位算法
贾春阳
网络与通信
2018
12
148
[摘要]
108
用电特征指标降维与极限学习机算法的窃电检测
李梓欣
人工智能与识别
2018
12
179
[摘要]
109
改进的卷积神经网络图片分类识别方法
闫河
人工智能与识别
2018
12
193
[摘要]
110
基于深度学习的图片问答系统设计研究
周远侠
人工智能与识别
2018
12
199
[摘要]
111
尖锐特征曲面点云模型各向异性邻域搜索
袁小翠
算法
2018
12
253
[摘要]
112
基于CPD-SMOTE的类不平衡数据分类算法研究
彭如香
算法
2018
12
259
[摘要]
113
基于邻域组合熵的属性约简算法
王光琼
算法
2018
12
269
[摘要]
114
基于神经网络的金融市场艾略特波浪识别
李音润
算法
2018
12
285
[摘要]
115
JavaScript代码分析技术综述
史橹
软件技术与研究
2018
11
16
[摘要]
116
基于IBA-ELM的发动机燃油系统故障诊断研究
靖婉婷
应用技术与研究
2018
11
89
[摘要]
117
基于改进的PSO算法优化FSVM的滚动轴承故障诊断
林雅慧
应用技术与研究
2018
11
94
[摘要]
118
基于MSVM算法的Android恶意应用检测研究
郭平
网络与通信
2018
11
209
[摘要]
119
基于建筑信息模型(BIM)的建筑空间功能分类方法
金超逸
人工智能与识别
2018
11
220
[摘要]
120
基于SqueezeNet的轻量化卷积神经网络SlimNet
董艺威
人工智能与识别
2018
11
226
[摘要]
121
K近邻分类指导的区域迭代图割算法研究
管建
图像处理与应用
2018
11
237
[摘要]
122
基于深度学习的青梅品级半监督智能认知方法
李帷韬
图像处理与应用
2018
11
245
[摘要]
123
ARMv8-A Return-Oriented Programming实现方法
赵利军
嵌入式软件与应用
2018
11
253
[摘要]
124
抗机器学习检测的Android应用流量混淆过程
吴超
安全技术
2018
11
301
[摘要]
125
一种中小学汉语作文表现手法分类方法
马晓丽
应用技术与研究
2018
10
49
[摘要]
126
基于Leap Motion手势识别方法在树木交互的应用
王红全
人工智能与识别
2018
10
153
[摘要]
127
基于高斯混合模型与CNN的奶牛个体识别方法研究
刘杰鑫
人工智能与识别
2018
10
159
[摘要]
128
基于知识蒸馏方法的行人属性识别研究
凌弘毅
人工智能与识别
2018
10
181
[摘要]
129
基于多路特征融合和深度学习的露霜图像分类
周忠义
图像处理与应用
2018
10
205
[摘要]
130
FM集成模型在广告点击率预估中的应用
潘博
应用技术与研究
2018
1
107
[摘要]
131
不平衡数据分类研究及其应用
叶枫
应用技术与研究
2018
1
132
[摘要]
132
基于Curvelet变换特征的人脸识别算法
杨晋吉
人工智能与识别
2018
1
169
[摘要]
133
结合卷积神经网络不同层的特征进行包类商品检索
骆正茂
人工智能与识别
2018
1
195
[摘要]
134
基于深度学习的鱼类分类算法研究
顾郑平
人工智能与识别
2018
1
200
[摘要]
135
基于高斯混合模型的叶片检测分割算法
侯兆静
图像处理与应用
2018
1
253
[摘要]
136
基于改进提升模型的视频目标跟踪算法
罗建华
图像处理与应用
2018
1
261
[摘要]
137
不平衡数据分类预测的阈值优化算法ε-KSVM
金鑫
算法
2018
1
276
[摘要]
138
基于噪声自检测的并行AdaBoost算法
徐坚
算法
2018
1
288
[摘要]
139
L2-SVM下的短文本情感分类动态CNN模型
鲁新新
算法
2018
1
298
[摘要]
140
AABC-SVM模型及其在商品评论情感分类中的应用
王丹丹
数据工程
2017
9
33
[摘要]
141
一种通用的数据可视化模型设计与实现
宋美娜
数据工程
2017
9
38
[摘要]
142
基于正文和标题文本分类的主题建模
郑诚
应用技术与研究
2017
9
77
[摘要]
143
基于AppCan的移动微课系统设计与实现
王莉
应用技术与研究
2017
9
88
[摘要]
144
基于深度学习的PD致病基因活性预测
李自臣
人工智能与识别
2017
9
183
[摘要]
145
基于整体外观特征的植物种类识别研究
陈淑君
图像处理与应用
2017
9
222
[摘要]
146
使用多支持度的关联规则分类算法
黄亚东
算法
2017
9
246
[摘要]
147
支持向量机算法应用于2FSK信号分类
王新艳
算法
2017
9
262
[摘要]
148
人脸检测与跟踪算法优化及Web端实现
陈丽枫
算法
2017
9
279
[摘要]
149
异构数据驱动和UML融合的供应链智能控制系统设计
张生福
信息技术交流
2017
9
312
[摘要]
150
基于移动端的月季花快速识别方法研究
庞俊震
软件技术与研究
2017
8
36
[摘要]
151
新型农村社区就业信息服务系统的研究与构建
郑光
软件技术与研究
2017
8
48
[摘要]
152
面向智能人机交互的鲁棒的实时多人脸检测
赵新超
人工智能与识别
2017
8
162
[摘要]
153
基于CMYK-H-CbCr肤色检测和改进型AdaBoost算法的人脸检测
方承志
人工智能与识别
2017
8
167
[摘要]
154
基于主题模型的改进随机森林算法在文本分类中的应用
姚立
人工智能与识别
2017
8
173
[摘要]
155
基于高阶谱谱骨架的信号细微特征识别
王欢欢
人工智能与识别
2017
8
179
[摘要]
156
显著性目标检测中的视觉特征及融合
袁小艳
图像处理与应用
2017
8
213
[摘要]
157
基于改进的CNN多级分类的行人检测算法研究
杨杰
图像处理与应用
2017
8
220
[摘要]
158
基于图像特征与竞争型神经网络的蟹苗密度估计
张帆
图像处理与应用
2017
8
236
[摘要]
159