查询结果:   陈静杰,崔金成.基于KMSMOTE和随机森林的爬升段油耗分类[J].计算机应用与软件,2019,36(4):247 - 250,316.
中文标题
基于KMSMOTE和随机森林的爬升段油耗分类
发表栏目
算法
摘要点击数
392
英文标题
FUEL CONSUMPTION CLASSIFICATION IN CLIMBING PHASE BASED ON KMSMOTE AND RANDOM FOREST
作 者
陈静杰 崔金成 Chen Jingjie Cui Jincheng
作者单位
中国民航大学电子信息与自动化学院 天津 300300     
英文单位
College of Electronic Information and Automation, Civil Aviation University of China, Tianjin 300300, China     
关键词
爬升段 不平衡 k-medoids SMOTE 随机森林
Keywords
Climbing phase Imbalance k-medoids SMOTE Random forest
基金项目
国家科技支撑计划项目(2012BAC20B0304)
作者资料
陈静杰,教授,主研领域:航空系统优化与仿真,民航运输过程能效管理与碳排放控制。崔金成,硕士生。 。
文章摘要
为了解决飞机燃油消耗预测过程中的数据不平衡问题,传统SMOTE方法对少数类随机构造伪样本,从而导致了数据分布的整体变化和模糊了区间边界。针对以上问题,提出一种基于k-medoids的改进SMOTE算法,即KMSMOTE,并以随机森林作为分类器进行爬升段油耗分类。该方法使用k-medoids对少数类进行聚类操作,在聚类簇的基础上使用SMOTE构造伪样本,确保分类结果不会偏向多数类;应用随机森林算法生成分类器。选取国内同一航线、同一机型的多个航班数据为实验样本,实验结果表明,改进后的算法分类效果更好。
Abstract
In order to solve the problem of data imbalance in the prediction of aircraft fuel consumption, the traditional SMOTE randomly constructs a few pseudo-samples, which leads to the overall change of data distribution and the blurs of the interval boundary. Aiming at the above problems, we proposed an improved SMOTE based on k-medoids, namely KMSMOTE, and random forest was used as classifier to classify the fuel consumption in the climbing phase. In this method, k-medoids was used to cluster a few classes, and SMOTE was applied to construct pseudo-samples on the basis of clustering, so as to ensure that the classification results were not biased towards most classes. We used the random forest to generate the classifier. Multiple flight data of the same airline and the same aircraft type in the domestic were selected as experimental samples. The experimental results show that the improved algorithm has better classification effect.
下载PDF全文   

根据该篇关键词查找到本刊已发表相关论文供参考
序号
文  章  标  题
作者1
发表栏目
页码
摘要
1
SDN中基于机器学习的网络流量分类方法研究
李兆斌
网络与通信
2019
5
75
[摘要]
2
基于多示例遗传神经网络的室内PM2.5预测
陈成
算法
2019
5
235
[摘要]
3
基于全球恐怖主义数据库的特征选择方法研究
姜国庆
数据工程
2019
4
51
[摘要]
4
基于KMSMOTE和随机森林的爬升段油耗分类
陈静杰
算法
2019
4
247
[摘要]
5
一种非平衡数据分类的过采样随机森林算法
赵锦阳
算法
2019
4
255
[摘要]
6
基于改进的DenseNet深度网络火灾图像识别算法
杨其睿
图像处理与应用
2019
2
258
[摘要]
7
基于综合改进随机森林算法的中国财政风险预警研究
刘新雯
数据工程
2018
9
73
[摘要]
8
梯度提升随机森林模型及其在日前出清电价预测中的应用
谢晓龙
信息技术交流
2018
9
327
[摘要]
9
基于不平衡数据分类的中药肝毒性检测
郭玉萱
多媒体技术应用
2018
8
226
[摘要]
10
基于情绪基调的音视频双模态情绪识别算法
卫飞高
人工智能与识别
2018
8
238
[摘要]
11
基于降采样的堆模型预测大型规模网络课程的学习结果
林菲
应用技术与研究
2018
7
131
[摘要]
12
基于交易数据的信用评估方法
陈煜
应用技术与研究
2018
5
168
[摘要]
13
多特征的网络钓鱼检测算法研究
黄亦睿
算法
2018
5
264
[摘要]
14
AUCRF算法在信用风险评价中的特征选择研究
刘忻梅
算法
2018
4
293
[摘要]
15
基于大气电场值的雷电发生识别方法
虢韬
应用技术与研究
2018
2
86
[摘要]
16
基于CPD-SMOTE的类不平衡数据分类算法研究
彭如香
算法
2018
12
259
[摘要]
17
FM集成模型在广告点击率预估中的应用
潘博
应用技术与研究
2018
1
107
[摘要]
18
不平衡数据分类研究及其应用
叶枫
应用技术与研究
2018
1
132
[摘要]
19
一种新颖的混合相似度计算模型
廖志芳
人工智能与识别
2018
1
175
[摘要]
20
不平衡数据分类预测的阈值优化算法ε-KSVM
金鑫
算法
2018
1
276
[摘要]
21
基于主题模型的改进随机森林算法在文本分类中的应用
姚立
人工智能与识别
2017
8
173
[摘要]
22
基于轮转部署的RAID6分布式存储系统扩容方案
高帅
应用技术与研究
2016
8
121
[摘要]
23
基于随机森林的缺损杂草种子识别
龙怡霖
人工智能与识别
2016
8
185
[摘要]
24
改进的增量贝叶斯模型的研究
苏志同
算法
2016
8
254
[摘要]
25
基于遥感的随机森林农田水肥等级分级算法
龙怡霖
算法
2016
8
260
[摘要]
26
Fisher线性判别式阈值优化方法研究
李艳芳
人工智能与识别
2016
6
141
[摘要]
27
基于在线增量学习的实时人脸跟踪算法
包芳
算法
2016
5
270
[摘要]
28
改进的随机森林算法在乳腺肿瘤诊断中的应用
王平
算法
2016
4
252
[摘要]
29
基于混合特征学习的微博转发预测方法
马晓峰
算法
2016
11
249
[摘要]
30
基于多层核心集凝聚思想的视频关键帧提取
杨臻
多媒体技术应用
2015
9
144
[摘要]
31
基于统计抽样的非均衡分类方法在软件缺陷预测中的应用
徐可欣
算法
2015
8
215
[摘要]
32
一种快速的基于CPMC的协同分割算法
王美华
图像处理与应用
2015
7
216
[摘要]
33
基于模糊加权近似支持向量机的Web文本分类
王平
数据工程
2015
5
54
[摘要]
34
基于类别特征选择与反馈学习随机森林算法的邮件过滤系统研究
孙雪
应用技术与研究
2015
4
67
[摘要]
35
Adaboost算法在图像型火灾探测中的应用研究
廖雨婷
人工智能与识别
2015
4
153
[摘要]
36
基于纹理特征与随机森林的生态声音识别
魏静明
人工智能与识别
2015
3
162
[摘要]
37
小样本条件下基于随机森林和Haar特征的多姿态人脸识别
周致富
人工智能与识别
2015
12
108
[摘要]
38
有向无环图-双支持向量机的多类分类方法
牛犇
人工智能与识别
2015
11
167
[摘要]
39
基于数据挖掘降雨量建模和预测方法研究
李爱武
应用技术与研究
2014
6
55
[摘要]
40
一种改进的基于支持向量机的多类分类方法
赵亮
人工智能与识别
2014
12
233
[摘要]
41
基于聚类集成的用户负荷模式识别
黄剑文
人工智能与识别
2014
12
237
[摘要]
42
结合时-频纹理特征的随机森林分类器应用于鸟声识别
陈莎莎
人工智能与识别
2014
1
154
[摘要]
43
基于随机森林的亚健康状态预测与特征选择方法研究
王小强
算法
2014
1
296
[摘要]