查询结果:   胡洋,李波.基于Fisher准则和多类相关矩阵分析的肿瘤基因特征选择方法[J].计算机应用与软件,2016,33(7):76 - 78.
中文标题
基于Fisher准则和多类相关矩阵分析的肿瘤基因特征选择方法
发表栏目
应用技术与研究
摘要点击数
606
英文标题
A FEATURE SELECTION METHOD FOR TUMOUR GENE BASED ON FISHER CRITERION AND MULTICLASS CORRELATION MATRIX ANALYSIS
作 者
胡洋 李波 Hu Yang Li Bo
作者单位
武汉科技大学计算机科学与技术学院 湖北 武汉 430065 智能信息处理与实时工业系统湖北省重点实验室 湖北 武汉 430065    
英文单位
School of Computer Science and Technology,Wuhan University of Science and Technology,Wuhan 430065,Hubei,China Hubei Key Laboratory of Intelligent Information Processing and Real-time Industrial System,Wuhan 430065,Hubei,China    
关键词
特征选择 Fisher准则 多类相关矩阵分析 SVM
Keywords
Feature selection Fisher criterion Multiclass correlation matrix analysis SVM
基金项目
国家自然科学基金项目(61273303,6127 3225,61373109);中国博士后科学基金项目(20100470613,201104173);湖北省自然科学基金项目(2010CDB03302);湖北省教育厅科研基金项目(Q20121115);模式识别国家重点实验室开放课题(201104212)
作者资料
胡洋,硕士生,主研领域:生物信息学,机器学习。李波,副教授。 。
文章摘要
肿瘤特征基因的选择是肿瘤基因表达数据分类的研究热点之一。针对传统的肿瘤特征基因选择方法无法很好地剔除冗余基因,提出一种混合型的特征选择方法。在所提出的方法中,首先将标签相同的样本划分到同一个矩阵,在所有矩阵中,当且仅当特征间的相关系数均大于特定阈值时,即判定这几个特征是相关特征,并对这些相关的特征进行聚类。然后在每个聚类中选择Fisher比最大的特征,对这些特征根据评价函数筛选得到最优特征子集。最后采用SVM分类器对这些最优特征子集进行类别预测。在四个标准的肿瘤DNA微阵列数据集的测试结果证明所提出的肿瘤基因特征选择方法的稳定性和高效性。
Abstract
The selection of tumour feature gene is one of the hot research topics in classification of gene expression data. In this paper, we propose a hybrid feature selection method aiming at that traditional tumour feature gene selection method cannot well remove the redundant genes. In the method, first we divide the samples with same labels into same matrix, and in all the matrixes, if and only if the correlation coefficients between the features are all greater than the specific threshold, then these features are regarded as the relevant features and will be clustered afterwards. Secondly, we select the features with maximum Fisher ratio from every cluster and sift these features according to evaluation function to obtain the optimal feature subsets. Finally, we use SVM classifier to do class prediction on these optimal feature subsets. The results of tests on four standard tumour DNA microarray datasets prove the stability and efficiency of the proposed method.
下载PDF全文