微阵列表达谱监督聚类方法的比较研究
2007-10-10分类号:S188
【部门】扬州大学江苏省遗传生理重点实验室 扬州大学江苏省遗传生理重点实验室 扬州大学江苏省遗传生理重点实验室 扬州 225009 扬州 225009 扬州 225009
【摘要】【目的】比较不同监督聚类方法的优劣及其适用场合。【方法】应用2种高斯混合模型聚类法(GMM)、K-最近邻居法(KNN)、二分类支持向量机器法(SVMs)以及5种多分类支持向量机器法(MC-SVMs),分别对计算机模拟数据以及两组实际微阵列数据进行聚类分析,采用假阳性(FP)、假阴性(FN)、聚类的准确性以及马修斯相关系数(MCC)等指标进行评价。【结果】(1)对成千上万基因表达谱数据,在服从高斯分布条件下,2种GMM法聚类准确性最高,且在训练样本容量较小的情况下,GMM-II法聚类准确性优于GMM-I法。(2)相比较而言,多分类MC-SVMs法稳健性较高,适用性最广,其对高维数据不敏感。不仅适...
【关键词】微阵列 监督聚类 K-最近邻居法 支持向量机器
【基金】国家自然科学基金项目(30370758); 教育部“新世纪优秀人才支持计划”项目
【所属期刊栏目】中国农业科学
文献传递