基因表达数据聚类分析方法的比较
2014-11-30分类号:Q811.4
【部门】南京农业大学作物遗传与种质创新国家重点实验室 南京农业大学理学院 江苏中烟工业有限责任公司
【摘要】通过生物信息学分析方法,利用广泛使用的基因芯片技术产生的数万个基因表达数据,揭示基因的功能和相互作用。聚类分析是一种主要的生物信息学分析方法,能高效发掘功能一致的基因。针对基因表达谱聚类分析方法较多、应用者选择方法困难的问题,本研究利用3组基因表达谱模拟数据和1组酵母菌基因表达实际数据,通过Caliński-Harabasz指数、灵敏值和分类正确率3个指标,比较了平滑样条聚类、数量性状关联聚类和局部逼近模糊聚类法3种经典方法。结果表明:平滑样条聚类法的Caliński-Harabasz指数平均数最大,灵敏值平均数最小,分类正确率最大,为最优方法;数量性状关联聚类次之,局部逼近模糊聚类最差。这一...
【关键词】聚类分析 Caliński-Harabasz指数 灵敏值 分类正确率 基因表达谱
【基金】中央高校基本科研业务费青年基金项目(KJQN201414); 国家自然科学基金青年基金项目(31301229)
【所属期刊栏目】南京农业大学学报
文献传递