高维电子病历的数据降维策略与实证研究
2018-01-25分类号:G250
【部门】吉林大学公共卫生学院
【摘要】【目的】以高维的结构化电子病历数据为研究对象,探究数据降维的策略,为电子病历知识发现提供参考。【方法】通过文献调研进行初步约简,再分别利用主成分分析法提取特征根大于1的因子、提取累计贡献率大于85%的因子,利用Logistic回归方法提取有显著差异性的因子进行降维;根据实证研究定性定量评价三种方法提取的属性结果。【结果】三种降维方法分别提取8个、17个和14个属性,经过定性和定量评价发现,利用主成分分析方法提取特征根大于1的因子的降维效果相对较好。【局限】数据样本量有限,未能搜集一定时间跨度的数据进行深入
【关键词】降维 数据挖掘 知识发现 电子病历
【基金】国家自然科学基金面上项目“嵌入式知识服务驱动下的领域多维知识库构建”(项目编号:71573102);; 吉林省教育厅社会科学项目“虚拟健康社区知识发现与实证研究”(项目编号:JJKH20170881SK)的研究成果之一
【所属期刊栏目】数据分析与知识发现
文献传递