基于主题模型加强的医疗活动表征学习方法
2018-11-06分类号:TP391.1;TP18
【部门】清华大学软件学院
【摘要】随着健康医疗数据的快速积累,数据驱动的医疗分析越来越受重视,合适的医疗活动表征对这些分析至关重要。然而,当前大多数表征方法缺乏对医疗数据时序性、数值敏感性的考虑,影响了分析方法的效果和可解释性。该文针对住院病例,提出了一种基于主题模型加强的医疗活动表征学习方法,该方法利用活动间时序关系和主题分配情况,构建了一个无监督学习的多层感知机模型。在大规模真实住院数据集上的测试结果表明:该方法所得表征可以有效提升疾病聚类、后续活动预测、剩余住院天数预测3项医疗分析任务的效果,同时表征具有良好的医学可解释性。
【关键词】表征学习 主题模型 多层感知机 医疗分析
【基金】国家自然科学基金资助项目(71690231)
【所属期刊栏目】清华大学学报(自然科学版)
文献传递